NVBeacon - macOSメニューバーでリモートのNVIDIA GPU状態を見るアプリ
(github.com/jaein4722)AI研究の仕事をしていると、共用GPUサーバーで学習を回すことがよくあります。そのたびに空いているGPUがあるか、学習プロセスが生きているか、utilやmemoryをきちんと使っているかを確認するために毎回ターミナルを開いて nvidia-smi を見る流れがかなり面倒でした。
そこで、macOSのメニューバーからリモートのNVIDIA GPUサーバーの状態をすぐ確認できるアプリを作ってみました。SSHでサーバーに接続して情報を取得し、サーバー側に別途エージェントや追加プログラムをインストールしなくても動作するようにしました。
メニューバーで接続済みサーバーのGPU状態をすぐ確認でき、プロセスごとの情報もあわせて見られます。標準の nvidia-smi だけではすぐには見づらいプロセスUIDも取得し、どのユーザーがどのジョブを回しているのかをもう少し直感的に把握できるようにしました。既存のSSH設定をできるだけ活用し、自分が回しているプロセスを素早く見つけられる点にも気を配りました。
個人的に使うために作ったツールですが、周りの人にも簡単にテストしてもらったところ思ったより反応がよかったので公開してみました。現在はmacOS専用です。
似たような環境でGPUサーバーをよく使う方がいれば、ぜひ一度試してみてください。不便な点や必要な機能があれば、フィードバックをいただけると嬉しいです!
2件のコメント
わあ……本当に便利そうですね
ありがとうございます!
快適に使えるよう、引き続き改善を続けています。