SkyPilot - あらゆるクラウドで機械学習ジョブを実行するフレームワーク
(github.com/skypilot-org)- 簡単かつコスト効率よく ML Workload を実行
- スポット VM を使ってコストを 3 倍削減。Preemption からの自動リカバリー機能を含む
- アイドル状態のクラスターを自動停止
- ベンチマークを通じて、そのジョブに最適な VM を見つける
- ゾーン/リージョン/クラウドをまたいで最安値を見つけ、自動選択するよう最適化
- AWS、Azure、GCP のどこでもジョブとクラスターを実行
- コード変更なしで GPU、TPU、CPU ワークロードをサポート
まだコメントはありません。