6 ポイント 投稿者 GN⁺ 2024-05-08 | 1件のコメント | WhatsAppで共有

代替クラウドプラットフォームの成長

  • 代替クラウドプラットフォームへの需要はかつてないほど増加している
  • CoreWeaveは最近、新たに10億1,000万ドルの資金調達を実施し、企業価値は190億ドルに達した
  • Lambda Labsも5億ドル規模の特定目的ファイナンスを確保し、Voltage ParkはGPUベースのデータセンターに5億ドルを投資している
  • Together AIはSalesforce主導の1億600万ドル規模の投資を受けた

生成AIの需要増加

  • 生成AIブームが続く中、大規模な生成AIモデルを実行・学習させるためのハードウェア需要も増加している
  • GPUは、生成モデルを構成する線形代数方程式を並列処理できる数千のコアを備えており、モデルの学習、ファインチューニング、実行に理想的な選択肢である
  • しかしGPUの導入コストは高く、ほとんどの開発者や組織はクラウドに目を向けている

代替クラウドプラットフォームの利点

  • AWS、Google Cloud、Microsoft Azureなど既存のクラウドコンピューティング企業は、生成AIワークロード向けに最適化されたGPUや特殊ハードウェアインスタンスを提供している
  • しかし一部のモデルやプロジェクトでは、代替クラウドのほうが安価で可用性に優れている場合がある
  • CoreWeaveでNvidia A100 40GBをレンタルする費用は1時間あたり$2.46で、月額では$1,771に相当する。Azureでは同じGPUが1時間あたり$3.40、月額$2,448、Google Cloudでは1時間あたり$3.67、月額$2,642となる

代替クラウドプラットフォームの課題

  • 代替クラウド事業者がGPUを大量に継続してオンライン提供し、競争力のある価格で供給できるかが焦点となる
  • Google、Microsoft、AWSなどの既存事業者が、モデル実行や学習向けのカスタムハードウェアへの投資を拡大する中で、価格競争は難しくなる可能性がある
  • 多くの生成AIワークロードはGPU上で最もうまく動作するが、時間に厳密でない作業ではGPUが必須ではない場合もある
  • 生成AIバブルがはじけた場合、GPUが過剰供給となり、需要が大きく減少するリスクがある

GN⁺の見解

  • GPU需要の急増により、Nvidiaなど主要GPUサプライヤーの影響力はさらに強まる可能性がある。Nvidiaが代替クラウド事業者にGPUの優先供給権を与えたとされており、これはNvidiaの市場支配力を強化する戦略に見える
  • クラウド事業者が大規模GPUクラスターの確保に成功すれば、大型AIプロジェクトの獲得で競争優位を得られる可能性がある。MicrosoftがOpenAIにGPUコンピューティングパワーを供給するため、CoreWeaveと数十億ドル規模の契約を結んだことは代表的な事例である
  • しかし長期的には、Google TPU、MS Azure Maia/Cobalt、AWS TrainiumなどAI特化のカスタムシリコン開発によって、クラウド業界の勢力図が大きく変わる可能性がある。ハイパースケーラーはNvidia依存を下げようとするだろう
  • 代替クラウドは新たな選択肢として浮上したが、セキュリティ、コンプライアンス、マルチクラウド管理の能力を備えた顧客は限られるだろう。依然として既存クラウド事業者の市場支配力は強大である

1件のコメント

 
GN⁺ 2024-05-08
Hacker Newsの意見

要約:

  • AWSのビジネスモデルは、価格設定を分かりにくくして、使ってみるまでコストが分からないようにしているように見える
  • GCPの新しいインスタンスタイプ n4-standard-2 の月額コスト分析によると、vCPUとメモリの費用は月額69ドルと高めで、SSDの価格も高い
  • 今後10年以内に大手クラウドプロバイダーは苦戦すると予想される。planetary-scaleシステムの構築コストは高すぎて複雑すぎるため、正当化が難しい
  • CoreWeave、Azure、Google CloudのNvidia A100 40GB GPUレンタル費用を比較した記事には計算ミスがある。CoreWeaveの月額費用は約30%違っている
  • fly.ioはGPUワークロードに適した代替案として推奨されている。オートスケーリング機能が優れている
  • AWSのビジネスモデルは、初期スタートアップが大企業へ成長する過程で多くの収益を上げることにあるようだ。しかしZIRPの終了とVC資金調達の難化により、爆発的成長のために多額の資金を使えるスタートアップの数は減ると予想される
  • 推論作業向けの代替クラウドGPUの利用経験についての質問が出ている。レイテンシが重要であり、AWSインフラと他所のGPUの間で通信するのは難しい可能性がある
  • CoreWeaveとLambda Labsは、年間契約なしではGPUを借りられない略奪的な価格政策を取っている。sfcomputeのように時間単位のコンピューティングを提供する会社もある
  • 「H100s/A100sを少量確保した」こと自体が、収益性のある技術ビジネスモデルになり得る
  • Crusoe CloudはH100s、A100s、L40sを非常に安価に提供しており、ネットワーク利用料も課さない。FLOPあたりの価格は他の追随を許さない