コンピュートの未来: Nvidiaの王冠が揺らいでいる

(mohitdagarwal.substack.com)

2 ポイント投稿者 GN⁺ 2025-04-24 | 3件のコメント | WhatsAppで共有

NVIDIAはAIブームとGPU独占によって急成長したが、クラウド大手による独自チップ開発と垂直統合戦略により、長期的な地位が脅かされている
スタートアップや独立系クラウド事業者のGPU需要は減少しており、NVIDIA依存度の高いビジネスモデルの収益性悪化が可視化している
Google、Amazon、Microsoft、Metaなどは、高性能なカスタムチップと垂直統合されたシステムを通じてNVIDIA依存を急速に減らしている
分散インフラとクラスタ接続ベースの最適化がAI学習の中核要素となっており、これはNVIDIAが対応しにくい構造的変化である
NVIDIAはハードウェア・ソフトウェア改善を試みているが、ハイパースケーラーの深い垂直統合戦略に比べると、競争力が弱まる可能性がある

NVIDIAの支配から危機へ: AIコンピューティング市場の激変

NVIDIAはAIブーム、GPU独占、そしてDGXサーバー供給などを通じて急成長し、13か月で時価総額が2兆ドル増加という記録的な成果を上げた
しかし、H100世代が収益性の頂点であり、その後に発売されたB200シリーズは収益性悪化と製造コスト上昇を伴っている
長期的には、ハイパースケーラーが需要を統合し、カスタムチップ開発で競争力を確保することで、NVIDIAの独占構造は揺らいでいる

AI需要の再編とスタートアップ市場の縮小

NVIDIAのデータセンター需要の半分以上は、Google、Microsoft、Amazon、Metaのようなハイパースケーラーから発生している
残りの需要はスタートアップ、VC、中小クラウド企業から発生していたが、GPUの過剰購入でROIが低く、GPUレンタル事業は赤字状態にある
BloombergGPTなどの小規模なカスタムモデルは市場で苦戦しており、クローズドな大規模APIベースのモデルが標準化されている
Coreweave、Lambdaのような独立系クラウドは、NVIDIAの支援にもかかわらず、経済性不足、収益性低下、需要鈍化により危機に直面している
GPUレンタル価格は急落して1時間あたり$1.99、ROEは10%以下となり、持続不可能な水準である

ハイパースケーラーのカスタムチップ開発戦略

Google TPUはすでに第6世代に到達しており、Gemini-Ultra、DeepMind、YouTubeなどのモデルでNVIDIAを完全に代替している
AmazonのTrainiumとInferentiaはAnthropicとの協業を通じて、大規模モデルの推論と学習を代替しており、CUDAなしで動作するNeuron SDKを提供している
MicrosoftのMaiaアクセラレータとCobalt CPUは内部向けAIワークロードに使用されており、TritonベースのSDKによってCUDA代替の可能性を高めている
MetaはMTIAチップを通じてInstagram、WhatsAppのAI機能を独自チップで運用しており、Llama 3.1の一部学習も独自チップ基盤で実行している
こうした流れは推論中心のAI市場構造により適しており、今後GPUベースの推論がカスタムチップ、ひいてはCPUベースのソリューションに押される可能性がある

システム中心構造への転換とNVIDIAの限界

ハイパースケーラーは単一チップ性能よりもシステム全体の最適化に重点を置いている
Googleは小型TPUを大量接続し、独自の光ネットワーク(Apollo)とトーラスネットワークトポロジーを用いて電力と遅延を最小化している
Microsoftは光ファイバーネットワークとColorZトランシーバーを構築し、複数データセンターでの学習可能性を確保するとともに、NVIDIA比で低コスト高性能インフラを確保している
これにより、小規模な複数のデータセンターをネットワークで接続して学習する分散型構造が主流として浮上している
電力制約やインフラ拡張の限界を突破するため、全国規模のデータセンター接続の試みが進められている（例: Microsoftのスリーマイル島再稼働、AWSの原子力発電所買収など）

NVIDIAのハードウェア・ソフトウェア対応と構造的な難しさ

NVIDIAはGB200サーバー、Spectrum-X、DCGM、RASなどで対応を試みている
InfiniBandベースのネットワーク設計は大規模クラスタに弱く、フォールトトレラント設計が不十分である
GoogleのPathways、MicrosoftのSingularityなどは、独自のフォールトトレラントシステム、GPUメモリエラー検出に強みを持つ
KubernetesベースのNVIDIA BaseCommandは、ハイパースケーラーのBorg、MegaScalerなどと比べて拡張性と統合性で劣る
冷却システムでは後発であり、Googleと比べて電力効率・寿命・空間効率のすべてで劣勢である（例: Google PUE 1.1 vs NVIDIA 1.4以上）

結論

NVIDIAは依然として強力なGPU性能を持つが、システム最適化、インフラ統合、コスト効率ではハイパースケーラーに押される構造的限界がある
ハイパースケーラーはすでにチップからインフラ、ソフトウェアまで垂直統合を完成させ、完全な代替可能性を確保している
NVIDIAは過去のGPU中心戦略から脱却し、システム全体の革新なしには、今後のAIコンピューティング市場で持続可能なリーダーシップ維持が難しくなるリスクがある

3件のコメント

kandk 2025-04-24

Google Tensor、Tesla Dojo、AMDのせいでNVIDIA株を買わなかった一人…

kimjoin2 2025-04-24

「ハイパースケーラーのカスタムチップ」の欠点も気になりますね。
まるですべての面でより優れているかのように描写されている気がするので

GN⁺ 2025-04-24

Hacker Newsの意見

Nvidiaが何もしない間に競合が突然成功してNvidiaを脅かす、という前提に基づいたまた別の記事だという意見がある
- Nvidiaに対する悲観論者がいつか正しくなる可能性はあるが、これまでは外れてきたことが多い
Marvellの株価が今年50%以上下落しているにもかかわらず、NvidiaのGPUに対する需要は依然として強い
- クラウドが提供する機能をGPUで置き換えることはできない点を強調している
- Nvidiaが10兆ドル規模の企業になるというJensenのビジョンに同意している
- NvidiaがAIフォン、LLM競合サービス、AI PC、自動運転車、ロボットなどを投入する可能性に言及している
- Warren BuffetがGoogleとAppleに投資しなかったことを後悔したように、今も似たような状況が起きていると見ている
サービスがNvidiaを守るだろうという意見がある
- CUDA、Infiniband、NGC、NVLinkなどでエコシステムを握っており、AI Foundryのような追加アプリケーションを通じて拡張する必要がある
- カスタム設計とGPUプロジェクトのコンサルティングを通じて、市場が減速したときに収益を生み出せる
Nvidiaの戦略的ポジションが過小評価されているという意見がある
- Nvidiaはハードウェア競争で永遠に勝ち続ける必要はなく、AIスタック全体を構築している
- ハードウェア、ネットワーキング、ソフトウェア、モデル、開発者ツールを包括的に提供する唯一の企業である
- Nvidiaは統合プラットフォームを構築しており、これは業界標準になるだろう
AMDがNvidiaと秘密協定を結び、わざとこの状況を作っているという意見がある
- NvidiaはTSMCでAppleと独占的な地位を共有している
Nvidiaは機能的独占の状態から、競争しなければならない状況へ移行しつつある
- 理想的ではないが、致命的な打撃ではない
H100世代が最も高い価格決定力を示しており、代替が乏しいため今後も収益を生み出し続けるだろうという意見がある
- 長期的な持続性には疑問がある
- ハイパースケーラーはAI需要を集約しており、競争力のあるチップ開発を進めている
- 大規模なGPUファームを構築している他社も存在する
NvidiaのGPUドライバの品質管理が低下しているという意見がある
- しかし製品は数年前から売り切れが続いており、品質管理が低いとは言い切れない