メモリはAIチップ部品コストのほぼ3分の2まで拡大
(epoch.ai)- HBM は、Nvidia、AMD、Google、AmazonのAIチップにおける生産量加重平均ベースで、2024年第1四半期の52%から2025年第4四半期の63%まで上昇
- 同期間に ロジックダイ の比率は約13%でほぼ横ばい、先端パッケージングは19%から15%へ、補助部品は15%から9%へ低下
- 4社の設計企業による HBM支出 は、2024年の約120億ドルから2025年には320億ドルへ増加し、他部品より前年比の伸びが速かった
- AIチップ全体の部品支出は約220億ドルから520億ドルへ増加し、HBMだけで約200億ドルの増加分を占めた
- 2026年にはメモリ供給不足と価格上昇により、コスト圧力 がさらに強まる可能性があり、MicrosoftとMetaも部品価格上昇を設備投資増加の要因として挙げている
主な変化
- 高帯域幅メモリ(HBM) がAIチップ部品支出に占める比率は、2024年第1四半期の52%から2025年第4四半期の63%へ上昇
- この推定値は、Nvidia、AMD、Google、Amazonが設計したAIチップ全体を対象にした 生産量加重平均
- 同期間にロジックダイは約13%水準でほとんど変化せず、先端パッケージングは19%から15%へ、補助部品は15%から9%へ低下
- 4社の設計企業によるHBM支出は、2024年の約120億ドルから2025年の320億ドルへ増加し、他部品より前年比の伸びが速かった
- AIチップ全体の部品支出は2024年の約220億ドルから2025年の約520億ドルへ増え、HBM支出だけで約200億ドルの増加分を占めた
2026年のコスト圧力
- HBMはメモリの供給不足と価格上昇が続くことで、2026年にさらに大きなコスト比率を占める可能性がある
- Microsoftの2026会計年度における1,900億ドルの設備投資見通しには、部品価格上昇分の約250億ドルが含まれる
- Metaは2026年の設備投資レンジを100億ドル引き上げ、その理由として部品価格の上昇を挙げている
計算方法とデータ範囲
- Nvidia、AMD、Google、Amazonが設計した各AIチップについて、メモリ、ロジックダイ、先端パッケージング、補助部品の チップ当たりコスト を推定
- 各チップの部品コストに四半期ごとの推定生産量を掛けてカテゴリ別の総部品支出を算出し、2024年第1四半期から2025年第4四半期までの全体部品支出に対する比率を計算
- 部品コスト推定値は AI Chip Components explorer から取得され、財務開示、サプライヤー資料、アナリストレポートを基にチップ単位の部品構成を組み立てている
- 詳細な方法論は explorer’s methodology documentation で確認可能
部品カテゴリ
-
メモリ
- HBMスタック を含み、HBM3とHBM3eが対象
-
ロジック
- 3〜5nm先端プロセスのロジックダイ を含む
-
パッケージング
- TSMC CoWoSの 先端パッケージング を含む
-
補助部品
- 基板、電力供給、その他の非ロジック・非メモリ入力要素を含む
不確実性の扱い
- HBMスタック価格、ロジックダイ価格、CoWoSパッケージ価格など、各部品の単位コストには コストの不確実性 がある
- 各チップの部品別コストは90%信頼区間でモデリングされる
- 部品比率は当該部品コストを総コストで割った値であるため、分子と分母の両方に不確実性がある
- 2種類のレンジが併記されている
- 当該部品コストのみが変化するレンジ: 当該部品コストが5パーセンタイルまたは95パーセンタイルにあり、他の3部品は中央値の場合の比率
- すべての部品が極端値に変化するレンジ: 当該部品が信頼区間の片側極端値にあり、残りすべての部品が同時に反対側の極端値にある場合の比率
四半期別の部品比率
-
2024年第1四半期
- メモリ比率は 52% で、当該部品コストのみが変化する場合は48〜56%、すべての部品が極端値に変化する場合は42〜62%の範囲
- ロジック比率は 14% で、当該部品コストのみが変化する場合は12〜17%、すべての部品が極端値に変化する場合は10〜20%の範囲
- パッケージング比率は 19% で、当該部品コストのみが変化する場合は14〜24%、すべての部品が極端値に変化する場合は12〜27%の範囲
- 補助部品比率は 15% で、当該部品コストのみが変化する場合は13〜18%、すべての部品が極端値に変化する場合は11〜21%の範囲
-
2025年第4四半期
- メモリ比率は 63% で、当該部品コストのみが変化する場合は60〜67%、すべての部品が極端値に変化する場合は54〜73%の範囲
- ロジック比率は 13% で、当該部品コストのみが変化する場合は10〜16%、すべての部品が極端値に変化する場合は9〜19%の範囲
- パッケージング比率は 15% で、当該部品コストのみが変化する場合は11〜19%、すべての部品が極端値に変化する場合は9〜22%の範囲
- 補助部品比率は 10% で、当該部品コストのみが変化する場合は8〜10%、すべての部品が極端値に変化する場合は7〜12%の範囲
前提と限界
- 部品コストは契約、サプライヤー、時点によって変わり得るため、チップ当たりコスト推定値 には不確実性がある
- 四半期ごとのチップ生産量推定値とチップ種類の構成にも不確実性があり、この不確実性は報告された比率に反映されている
データと探索ツール
- AI chip component cost shares by quarter: CSV、2026年5月21日更新
- AI Chip Components: AIチップ供給網の消費データ探索ツール
1件のコメント
Hacker Newsのコメント
AIの推論と学習には、技術的ブレークスルーがまったくなくても、ハードウェアコストを約3分の1、総コストを約2分の1に下げられる道筋がありそう
DRAM供給が需要に追いつきさえすればよく、製造拡張であれ現在の生産ペースで急増分を埋めるのであれ、必要なのは時間だけ
Sam Altmanが文化的に広めた言説には批判すべき点も多いが、長期的に見ると「今がこれからの中で最悪だ」という言い方は、かなり興味深く過小評価されているポイントだと思う
10年後には、現在レベルのLLMを学習させることは、今データベースを運用するのと同じくらい当たり前の前提になっていそう。現状でもかなり高度だし、ハードウェアの進歩とは別に、より良い強化学習の学習体系を作るだけでもまだ大きな伸びしろがあると思う
Allen InstituteのGitHubやHFプロジェクトはぜひ見てほしい。Common Crawlから最初からLLMを学習させる資料や、qwenの興味深いチューニングなど、オープンソースの学習資料があり、近いうちに午後の個人プロジェクトや教材になるようなものがどんな姿かを垣間見られる
この業界は市場を供給不足の状態に保つ性質があり、そうしないと後から来る供給過剰で企業が傷む。その代わり、モバイルや個人向けコンピューティングのような収益性の低い領域の供給が、より収益性の高い側へ再配置されるだけだろう
IEEE浮動小数点は低ビット幅、とくに16ビット以下では悪名高いほど良くない。positのような形式は16ビットや8ビットでずっと優れている。値1つあたり32ビットではなく16ビットで学習できて、IEEE32からIEEE16へ落とすときより精度損失がずっと小さいなら、かなり意味がある
数年前に96GB RAMを約250ドルで買ったのに、同じRAMが今は1200ドルになっている
Amazonでは今、同じキットが1,048.90ドルになっている
中古のエンタープライズ向けメモリモジュールがeBayで本当に投げ売りだった
今は1枚あたり約22ドルで、合計だと350ドルくらいになる。いったい誰がDDR3で何をしているのか分からない
Optaneのような超高速SSDの価値がずっと大きくなるかもしれない
どの資料を見てもRAM容量は年**20〜25%**程度増える見込みだが、それでは足りないように見える
民生用途でもスマホやノートPCはRAMが2倍になれば大きく良くなるし、AI需要が巨大なのは言うまでもない
この流れが消えるようには思えない。今ほど急速ではなくなるかもしれないが、なくなりもしないだろう。メモリメーカーが自らを破産させたくない理由は分かるが、そのリスクをモデル提供者やエコシステムの他の参加者に移して、RAM容量を年50%近く増やす方法があるべきだと思う
競争市場でRAMメーカーが買い手を残したまま売らないのは非効率だ
10月以前の成長率が実際どれくらいだったのかは分からないが、ここには知っている人がいそうだ
20〜25%成長では足りないという点については、データセンター増設計画が壁にぶつかって大きく鈍化し、AI熱が冷めると仮定すれば、そこまで的外れな数字でもないと思う
短期的には20〜25%では不十分かもしれないが、今年中にAI増設が止まれば、供給不足ではなく巨大な供給過剰が生まれる
DRAM供給業者がそのリスクをヘッジできるようになるからだ
みんなが例えばコンピュータを3分の1の速度で買う量を減らし、全員がHBMに切り替えるほうが得だとしたらどうだろう?
演算性能とメモリの間のギャップは昔から広がり続けており、もしかすると痛みを伴ってでもHBMへ切り替えるのが、まさに必要なことなのかもしれない
メモリ帯域の低い中級コンピュータを3台持つほうがいいのか、それとも統計的には少し待って、全員が面積比で3分の1の速度で新しいコンピュータを買う代わりに、はるかに高い帯域幅を享受するほうがいいのか?
今の流れを見ると、ゲームや機械学習のような民生市場をどう支えるのか本当に気になる
クラウドゲーミングは間違いなく未来には入ってくるだろうし、自分のような原理主義者だけがRTX 5090を買ってオフラインゲームにプレミアムを払うことになりそう
グラフィックスレンダリングに必要なハードウェアコストを複数の消費者に分散して償却でき、使われていない時間を遊ばせず、ゲーム資産と一緒にPOPへ配置するほうが経済的に効率がいいからだ
十分なゲーム計算がエッジで動くようになれば、今は経済的に成り立ちにくい、より技術的に進んだゲームも可能になる。今そうしたゲームが多くないのは、主にクラウドゲーミング市場や採用が不足していて、それに伴う技術的ノウハウも不足しているからだと思う
消費者向けハードウェアで、自分が遊びたいゲームをレンダリングするコストを負担しきれなくなる瞬間が来れば、結局は踏みとどまっていた人たちも説得され、この方式が定着する可能性が高い
価格が少なくとも部分的に正気に戻るまでは、DDR4ビルドから移行しないつもりだ
以前買っておいたDDR4 2133MHzのバックアップメモリ32GBもまだあるし、今は3200MHzを使っている。つまりCPUメーカーにも自分の金は入らないということだ。5800Xは当分十分だし、新しいGPUを買う理由もない。もちろんB580は完璧ではないが
イランがヘリウム供給を止めたという点は非常に皮肉だ
同時にイランは、敵国を揺さぶるためにAIが作った低品質なプロパガンダに依存している。歴史の中で後から明らかになる皮肉の一つのように思える
AIに完全にはまっていないゲーマーやPC趣味層にとっては、本当にひどい時期だ
自分がゲーミングPCを組み始めたころ、最上位グラフィックカードは750ニュージーランドドルだった。今はGPUだけで10,000ドル、さらにRAMで1,000〜2,000ドルかかる
昔はゲーミングPCは手の届く趣味だったのに、今では一般的な航空趣味のほうが代替案に見えるほどだ
短期的には趣味層が圧迫されるのは確かだが、最先端を押し進められる資本はFortune 500企業と比べれば小さい。近いうちに趣味層も恩恵を受けるだろうし、とくに市場が崩壊したらなおさらだ
ハイパースケーラーがなぜもっと垂直統合して自前のファブを建てないのか気になる
ファブ1つが10億ドルだとしても、今はNvidiaや他社からチップを買うのに数千億ドルを使っている
だが、ハイパースケーラーやAI企業がそうしていないという事実は、彼らがAIの将来需要を実際にはどれほど信じているかを多く物語っている
AI企業は途方もない大規模拡張が必要だと主張するが、その拡張に必要な資本リスクは引き受けようとしない
チップメーカーが足を引っ張っているというAI側の悲しい愚痴はよく聞くが、実際にその拡張を容易に資金支援できる金を持っているのは誰なのか? チップメーカーはこのゲームをはるかに長くやってきた。Sam Altmanが7兆ドル規模のファブが必要だと吹聴して回ったとき、AI企業は突飛な主張をする用意があることを示し、信頼を失った
今必要なのは、彼らが積み上げた莫大な現金のごく一部をファブ金融へ直接流し込むことだ
現代の「ロケット科学」のような分野で、金さえあればできるものではない。何十億ドルも失って何の成果も出ない可能性が非常に高い
ここ数年Intelが競争でどれほど苦戦してきたかを見ればいい。彼らは何十年もこの事業をやってきた企業だ
ノウハウがないなら、既存メーカーと競争できるようになるまで追加の実験がさらに必要だ。使い物になるチップを生産できるころには、供給不足は終わっているかもしれない
彼らが統合したがるような事業ではない可能性が高い
しかも、こうした企業のどこも持っていない専門性が必要になる
1週間前に中古のDellサーバーを買った
12コアCPUと32GB DDR4 ECC RAM入りの一式の価格が、DDR RAM 64GBだけを買う価格と同じくらいだった。このばかげた状況が早く終わってほしい。そうでないと痛みが他の市場にも広がるだろう。少し前にPCケースの売上が40%以上崩れたという記事を読んだ
https://www.cnet.com/tech/mobile/smartphone-sales-to-plummet...
「エンタープライズ」部品を作っていたメーカーは消費者向け部品市場には戻らないだろう。その時には市場自体がなくなっているからだ
そして低品質な生成物で金を稼げないデータセンターがあふれれば、それらはSaaS用途へ再利用されるだろう。OnShapeのようなものがあらゆるアプリケーションへ広がるような形で
多くのユーザーは、自分が生成したものすべてをクラウドサービスに保存することをあまり気にしていないように見えるし、これは「高価な」デスクトップやノートPCハードウェアを所有する代替として容易に売れるかもしれない
ハイパースケーラーがより多くのRAMを使い、そのRAMが消費者に供給されないなら、重い処理はすべてクラウドで行われるということだ
なぜハイパースケーラーと消費者が同時にRAMを持たなければならないのか? 消費者はローカルモデルを動かすためにより多くのRAMを欲しがるだろうが、そうするとハイパースケーラーの容量は遊んでしまう
メモリメーカーは知的財産権を山ほど握っている
だから、誰かが余剰のファブ能力を持っていてメモリ製造に参入したくても、巨大な特許の壁と戦わなければならない
ほとんどのメモリ企業は、互いの特許侵害を相殺する裏取引を結んでいる
新規のメモリメーカーがライセンス料に沈まずにどうやって生まれ得るのか、よく分からない