AIは減速している
(wheresyoured.at)- 生成AIインフラは、データセンター投資とコンピュート契約を正当化するために、2030年までに年間2兆ドルを超えるAIコンピュート売上を生み出す必要がある
- 計画されている190GWのデータセンターは、1GWあたり800億〜1,000億ドルのコストを当てはめると9.5兆〜15兆ドル規模となり、これを実現するには年間5,000億〜1兆ドルのデータセンター債務発行が必要になる
- OpenAIは2030年末までに少なくとも8,520億ドルを使い果たすと予想され、Anthropicはコンピュート契約を賄うために2029年に年間1,740億ドルの売上目標を達成しなければならない
- トークン課金への移行後、企業はAI支出の可視性とROI測定に苦しんでおり、Uber・T-Mobile・Brexは従業員ごとのトークン支出上限を設定している
- 現在のAIスタートアップ売上の89%がOpenAIとAnthropicに集中しており、構築中のコンピュート規模を正当化するには、追加で少なくとも年間2,500億ドルのAIコンピュート需要が必要になる
AIは減速する余裕がない — 2030年末までに3兆ドル超の売上が必要
- Sightline Climateのデータをそのまま適用すると、計画中のデータセンター容量は190GWで、Jensen Huangの1GWあたり800億〜1,000億ドルという発言を当てはめると、コストは9.5兆〜15兆ドルと計算される
- Bloombergの「3兆ドルのデータセンター建設」という表現は上の計算と合致せず、必要資金はどこかから調達されなければならない
- Financial Timesの報道では、銀行がデータセンター債務を支えきれない可能性があるとされており、現在年間約2,500億ドル規模の発行額は、実際の建設のためには年間5,000億〜1兆ドルへ増やす必要がある
- NVIDIAは2027年末までに1兆ドルの売上を見込んでおり、売上の54%が3社の顧客から来ているため、今後の売上は少数顧客と取引先の債務調達能力に依存する
- Googleの850億ドルの株式売却と、Metaの数十億ドル規模の株式売却計画は、ハイパースケーラーの債務調達が難しくなっている状況と結びついている
OpenAIとAnthropicのコンピュート契約
- Anthropicのコンピュート・チップ契約は、Google・Amazon・Microsoftの間で3,300億ドル、CoreWeaveと300億ドル、SpaceXと150億ドルに達している
- Anthropicは、このコンピュート費用を賄うために、2029年に年間1,740億ドルの売上目標を達成しなければならない
- Anthropicは2月・4月・5月のラウンドで950億ドルを調達したが、この資金とキャッシュフローだけでは費用を賄えず、翌年には少なくとも2,000億ドルの追加調達が必要になる
- OpenAIは2030年末までに少なくとも8,520億ドルを使い果たすと見込まれ、Microsoft・Amazon・CoreWeave・Cerebras・Oracleにまたがって7,700億ドル超のコンピュート契約を結んでいる
- OpenAIの3月の1,220億ドル調達では費用を賄うには不十分で、年末までに少なくとも2,500億ドルの追加資金が必要になる
データセンター売上の計算とOracleのリスク
- 生成AIとAIコンピュートは、2030年までに年間2兆ドルを超える売上を生み出さなければならず、そうでなければデータセンターの設備投資やAnthropic・OpenAIの契約支払いは成り立たない
- 190GWのデータセンターにPUE 1.35を適用すると、コアIT負荷は約140GWとなり、1MWあたり1,250万ドルの課金基準では年間1.75兆ドルの売上が必要になる
- 計画容量の半分しか建設されなくても、データセンターが資金不足に陥らないためには年間8,750億ドルの売上が必要になる
- OpenAIとAnthropicは2029年にそれぞれ1,840億ドルと1,740億ドルの売上を見込んでおり、合計でも3,580億ドルにとどまる
- OpenAIがOracleのコンピュートを賄えない、または望まない場合、Oracleは資金が枯渇する可能性があり、OracleはOpenAI向けの7.1GWデータセンターに3,400億〜7,000億ドルを投じている
現在のAI支出では足りない
- Salesforceの2026年におけるAnthropicへの3億ドル支出計画は、必要な規模には大きく届かない
- 世界中のすべてのAI企業の現在のコンピュート需要を合計しても1,000億ドルに達せず、2030年にはその10倍が必要になる
- The Informationの報道によれば、OpenAIとAnthropicへのAIスタートアップ売上の集中度は {p:89} のように89%に達している
- Microsoftの年間実行率370億ドルのAI売上は主にOpenAIコンピュートで構成されており、Microsoft AI CEOのMustafa SuleymanはAnthropicのモデルは高すぎるとして、Microsoftでの利用をゼロに減らそうとしている
- AnthropicとOpenAIが年間5,000億ドルのコンピュートを使ったとしても、データセンター建設を正当化するには、追加で年間2,500億ドル超のコンピュート売上が必要になる
トークン課金とROIの不確実性
- 特定のAI作業のコストと投資収益率は測定できず、企業は成果物を測定しないままAI導入を拡大してきた
- AnthropicとOpenAIは2026年1四半期に顧客をトークンベース課金へ移行させ、その2〜3か月後にはAIコストとROIの不確実性が主要ビジネスメディアで繰り返し取り上げられる話題となった
- Wall Street Journalが引用したKPMG調査では、AIコストの可視性は のように、総合的に把握26%、一部把握50%、なしまたは請求後に確認22%に分かれた
- ある企業は支出管理を設けなかったため、1か月でAnthropicモデルに5億ドルを費やし、Uberはわずか1四半期で年間トークン予算を使い切った
- Uberはユーザー1人あたり月1,500ドル、T-Mobileは一時的にユーザー1人あたり月2,000ドル、Brexはエンジニアに週500ドル、非エンジニアに週5ドルという形でAI支出を制限している
コーディングエージェント、ループ、成果物の問題
- Claude Code責任者のBoris Chernyと、OpenAI傘下のOpenClawのエバンジェリストであるPeter Steinbergerは、ユーザーにエージェント用のループ設計を求めている
- ループとは、ユーザーが追加のプロンプトを入れなくても、LLMが望む期間だけ行動を続けられるようにする方式である
- 補助金付きサブスクリプションでは、モデルの誤りにかかるコストは月20ドル・100ドル・200ドルの中に隠れるが、実際のコストをユーザーが負担すると失敗のコストはそのまま表面化する
- LLMは多く推論するほどハルシネーションが増えるという研究とも結びついており、エージェント方式ではLLM自身が計画を立てる
- NotionはAnthropicのサービス障害後、数時間にわたってAnthropicへのアクセスを遮断したほか、AIコーディングツールが作り出したアプリの多くは、役に立たず安全でもないslopwareにとどまっている
巨大な金属のクモという比喩
- 巨大な金属のクモは100万ドルの装置で、1回使うたびに4万ドルの燃料がかかるが、物をつかんだり夕食を作ったりできる
- 同じ装置は、冷蔵庫からDiet Cokeを正確に取り出すこともあれば、冷蔵庫に穴を開けることもあり、ユーザーは結果に関係なく4万ドルを支払わなければならない
- 補助金のおかげで一般ユーザーは破壊的な挙動をたまに経験する程度だが、企業は実際のコストを負担し、製造元は訓練と保守で毎年数十億ドルを失っている
- 新機能は「できる」とされる仕事の幅を広げるが、機能を1つ追加するたびに数億ドルがかかり、実際に新たな学習が行われたのか明確でないこともある
- ある長さの作業を50%完了する能力が高まったとする研究があっても、この比喩のクモはいつ失敗するか分からず、ユーザーが求めていない行動まで行う
AI循環経済と実際の製品需要
- 生成AIはサービス実行コストが高く、主要なAI研究所は収益性への道筋を持たず、LLMベースの作業におけるコストとROIも測定されていない
- AIプロジェクトは運用コストを10%から100%まで増やし得る一方で、AIサービス運営者と顧客の双方にとってコストが下がるという約束に反して、コストは上がり続けてきた
- 高コストは、AI研究所がハイパースケーラーのコンピュートパートナーに資金を送り、その資金が再び研究所とNVIDIA GPU需要へ循環する構造を維持している
- OpenAIやAnthropicが収益性または持続可能性を追求すると、AIコンピュート需要は減少し、Azure・Google Cloud・Amazon Web Services・CoreWeave・Oracle Cloud InfrastructureとNVIDIA GPUの需要も減る
- 現在の契約と見通しに見合うようにするには、AIスタック全体が10倍に拡大する必要があり、追加で年間2,500億ドルのAIコンピュート需要と、OpenAI・Anthropic級の企業が少なくとも2社必要になる
7件のコメント
opus 4.6 -> 4.7、4.8へとアップグレードされるにつれて、性能が体感的に良くなくなったと感じる方はいらっしゃいますか?
クソみたいになったようです……
そうですよね?? 急に、うまくできていたことができなくなっていましたよね.........
APIはトークンベース課金ではなかったことは一度もないのに……
本文で言っているのは、Anthropicが最近Enterprise料金プランをサブスクリプション制から従量課金制に変更したことを指しているようですね。サブスクリプション制と比べて従量課金制はトークン当たりのコストが最大で約10倍高く、Anthropicは個人向けサブスクリプション料金プランを客寄せ商品として販売して開発者をロックインし、企業にEnterpriseの高額な従量課金料金を支払わせる戦略を取っているのでしょう。
企業側としては、トークンベース課金のコストがあまりにも高いため、ROIが不透明になるという意味ですね。
ようやく文脈が少し理解できました。サブスクリプションはCodexだけを使っていて、AnthropicモデルはBedrockでしか使っていなかったので……ありがとうございます。
Hacker Newsの意見
今日Appleが刷新したAI機能を発表したが、各種報道によればAppleはGoogleに年間10億ドル程度を払うだけで運用している計算になる
実質的には知的財産権をライセンスする程度で、Googleは自社モデルを運用・蒸留する権利をその程度の金額で渡しても構わないと考えているようだ
消費者向け売上が全体像の一部にすぎないとしても、MacやiPhoneのユーザーがAppleの新しいAIで満たされずにChatGPTへ課金する必要がどこにあるのか疑問だ
Googleもスマホに同様のツールを載せ、検索にも引き続きAI機能を提供するはずで、Appleの技術が存在した後に消費者向けAIがAnthropicやOpenAIにとって年間10億ドルをはるかに超える価値があるという証拠がどこにあるのか分からない
OpenAIがSamsungスマホに入る契約を結び、SamsungがAppleより10倍切迫しているとしても年間100億ドル程度で、OpenAIの2026年の消費者向け売上見通しが140〜150億ドルなら、それを達成できたとしてもiPhoneユーザーに役立つ組み込み機能が登場した後は維持が難しそうだ
Ed Zitronは騒がしい英国流の扇動家に近いが、概ね正しいことを言っているように思う
WindowsにはCopilotボタンまで付いたのに人々はGPTを使い、Microsoft EdgeがWindowsで最も人気のあるブラウザではなく、Instagram ThreadsがTikTokに大きな打撃を与えられなかったのも同じ文脈だ
問いの向きが逆だ。人は好きなものを使い、それを使い続けようとする強い選好を持っている
とてつもない堀が必須なのではなく、ユーザーが製品に不満を持ち続けたり、人々が口にするはるかに良い競合製品があるときに問題が起きる
Appleの機能が単にGPTを使うより意味のある利点を与えられないなら、奇跡は期待しにくい
残る疑問は、検索のためにKagiを使い続けるのか、それとも新しいSiriが全体として必要なところまで連れて行ってくれるのかという点だ。実際に検索結果をどれくらい頻繁に見ているのか、AI要約だけを見ているのかをもっと意識してみる必要がありそうだ
Appleの発表で見なかった部分もある。たとえば基本的なコーディングについて、XcodeのLLM、Shortcutsアプリ、Safari Extensionsには触れていたが、私はKagiで受け取ったデータを表示するWebページを今しがた作らせたし、Geminiでも可能だった
Siriにもできるのかはまだ分からず、体験も重要だ。ChatGPTはライブエディタのあるコーディングインターフェースでコード作成の過程をはるかにうまく扱う一方、Kagiは数年前のChatGPTのようにコードブロックを丸ごと吐き出し、修正のたびに新しいコードダンプを出してくる感じだ
Xcodeに行くのはやりすぎで、Siriでは足りないかもしれず、Appleが埋められないプロシューマー向けAI利用の隙間が残る可能性がある
Anthropicは消費者向けAIをそれほど重視していないようで、消費者層は最も収益性の低い顧客である可能性が高い
Appleは一般消費者のAI利用を増やす側により近いように思え、InstagramがStoriesを追加したのに似ている。Snapchatの成長は止めたが、OpenAIのユーザーまで大きく奪うと断言するのは慎重であるべきだ
今ChatGPTに課金しているなら、趣味のコーディング、プロジェクト、画像生成に使っている可能性が高く、多く払っているユーザーはほぼ確実に個人のプログラミングプロジェクトに使っているはずだ
月額100ドル超の契約者はこのために離脱しないだろうし、月額20ドルのユーザーも有意に流出するとは非常に考えにくい
世界の大半のユーザーはCPUが弱くRAMも少ない低価格スマホを使っているため、実用的なモデルをローカルで動かせない
GoogleとAppleの契約で、Googleがその10億ドルにクラウド計算へのアクセス権まで含めて売っているのか、それとも重みと知的財産権だけを共有しているのかははっきりしない
Appleも利用制限と、より多く使うためのサブスクリプションアップグレードがあると言っていたので、AI研究所と直接競争する戦線ができたことになる。デフォルトがあってもSafariとChromeのように成功した競合があるのだから、この競争も成立しうる
Googleは、現金を多く持つ主要競合が基盤モデル学習の軍拡競争に入る経済的誘因をなくすために、実際の価値より割安にモデルを提供する可能性も高い
要約や文体修正以上の本格的な機能を求めるユーザーは、たまにしか使わなくても、より高品質なモデルの手ごろなサブスクリプションや広告ベースの料金プランに価値を見いだせるかもしれない
Appleもこれを提供できるかもしれないが、機能を比較し始めると、多くの人にとってはGemini、Claude、ChatGPTのほうが適している可能性がある
またAppleが今回も過大に約束し、実際の発売モデルの品質が低く、ユーザーをサブスクリプションサービス側へさらに押しやるリスクも現実的にある
私生活、関心事、計画、事業、家族情報まで含まれており、別のAIアプリに移ると最初からやり直さなければならないので、かなりつらい
いかさま扇動家を見分ける匂いのひとつは、「なんでみんなこれが理解できないんだ?」という調子で激高して語るのに、実際には論理がつながっていないこと。
Zitron の主張が本人の言うように堅固なら、読者が理解できて、それが堅固だと分かるはず。
AI需要の統計から始めて、AI企業の収益性に必要な売上といった次の段階へ慎重に計算をつなげていけば追えるはずだが、彼は飛んで、跳ねて、また戻ってくる。
状況が本当に「なんで分からないんだ」レベルで明白なら、説明も明快であるべきだが、そうなっていない。明快でない理由は、状況そのものがそこまで明白ではないからだ。
彼のメッセージは大づかみに言えば、テック業界が深く道徳的に腐敗しているということだ。激高せずに語るのは難しいだろうが、根拠のない誇張というより、「Meta が人々にひどいことをしている会社だという圧倒的な証拠があるのに、なぜまだ投資したり働いたりするのか」という不信に近く読める。
それでも私の理解では、彼の考えは、AI企業が X だけの計算資源の購入を約束し、その需要を満たすためにデータセンターが建設されていて、データセンターは Y を回収しなければならないのに、AI企業には Y を支払えるだけの十分な売上がない、という構図だ。
個人的には驚きではない。私が見た AI の実用用途は、コード生成や自動営業・詐欺電話くらいで、今動いている巨額の金を支えられるほど大きな市場には見えない。
Ed がなぜそんなに大きく外していると見られているのか気になる。私には AI 全体に大きな調整が近づいているように見える。
そういう情報は、定期ブログ記事ごとに毎回繰り返して載せると期待するようなものではない。
皮肉っぽい言い方ではあるが、実際にクリックしたのなら答えが本当に気になる。
現代的な暴露ジャーナリズムを真似た拙い試みで、気が利いているように見せたいのだろうが、substance が乏しい。
もう何度も出ている話だが、Ed Zitron は信頼しにくい人物だ。
私から見ると、かなり明白で些細なことですら偏っていたり間違っていたりすることが多く、数字やトレンドが入った複雑な分析をそのまま受け入れにくい。
たとえば数か月前、エージェントやエージェント型コーディングを語る人たちを嘲笑していたツイートを覚えている。「エージェント? 何のエージェント? 自分たちが何を言っているのか分かってるのか?」といった調子で、返信欄には実際にエージェントを使っているという何百人もの説明が付いていた。
彼にはオーディエンスとエンゲージメント目標があり、目的は知らせることではなくクリックを得ることだ。
方向性は合っているのかもしれない。たとえば支出に見合うために必要な売上がばかげて高く見える、といった意味では合っているかもしれないが、現実と必ずしも一致しない最悪のシナリオを作るために数字をつぎはぎしているように見える。
そこに、AI と少しでも関係するものに対して開かれた態度をまったく見せない点まで加わり、真剣に受け止めにくい。
出版メディアは破滅的で陰鬱な長広舌を好むし、そのため彼はヒステリックな反AI記事で経歴を築いたように見える。だからといって正しいという意味ではない。
記事で最も説得力がある部分は、数字だけを見ても必要な投資規模が純粋にドルベースで持続不可能に見える点だ。
著者に同意しなくても筋道は追える。OpenAI、SpaceX、Anthropic は資金切れを避けるには今年上場しなければならず、もはや十分なプライベート資金はない。IPO が最後の資金調達ラウンドだ。
AI は非常に有用で変革的であり得るし、企業が急成長することもあり得るが、その成長を支える金がないのかもしれない。
倒産した AI 企業が Oracle 契約を解約したというくだりは、Oracle を Nortel のような比喩に感じさせた。顧客の大きな塊が突然抜ければ、数千億ドル単位の減損が必要になるかもしれない。
AI 支配者たちには深い懐疑を抱いているが、何もないとひたすら言い張るのは誠実ではない。
Zitronはもはや崩壊を懇願しているようなレベルだ
マクロ分析で巨大な金融リスクを指摘したのは確かだが、絶え間ない悲観論のせいで、HNの多くの人が日々実感している莫大な生産性向上という現場での有用性を完全に見落としている
今は、この個人能力の拡張が大きな発見につながる中間地帯があると信じてみたい
それならその生産性は一体どこに行っているのか、価値はどこにあるのか、大規模な失業統計や大金を稼ぐ何百万もの新規スタートアップはどこにあるのか分からない
過熱した誇大宣伝サイクルではバランスの取れた批判が必要なので、反対の声それ自体には価値があるが、彼の主張は前提に同意したとしても堅固ではない
彼の概算で最大の不満は、推論の粗利益率を一般的なSaaSのマージンと比較できない新しいものとして扱っている点だ
部分的には正しい。モデル学習、関連インフラの構築、競争力を維持するための周辺コストという終わりのない研究開発の回転木馬が、分析をいくらか変えてはいる
だが、これを構造的に一般的なSaaSマージンと異なると言うのは行き過ぎだ。事業モデルはDropboxのようではないが、初期のAWS、CDN、通信事業者とはかなり似ている
通信分野は、私のキャリアの半分以上をエンジニア兼創業者として過ごした領域なので言えるが、稼働率、オーバーサブスクリプション、ピーク容量計画、セグメンテーション、設備投資回収に収益性がかかる、極めて資本集約的なインフラ事業も成り立つ
コスト削減のための明示的なタスクの細分化が現れてきたことで、彼の計算はさらに疑わしくなる。先行する組織は、すべてのタスクに最良で最も高価なモデルを使う必要はないと気づいている
簡単なタスクは安いモデルにルーティングし、キャッシュを使い、急がないタスクはバッチ処理し、最前線のモデルは本当に最前線の知能が必要な一部のタスクにだけ残しておける。これは、供給側が現在の需要と稼働率、価格曲線を維持するには常に最前線の知能を追求しなければならないという主張と真っ向から衝突する
生産性向上を実感していても実際の価値は生まれていない可能性があり、最も堅牢なデータが示しているのはまさにそれだと思う
https://unessays.substack.com/p/talk-is-cheap
大規模な査読付き研究やメタ研究でその主張を確認しているものはあるのか?
自分の分析の目立つ失敗を振り返ったことがないという事実だけでも、知的誠実さについて必要なことは語っている
金融リスクに関する彼の話の一部には真実もあるが、上振れの可能性も認められなければ、リスクを正しく評価することはできない
だから彼を真剣に受け止めるのは難しい
このスレッドには一蹴するコメントが多いが、記事の実質的な内容を扱っているものはまれだ
「AIは減速する余裕がない — 存続を維持するには2030年末までに3兆ドル以上の売上が必要だ」が事実かどうかが核心だ
2024年の総賃金が11.7兆ドルで[0]、同年の非農業雇用が158,000だったなら[1]、AIが損益分岐点に達するには少なくとも20人に1人分の仕事を奪うか生み出す必要があるという私の概算よりさらに一桁大きい
[0] https://fred.stlouisfed.org/series/BA06RC1A027NBEA
[1] https://fred.stlouisfed.org/series/PAYEMS
2008年と2020〜2023年に膨大な資金が経済に流れ込み、金持ちはばかげたほど豊かになった。その富が今や2020年代版の鉄道/光ファイバーに縛りつけられていて、私たちは実質的に世界経済から数兆ドルを消してリセットしようとしているわけだ
リセットは必要ではある
この記事を読むのに20分使う前に、この筆者が2年以上にわたって、AIは失敗していて、金の無駄で、悪くて、絶対に機能しないといった類いの、人気はあるが一貫して外れた見解を投稿してきたことを知っておくべきだ
たとえば2024年3月のhttps://www.wheresyoured.at/peakai/のような記事がある
2年間は明らかに狂人のように見え、株式市場の大幅上昇を逃したが、結局は当たった。もちろん、その後テック株はゆっくり回復した
こういうことのタイミングを予測するのは悪名高く難しく、2年前にタイミングを外したからといって調整がないことにはならない
Edは温度計としては少し面白いが、彼の書くものを真剣に受け取るのは難しいと感じる
Tim Leeも、Edが分析の詳細の一部を投稿したとき、かなり妙な点があったと指摘していた: https://x.com/binarybits/status/2034377838883700953
ニュースレター登録のポップアップが出た瞬間にすぐタブを閉じる
Edは興味深い人物だと思う。
AI業界に対する彼の金融分析は論理的には筋が通っているが、私にはそれが実際に正しいか判断できるほどの知識はない。
ただ、彼はAI全般に対してあまりにも腹を立てていて、LLMが実際に最先端水準を変えつつある明白な領域を見落としているように見える。
Simon Willisonが最近指摘したように、コーディングはLLMの中核的なユースケースの一つに見えるし、それが唯一の本物のユースケースだとしても、ものすごく有用だ。
有用性と収益性は別物で、その点でEdは重要な指摘をしていると思う。推論がずっと安くなるまでは、これらの企業は利益を出せないし、一部の超巨大プレイヤーはAPIトークンの価格を払うだろうが、大半はそうしないだろう。
AI企業が生き残るために数十億ドルの売上が必要なら、その売上の0.5%、5%、50%のどれが最先端を変えることから生まれるかは、100%どうでもいい。
重要なのは変革の有無ではなく、これらの企業には請求書を支払うだけの収入がないだろうという点であり、彼らが払えないなら他の多くの企業も払えない。
だから変革があろうとなかろうと、依然として崩壊を待つ砂上の楼閣だ。これを変えるには、さらなる「変革」ではなく、現在のユーザーベースを数倍に増やすか、料金を数倍に引き上げられるような機能の束が必要だ。
ある意味ではかなり新鮮だ。多くの人はAIのあれこれを批判しつつも、最後に「それでも実はAIは本当に好きで毎日使っている」という免責条項を付けがちだ。
おそらく、実務的なビルダーたちがコメント欄に押し寄せて冷静にニュアンスを届ける状況、今どきの言い方をすれば肩にチップを乗せた怒れるキーボード戦士たちに群がられる状況を避けたいのだろうし、そういうどっちつかずをかき分けて読むのはうんざりする。
Zitronに対してはそういう批判をしにくい。何を言おうと、彼はどちらかの肩を持っているように見えることを恐れていない。
この三つは完全に別の立場だ。AIが非常に有用だと思いつつ、自分の社会的地位を下げうるから嫌うこともできるし、技術は好きでもSam Altmanは不誠実だと思うこともできる。
ところが多くの反AI論者は、なぜかこの三つの主張を全部提示しなければならないと感じているように見える。
さらに滑稽なのは、本当に役に立たないなら気にする必要すらないという点だ。市場がいずれ役立たなさを見抜き、すべてが正常に戻り、嫌っている人たちは金を失うだろう。
もちろん、彼らが本当に役に立たないと信じているとは思わない。私は、彼らはそれが自分の威信にどんな影響を与えるかを心配していて、いつか皆が「目を覚まして」LLMは有用性のない確率的オウムにすぎないという信念を共有してくれることを切望しているのに近いと思う。だが人々は毎日使っているし、改善していく様子をリアルタイムで見ている。
彼の主張は、これらの企業が利益を出すには2022年以前には前例のなかった非常に大きなことが起きなければならない、というものだ。概ね同意するが、私はそうしたことはすでに何年も起き続けているので、今後も起きるだろうと思う。
推論が高コストだと信じる根拠は、雰囲気以外にまったくない。データと直感の両方から見て、マージンは高い。
この考え方は、人々がよく分かってもいないのに「AIは収益性がなく、高すぎる」という言葉を、巨大な進歩に対処するためのカタルシスのように使っているという私の考えを強める。
Zitronは予測を当てる仕事ではなく、コンテンツ制作をする事業者だ。
彼のような人たちが何度「終わりが来た」と言おうと関係なく、一度だけ当たればいい。
ただ、現時点では経済性について確かに当たっている部分がある。この巨大な投資をどう回収するのか、その道筋はまだない。
私の見るところ、AIは世界を急進的に変えるだろう。
悪くなるかもしれないし、良くなるかもしれないし、その両方が混ざるかもしれないが、そのこと自体は疑っていない。
LLMという跳躍が始まってまだたった5〜6年だ。参考までに、電波は1886年に発見され、Marconiは1895年に通信に利用した。電話とラジオは数十年にわたって共存したが、携帯電話と無線技術が本格的に拡大したのは1995年だった。
それに長い時間がかかった理由は、電波物理学が成熟する時間を必要としたからではなく、それで利益を出すために必要な他のあらゆるものに時間が必要だったからだ。
私にとってLLMはAIというより、ビルディングブロックに近い。電波やトランジスタに相当するものかもしれない。
すでにLLMをつないでエージェントにできることは分かっている。現時点では価格がコーディングとエージェントに対する厳しい制約要因になっている。
Claude CodeやCodexだけを望むならまあ何とかなるが、ほとんどの人が実験する気になれないようなLLMの組み合わせが多い。たとえばゲームでNPCの会話や世界のメカニズムをLLMで動かすのは、コストのせいでまだ仕事として成り立たない。
推論ハードウェアの価格が下がり、推論アルゴリズムが改善され続けるなら、私たちは今日では想像しにくいものを見ることになると確信しているし、同時にそれを恐れてもいる。
コストは問題ではない。文脈的に一貫した応答とシナリオは数が限られているので、ゲーム内でリアルタイムにLLMがテキストを生成する必要はない。
その代わり、LLMで会話メッセージ、断片、手がかりのような「原子」の巨大なコーパスを作り、プレイヤー入力に応じて決定論的につなぎ合わせればよい。実装前に事前レビューやさまざまなテストも可能だ。
ゲームで相互作用するプレイヤーにとって、このようなシステムは設計された相互作用の範囲内では生成テキストと機能的に見分けがつかないだろう。
利点も大きい。プレイヤーがロールプレイを壊して意図的に突いてくれば継ぎ目が見えることはあるが、LLMのように悪用されることはない。
何かがより良くも悪くも、あるいはその両方にもなりうると疑うとは、なんと鋭い洞察なのだろう。
「私たちはまだ早すぎる」というのも妙だ。すでに何本ものSuper Bowl広告が打たれ、テックニュースを事実上支配している企業が、CEOのばかげた発言を記者にそのまま反復させ、企業価値が1兆ドルを超えると言っても、その財務に反論する権限のある人たちは同意するばかりのように見える。
数百エーカー規模のデータセンターを建設し、実現しないデータセンター契約まで結び、毎月何十億ドルも要求している。
シリコンを食い尽くし、人々はハードウェア価格が2倍、3倍以上に跳ね上がるのを実際に目にしている。
職場は従業員にAI利用を強制したものの、補助金が消えコストが明らかになると面白くなくなって後退した。
それでもなお、もっと多くの時間、もっと多くの注目、もっと多くの人が見るべきだと言う。電波の歴史でこんなことがあったとは思えない。
シミュレーションは退屈だ。
Edが「AIは減速している」と見る根拠は、企業の支出上限、とりわけUberのエンジニア1人あたりツールごとに月1,500ドルという制限だ。
私は同じ証拠を正反対に解釈する。1年前なら、会社がAIツールに従業員1人あたり月1,500ドルを使うなどという発想はばかげており、いったいAIで何をしたらそんな金額になるのかと思っただろう。
ところがコーディングエージェントや、ますます汎用化するエージェントが登場すると、従業員の需要が高すぎて企業が制限を設けなければならない状況になった。
これらのAI企業の総潜在市場が知識労働者1人あたり月1,500ドルに跳ね上がったのに、これのどこが減速なのか分からない。
しかし投資収益率を満たすには、その程度かそれ以上を世界全体で使わなければならず、長期的にそんな予算が承認されるはずがない。
企業はコスト削減が好きで、従業員を好きなだけ減らすのと同じように、同じ価値やより良い価値を提供する別の道があると判断した瞬間に、そうした予算もすぐに消えるだろう。
あるいは単に、株主の短期的価値要求のために消えるかもしれない。
つまりClaude CodeとCursorだけでも簡単に月3,000ドルになり、さらにCodexまで選択肢に入るなら4,500ドルになりうる。
そして、あなたがブログに書いたように、正当化できれば超えられるソフトキャップでもある。