2 ポイント 投稿者 GN⁺ 5 시간 전 | 4件のコメント | WhatsAppで共有
  • OpenAI、Anthropic、Google などは企業に実際の提供コストより低いサブスクリプション価格を提示しており、価格調整時に大きなコストショックを生む可能性がある
  • Claude Pro・ChatGPT Plus の月額20ドル定額制では、ヘビーユーザーの実際の API 換算コストが1席あたり月 200〜400ドルまで膨らむ可能性がある
  • エージェント型AIは長時間の自律実行によってトークン消費を大きく増やし、GitHub Copilot も 2026年6月に従量課金へ移行する
  • 50人チームの月 1,000ドルのサブスクリプション費用が、実際のトークン基準では月15,000〜40,000ドルになり得るため、予算上のエクスポージャーが大きい
  • OpenAI と Anthropic の IPO 準備はマージンとユニットエコノミクスへの圧力を強め、値上げ・利用制限・消費ベース課金への移行を早める可能性がある

AIサブスクリプション価格と実際のコストの乖離

  • OpenAI、Anthropic、Google など主要な AI 提供企業は、企業顧客に実際の提供コストより低いサブスクリプション価格でサービスを提供しており、企業がこの価格を恒久的な基準と見なして業務フローを構築すると、将来の価格調整時に大きなコストショックを受ける可能性がある
  • Claude Pro は月20ドルで Sonnet 4.6、Opus 4.6、ウェブ検索、コード実行、ファイル生成、無料ティア比で約5倍の利用量を提供する
  • API 基準では Sonnet 4.6 は入力 100万トークンあたり3ドル、出力 100万トークンあたり15ドルで、Opus 4.6 は入力 100万トークンあたり5ドル、出力 100万トークンあたり25ドルである
  • ナレッジワーカーが Claude を毎日数時間使い、文書アップロード、レポート作成、データ分析を行うと、週あたり数百万トークンを消費する可能性があり、API 料金に換算すると1席あたり月200〜400ドル水準まで上がり得る
  • Microsoft は GitHub Copilot でユーザー1人あたり月20ドル以上の損失を出しており、ヘビーユーザーの月10ドルのサブスクリプションのコンピュートコストが80ドルに達したと報じられている
  • Anthropic のユーザーがサブスクリプション売上1ドルあたり8ドル超のコンピュートを消費していたという分析もあり、OpenAI の製品担当 VP である Nick Turley は、サブスクリプション価格は偶然定着した構造だと表現し、無制限プランの段階的廃止の可能性を電力の使い放題にたとえて語っている
  • ChatGPT Plus は3年間月20ドルを維持してきたが、その間に画像生成、コード解析、音声モード、エージェント型推論、ウェブ検索などの機能が増えた

主要提供企業に共通する価格戦略

  • Google はGemini Advancedを月20ドルの Google One AI Premium にバンドルして提供する一方、同じモデルへの API アクセスには別料金を課している
  • Meta は Llama を無料で提供し、自社プラットフォームで発生する数億件の AI クエリのコンピュートコストを広告収入で補助している
  • xAI の Grok は API 入力価格を 100万トークンあたり0.20ドル と低く設定しており、市場シェア確保のために損失を受け入れる構造として扱われている
  • 共通するパターンは、経済性より導入拡大に合わせて価格を設定し、組織を囲い込み、AI を各チームの日常業務における中核的な依存要素にしたうえで、コスト問題を後回しにするやり方である
  • OpenAI は消費者向けサブスクリプションで損失を出しており、ユニットエコノミクスが比較的ましなエンタープライズにより注力する戦略転換を検討していると報じられている
  • The Wall Street Journal によれば、OpenAI は IPO に向かう過程で 主要な売上目標とユーザー目標を逃しており、補助金ベースの価格体系にもひびが入りつつある

エージェント型AIがコスト構造を悪化させる

  • チャットボット利用では質問と回答が比較的予測可能なトークン消費を生んでいたが、エージェント型AIは長時間の自律実行によってトークン使用量を大きく増やす
  • Claude Code セッションは長時間にわたって自律的に実行され、対話型利用よりはるかに高い速度でトークンを消費する
  • 一部ユーザーは 5時間のレート制限枠を90分で使い切った と報告している
  • GitHub は、定額モデルがエージェント型ワークロードで崩壊したため、Copilot を 2026年6月1日から従量課金へ移行すると発表した
  • GitHub は、Copilot が大きく進化し、エージェント型の利用が "デフォルトになりつつある"ため、これによってコンピュートと推論の要求量が増大すると説明している
  • Sam Altman は OpenAI が今やAI推論企業にならなければならないと公に述べており、これはエージェント型利用には根本的に異なる経済モデルが必要だという文脈とつながっている
  • エンジニアリングチームで複数の AI インスタンスが1つのプロジェクトを並列処理するAgent Teamsはコスト消費を大きく増やし、開発者が3〜4個のコーディングエージェントを同時に走らせると、単純な会話と比べてトークン使用量は数倍どころか一桁以上増える可能性がある

企業が測定していないコストエクスポージャー

  • この2年間で多くの企業が AI サブスクリプションを業務の深部に統合しており、マーケティングは ChatGPT Plus でコピーを作成し、エンジニアリングは Claude Pro でコード作成とレビューを行い、リサーチ・カスタマーサクセス・財務チームも文書要約、チケット要約、シナリオモデリングに AI を使っている
  • 50人が Claude Pro を使えば現在のコストは月1,000ドルで、ChatGPT Plus も同水準のため、AI は損益計算書上では小さな項目のように見える
  • 同じチームの実際の API 利用量をトークン消費基準で計算すると、利用強度に応じて月15,000〜40,000ドルとなり得て、別個の予算コードが必要な費用項目へと変わる
  • 価格が調整されれば、月20ドルの AI を恒久的に安価な投入資源だと見ていた企業は、すでに業務フローに深く組み込まれて除去しづらい時点で、予算外の請求書を受け取ることになる
  • 補助金は依存を生み、依存は値上げを避けにくくする企業の罠となる
  • KPMG の Q1 2026 AI Quarterly Pulse は、米国の組織が今後12か月の AI 支出を平均2億700万ドルと見込んでおり、前年同期比でほぼ倍増したと集計している
  • Goldman Sachs の調査アンケートによれば、多くの大企業がすでに AI 予算を複数桁規模で超過しており、AI 支出は近い将来にエンジニアの給与総額に匹敵する可能性がある
  • KPMG North America の AI・データラボ責任者 Swami Chandrasekaran は Marketplace に対し、ほんの1〜2四半期前までは誰も LLM 消費コストを気にしていなかったと述べている
  • University of Chicago の経済学者 Brian Jabarian は企業の AI 移行を助言する中で、請求書が届く時が近づいていると語っている

IPOが価格再調整を強いる可能性

  • OpenAI と Anthropic は IPO を準備しており、その過程でサブスクリプション価格と実際のコストのギャップを縮めるよう求める圧力が強まる可能性がある
  • Anthropic は年換算売上高が 300億ドルを超え、2025年末の90億ドルから増加したと報じられている
  • OpenAI は約250億ドルの売上ランレートにあるとされる
  • OpenAI は 2029年までに 累積キャッシュ消費1,150億ドル を見込み、2030年までに コンピュート支出6,650億ドル を約束したと示されている
  • Oracle は OpenAI 向けデータセンター構築のため、ある会計年度に 430億ドルの負債 を引き受けたとされる
  • 非公開企業としてベンチャー資本を燃やしている間は、推論コストを補助し、赤字でモデルを運用し、提供コストが100ドル超の月20ドルプラン を維持できる
  • IPO 後は、公開市場がマージンを、アナリストがユニットエコノミクスを、投資家が無限の資金調達に頼らない収益化への道筋を要求することになる
  • 価格ギャップを素早く縮める方法は、値上げ、利用制限、消費ベース課金への転換であり、その3つすべてが現在の企業向けサブスクリプション利用者に大きな影響を及ぼし得る

すでに現れている価格再調整のシグナル

  • GitHub は 2026年6月1日に従量課金 へ移行し、定額のプレミアムリクエストをトークンベースのAI Creditsに置き換える
  • Microsoft は 4年間で Microsoft 365 の価格を2回引き上げ、直近の値上げは AI インフラコストと直接結びついている
  • OpenAI はヘビーユーザー向けの新たな実勢価格として100ドルの Pro ティアを導入した
  • Anthropic の 月200ドルの Max ティア は、補助金が終わったときに確定的な利用量が実際にどの程度のコストになり得るかを示す例である
  • Conga の VP である Geoff Webb は、AI市場の先行獲得競争 の規模は巨大で、それを支配するためのコストも巨大であるため、サービスの収益化と投資回収の過程でビジネスモデルとサービス価格の大きな変化が急速に起こる可能性が高いと述べている

企業リーダーが今やるべきこと

  • 企業は席数を数えるだけでなく、チームごとの実際のトークン消費量を監査すべきである
  • 現在価格に対して2倍、5倍、10倍のコストシナリオで AI コストがどう変化するかをモデル化すべきである
  • 単一ベンダーの価格変更で予算が突然崩れないよう、スタック内にベンダー選択肢を作るべきである
  • CFO が先に問題提起する前に、AI コストのギャップを CFO と議論すべきである
  • 現在組織が AI に支払っている金額と、18か月後に支払う金額の差は、多くの企業が吸収しなければならない最大級のコスト項目増加の1つになり得る
  • 以前はチームのランチ代より安かったツールが、突然年間6桁の予算を必要とする状況を説明しなければならない企業が出てくる可能性がある
  • 補助金の時代は終わりに向かっており、多くの企業はまだこの議論を始めていない

4件のコメント

 
hmmhmmhm 2 시간 전

メインフレームのときと同じ問題のようですが..
サーバーは高価でリソースが不足しており、個人のコンピューターは遅いという構図ができているなら
結局はサーバーも安くなり、個人のコンピューターの性能も上がっていくので…時間が解決する気がします。

 
master6559 3 시간 전

高ければ使わなければいい..

 
aer0700 2 시간 전

高くても使うだろうと見込んで、LLMプロバイダーが値上げしているのでしょう。GLM、Qwen、DeepSeekのようなオープンソースLLMが今後どうなっていくのか気になります。人々はこの価格を払ってフロンティアモデルを使うべきなのか、それとも自前でvLLMインフラを実装する手間をかけてでもオープンソースを使うべきなのか、計算し始めることになるでしょう。

 
GN⁺ 5 시간 전
Hacker Newsの意見
  • すべてのAIサブスクリプションは、フロンティアモデル提供者にとって時限爆弾のようなものだ
    数年以内に、今日のフロンティアモデルと同等に優れたローカルモデルを、ほぼコスト負担なしで動かせるようになり、フロンティア企業の企業市場基盤は崩れるだろう

    • 「数年以内に今日のフロンティアモデル並みのローカルモデルを動かせる」という根拠が分からない
      メモリ要件だけ見ても莫大で、しばらくの間は共有の専用ホスティングハードウェアを高稼働率で使うほうが、はるかに費用対効果が高いはずだ
    • 別の言い方をすれば、フロンティアモデルは市場競争のせいで非常に速く価値が下がる資産だ
      互いに、そしてオープンウェイトモデルより先に進むには改善を続けなければならず、むしろ時限爆弾の逆に近い
      現在レベルの推論トークンは今後も安くなり続けるだろうし、ローカルが最終形になるかはハードウェア要件が高いので分からないが、競争は利益率をゼロ近くまで押し下げる傾向がある
      このテーマについての長い議論: https://corecursive.com/the-pre-training-wall-and-the-treadm...
    • この1か月、Qwen、Gemma、DeepseekをLiteLLMの背後につないで、未来がどう見えるかを示す小さなデモを作っていた
      トークン使用量を監視し、力ずくでトークンを大量消費する代わりに推論コストを下げて内製化しようと積極的に動いている
      上司はとても満足していて、今はさらに広く展開している。これが未来だと思う
    • 数年以内に今日のフロンティアモデル並みのローカルモデルを動かすという話はかなり疑わしい
      スケーリング則もすでに負担が大きくなっており、「指数関数的」という誇張に乗せられるべきではない
      しかも実際の競争相手は2年後のフロンティアモデルだ
    • ハードウェア生産やモデル構造に重要なブレークスルーがなければ、むしろ逆だ
      1〜2年前より今のほうが、より大きく、より高価で、より多くのエネルギーを食うハードウェアが必要になっている
  • AIの両陣営の記事の誇張されたトーンにはうんざりする
    経済やトークン提供ビジネスをよく知る人とホワイトボードの前で、「5歳児に説明するように」聞いてみたい
    トークン提供者にとってはマージンゲームで、消費者にとってはサービス/製品品質のゲームなのか、品質とマージンの線がいつか交差するなら、資金が尽きる前にその地点に到達できるかの競争なのか、もしそうなら両者の差が非常に大きかった歴史的事例があるのか知りたい
    LLMは、消費者が「どこまで良くなることを期待するか」に事実上の上限がない点で独特に見え、メールのように計算資源の観点からスケールしやすいサービスとは違う
    とても初歩的な質問だが、持続可能なビジネスモデルができる前に、なぜIPOをしたがるのかも気になる。利点は何だろう?

    • AIにOpusトークンの生産コストを尋ねたら、ハードウェア、電力、冷却、ホスティングを含めて100万トークン当たり0.216ドルという答えが返ってきた
      ここに挙がっているリンクによれば、Anthropic支出の約30%が推論で、残り70%は次世代モデル開発のような研究開発だ
      これを反映し、利益を乗せて数字を単純化すると、儲けるには100万トークン当たり1ドル程度で売ればよい
      現在のAPI価格は100万トークン当たり25ドルなので、収益性があることには疑いがない
      一方で月200ドルのMaxプランを極端に使えば月100億トークンまで行けてしまい、これは100万トークン当たり0.02ドルなので、途方もない損失を抱えることになり、いずれ消えるだろう
      ただし月100ドルのAnthropicプランで月1億トークン使う程度なら、会社は利益を出している
      月100億トークン使うには非常に長時間働き、AI活用にも本当に熟達していなければならないが、そういう人はすでに何年もAIを使ってきていて、Opus以前からでも有効活用していた可能性が高い
      Opusを失えばがっかりはするだろうが、そういうユーザーこそ、より弱いモデルでもうまく使いこなせるタイプなので、数年後には社内ホスティングのオープンソースモデルに移っても、今と同じ100万トークン当たり0.02ドル水準を出せるだろう
      だからこの記事の悲観的な雰囲気には説得されない。状況は変わるだろうが、AI利用の終わりを意味するわけではない
  • 記事のトーンには同意するが、文体があまりにもLLMっぽく感じられる
    特にセクション構成や、「That is not a rounding error. That is a line item that needs its own budget code.」のような決め台詞がそうだ

    • Claudeはこういう文を本当によく生成する
      かなりうっとうしいし、同じプロンプトではGeminiではあまり見ない
    • そもそもこの記事は誰が書いたのか分からない
      記事に著者名がない
    • Pangramはこの記事を高い確信度で100% AI生成だと判定した
  • Brad Gerstnerは、トークンが赤字で売られているわけではないと確認している
    公式がAPIとサブスクリプションをどう分けようと、企業は純粋なトークン販売ベースでは利益を出している
    給与や株式報酬まで含めれば赤字かもしれないが、トークン自体は今すでに黒字だ

    • 地球で最も強力なエンジンを積んだロケットが軌道に乗った後でエンジンを切り、「動力なしで飛んでいる」と言っているのを見るようなものだ
      今はそう言えるかもしれないが、ここまで来たやり方はそうではない
      回収すべき投資は数兆ドル規模なのに、売上は多くても数十億ドルなので、トークンが近いうちに利益を生むという計算は合わない
    • トークンは利益を乗せて売れるが、計算資源支出の70%が研究開発とモデル学習に使われている[0]
      推論はそれ単体で収益性があればよいのではなく、そのコストまで負担しなければならない
      [0] https://epoch.ai/data-insights/openai-compute-spend
    • 赤字で売っているわけではないが、現在の損失やコストを埋められるほど高く売っているわけでもない
      損失は奇妙な循環型資金調達構造の中で先送りされており、いずれ債務危機で崩れる可能性が高い
    • 言い換えれば、AI企業は費用控除前利益がプラスだということだ
    • Claude CodeやCodexトークンもそうかは分からない
      あちらは大きく補助されていると思うが、実際に価値を感じるのはそれらだけだ
  • 「AI」全体の問題は、なくても十分やっていけることだ
    AI企業も知っているし、ユーザーも知っているし、最もAIエージェントに好意的な管理職ですら知っている
    今この瞬間に世界中からAIをすべて取り除いたとしても、結果はただ通常運転の業務になるだけだ
    この記事はその点を十分に強調していない。PRレビューを実際のエンジニアに任せなければならない日が怖い、という話なのか?

    • 新技術の導入初期はいつだってそうではないかと思う
      技術がより深く統合されるほど、だんだんそうではなくなる
      電動モーターが出てから数年しか経っていない頃にも同じことが言えただろうし、ただ蒸気に戻ればよかった
      しかし今、電動モーターなしで生きようとすれば社会は崩壊する
      問題は今なくてもいいかではなく、5〜10年後に完全統合された後でもなくて済むかだ
    • だからこそ、さらに強く押し込もうとしているのかもしれない
      正直な売上を作るためではなく、AI製品を深く埋め込みすぎて「AIを抜こう」が選択肢に見えなくなるようにするためだ
      維持コストが上がり続けて航空会社的な政府救済レベルを超えたとしてもだ
      虚偽の約束で売られる新たな富の抽出仲介レイヤー
    • JavaScriptを使う人なら当然そうだろう
      少なくともJavaScriptを書くためには、もうAIなしではいられない
    • ごく普通で一般的な作業にまでAIツールを使えと勧めるのを見ると、いつも変な感じがする
      たまに使ってやらないと死んでしまうペットのように扱っている感じだ
  • この記事は間違っている。こうしたサブスクリプションは企業向けに提供されていないわけではない
    企業はAPI価格にかなり近い金額を払っている
    戦略は、個人向けサブスクリプションで無制限トークンに慣れさせ、その行動が職場に持ち込まれることを期待することだ

    • 提供されている
      チーム席やエンタープライズ席は消費者価格より高いが、使用量上限がリセットされる固定価格だ
      月20/100/200ドルプランに相当する席をメンバーに割り当てられ、すべて従量課金にもできる
      購入方法はいろいろある
    • サブスクリプションは企業にも確実に提供されている
      同等の消費者向けプランに相当する従量課金プランもある
    • なぜ企業向けサブスクリプションの話をしているのか混乱した
      私の会社ではAPI使用量ベースで請求されている
    • こういう段落を見ると、AIが吐き出した文章により近く見える
      「全体としてパターンは同じだ。経済性のための価格設定ではなく、導入のための価格設定だ。組織を縛りつける。AIをすべてのチームの日常業務における荷重を支える部分にする。請求書は後で心配する。」
    • そのうえ、記事で大騒ぎしているAPI料金の規模も、依然として比較的小さい
      月1万ドルが無視できる額ではないにせよ、その金額でエンジニア10〜20人のチームを支えられるなら、かなり良いレバレッジ
  • 原文を最後まで読んではいないが、AIが書いたことは分かった
    OpenRouterをAI提供原価の基準点にできるかもしれない
    Claudeよりコストパフォーマンスが良いと聞き続けているので、だとすればAnthropicが何らかの理由で特に非効率か、あるいは推論で利益を出していることになる
    学習では赤字かもしれないが、それは先端研究所であり続けるためのコストである可能性が高い
    どこか1社が負債などで倒れても、企業は単に乗り換えればよいのではないかと思う

  • 「It’s not X. It’s Y.」のような言い回しや、「load-bearing」を比喩として使うのをもう一度見たら吐きそうだ

    • そういう表現はかなり大量に出力させたことがあり、短いリストではない
      「補助金の時代は優雅に終わっていない。あちこちで亀裂を見せている。」
      「問題は良い取引だったかではない。その取引がどれだけ長く持つかだ。」
      「同時に3〜4個のコーディングエージェントを回す開発者は、チャット会話の3倍や4倍のトークンを使うわけではない。一桁違うのではなく、一桁以上違う。」
      「これらはもはや実験ではない。荷重を支えるワークフローだ。」
      「それは丸め誤差ではない。別個の予算コードが必要な項目だ。」
    • 大きな価格調整が来れば、無料や月20ドルのサブスクリプションでソーシャルメディアのコメントを生成していた多くの人たちが、実際のコストを見てまた自分で書くようになるかもしれない
      少なくともそう期待はできる
    • 「the unlock」という表現も同じくらい嫌いだ
    • この記事は冒頭は悪くなかった
      データもあり、論理ももっともらしかったが、中盤に差しかかるとトレンドの例、また別の例、3つ目の例、そして「それは単なるXではなくYだ」が飛び出してくる
      うまく書かれた記事を読んでいて出典リンクを押したらリックロールされたくらい不快だ
  • エンタープライズ顧客が月20ドルのClaude Proサブスクリプションを使っているわけではない
    私の会社は開発者に月約1,000ドル分の使用上限を提供しており、私が見る限りAPIコスト比の節約は多くても30%程度だ
    狂った補助金水準ではない
    他の職種は月50ドルしか認められないことが多く、その人たちはずっと上限まで使っている
    GitHub Copilotはビジネス席とエンタープライズ席でこの方式をやってきたが、もうすぐ限界にぶつかるだろう
    6月以降に消費者向けProとPro+アカウントを再編すれば、すぐ後を追うと思う
    OpenAIは顧客を囲い込むためにトークンをばらまいているように見えるので、IPO後のOpenAI側の価格・条件の急変が最も心配だ
    Anthropicはこの点ですでに責任ある動きをしており、GitHub Copilotも今後数か月で過剰な補助金を是正しようとしている

    • GitHub Copilotだけが本当にとんでもない補助金を出していた
      トークンではなく「リクエスト」単位で課金していたからだ
      3セントのリクエスト1件が、トークン換算では20ドル以上を燃やすこともあり、その方式は今月で終わる
      私もGHCPで大きな作業の塊を処理してきたので心配していたが、新しく出た請求見積もりツールを見ると、API価格ベースで月150〜200ドル程度だった
      月20ドルのサブスクリプションに対する補助金ではあるが、狂気の水準ではない
      エージェント型コーディングツールを責任を持ってたくさん使えば、API価格ベースでおおむね月200ドル程度に収まりそうだ
      その価格でも提供側が利益を出せるなら、西側諸国で開発者を雇う企業にとっては、節約できる時間を考えれば受け入れがたいものではない
      本当のリスクは個人プロジェクトをやるバイブコーダーたちにある
      補助金付きプランを乱用して巨大なアプリを作る時代は終わりつつある
  • 開発者を代替するなら、月20ドルや100ドルより高くても理にかなっている
    LLM企業の本当の問題は、コーディング以外の領域でまだ価値を示せていないことだ
    それがなければ、単なるコーディングツールに格下げされるだろう
    だから今急いでいるのであり、どんなワークフローをさらに自動化できるかが鍵だ
    書類仕事はすべて自動化できるかもしれない
    他の領域が育てば、価格モデルも変えるだろう

    • Figmaの代替を狙う動きもある程度はしている
      それには価値がありうる