13 ポイント 投稿者 GN⁺ 2025-08-04 | まだコメントはありません。 | WhatsAppで共有
  • LLMのトークンコストは毎年10分の1になるという期待に反して、AIサブスクリプションサービスでは収益性がますます悪化する現象が起きている
  • 最新のLLMモデルへの需要は常に最上位のSOTA(State-of-the-art)モデルに集中し、「旧型」モデルの値下がりは実質的な原価削減につながらない
  • モデル性能が上がるほど、使用されるトークン量が幾何級数的に増加し、単価下落を相殺して、むしろ総コストが急騰する構造
  • 無制限サブスクリプション料金プランの実験(例: Claude Code $200/月)も、ヘビーユーザーのトークン暴走によって持続不可能
  • 従量課金以外に長期的に持続可能なモデルはないが、スタートアップの競争構造と消費者の抵抗により、現実的な導入は難しい
  • 持続可能な収益モデルへ転換しなければ、大半のスタートアップはいずれ破綻リスクに直面する

AIサブスクリプションビジネスは、トークン単価が下がっているのになぜ赤字だけが増えるのか

LLM価格下落の幻想

  • 創業者たちは「トークン単価が10分の1ずつ下がるのだから、少し耐えれば高粗利構造に転換できる」というVCのプレイブックを信じ、初期には原価レベル、あるいは赤字でサブスクリプション商品を運営する
  • 実際にGPT-3.5のような旧型モデルのトークン単価は10分の1以上下落したが、ユーザーと市場の需要は常に最新・最高性能のSOTAモデルへ集中する
  • 実際には18か月が過ぎてもマージンは改善せず、むしろ悪化している
  • 旧型モデルの値下げが実感できるのは、「昨日の新聞」のように、すでに市場の関心の外にある場合だけだ

最新モデルの価格と需要構造

  • GPT-4、Claude 3 Opusなどの最新モデルは常に似たような高価格でリリースされ、旧型モデルがどれだけ安くなっても実際の使用量はごくわずかだ
  • ユーザーは「最高性能」だけを求め、「安い旧型モデル」は自動車市場における古い中古車にすぎない
  • AI利用で本当に欲しいのは最高の結果であるため、コストを節約するために自発的に旧型モデルを使う例はまれだ
  • 結局、市場で競争力を持つには常に最も高価な最新モデルを提供しなければならず、そのため原価が高止まりする
    • まるで90年代の中古車価格が下がっても、消費者は依然として新車を買うようなものだ

トークン使用量の爆発的増加

  • モデル性能が向上するにつれ、1回の作業で消費するトークン量が幾何級数的に増加する現象が起きている
  • 以前は1,000トークンで終わっていた作業が、今では100,000トークンを消費しうる
  • 以前は1文の問い合わせに1文の応答で処理されていたが、最近では複雑なリサーチやループ、オーケストレーションによって10〜20分ずつ連続動作し、膨大なトークン消費が発生する
  • AIにより深い調査・分析をさせることで、「1回の実行に20分、1日24時間連続実行」などとなり、ユーザー1人あたりの1日平均使用量が急増している
    • たとえば、毎日$1相当のdeep researchを1回使うだけでも、$20のサブスクリプション料金では採算が合わない
  • 単価下落分が総トークン消費量の増加で相殺され、$20/月の料金プランでは1日1回の$1の作業すら賄えない状況が到来した

無制限プランの失敗

  • AnthropicのClaude Codeなどは、$200/月の無制限プラン、トークン自動最適化、ユーザーPCの活用など、さまざまなコスト削減策を導入してみた
  • しかし一部のパワーユーザーは月間100億トークン(『War and Peace』12,500冊分)近くに達し、これはユーザーが自動化、反復作業、ループなどを活用して爆発的なトークン使用を引き起こしたためだ
    • 「AIの使用量が人間の時間と切り離され、APIが24時間動いてトークンが暴走する」ことにつながる
  • エンジニアリング上の革新にもかかわらず、結局プランをロールバックした
  • 結論: もはや無制限サブスクリプションモデルは不可能であり、式そのものが成り立たない

業界全体が直面するジレンマ

  • サブスクリプション方式にこだわり続ければ、収益性の悪化と崩壊リスクが高まる
  • AI企業はどこも、従量課金(usage-based pricing)だけが答えだとわかっているが、サブスクリプション型の競合が現れるとユーザー離れのリスクが大きい
  • 「囚人のジレンマ」構造により、誰もがパワーユーザー補助金競争へ追い込まれる
  • Cursor、Replitなども「成長優先、収益性は未来の問題」としてアプローチしているが、結局いつかは収益性の問題で構造調整が避けられない

現実的な解決策3つ

  • 1. 従量課金
    • 初期から誠実な経済モデルを導入すれば、原価を上回る収益構造を設計できる。長期的には唯一持続可能なモデル
    • ただし、消費者はメーター制料金を極度に嫌うため、大衆的成功は難しいという限界がある
  • 2. 高いスイッチングコストに基づく企業市場の攻略
    • 高いスイッチングコストを持つ**エンタープライズ顧客(例: 大企業、金融機関)**へのB2B営業を通じて、一度市場に入り込めば解約はほぼ不可能で、マージンも高い
    • システム・オブ・レコード(SOR, CRM/ERP/EHRなど)分野が代表的な成功事例(例: Goldman Sachsの4万人のエンジニア向け導入など)
  • 3. 垂直統合による付加価値創出(Vertical Integration)
    • Replitのように、LLM inference自体は赤字の「おとり商品」として提供し、その上に載せるホスティング、データベース、デプロイ、モニタリングなど複数のサービスで収益を生み出す
    • AI使用量を増やしてインフラ市場へつなげる構造を構築する
  • 今後もトークン単価の下落は続くだろうが、ユーザーの期待と使用量も幾何級数的に増える見通しだ
  • サブスクリプション制の成長戦略だけを守り続ける企業は、結局「高コストの葬儀」を迎えるリスクが高い

要約

  • 「来年にはトークンが10分の1まで安くなる」という楽観論だけではビジネスは維持できない
    • ユーザーは常により高い期待値と利用量を要求する
  • モデルの進化=利用量の爆増=原価の増加という公式が成り立っており、結局持続可能なAIビジネスは、従量課金、大企業契約、垂直統合による新しい構造へ転換しなければならない
    • 事業継続を望むなら、ネオクラウド戦略など新しい構造的アプローチが必要

まだコメントはありません。

まだコメントはありません。