誰が知能の価格を決めるのか?
(x.com/JayaGup10)- AIが知能(intelligence)を価格が付く資源へと変えつつある中、市場のあらゆる階層で、その価格を誰がコントロールするのかを巡る競争が起きている
- AIラボは利用量が自分たちを経由して流れることを望み、アプリケーションはラボよりもうまく知能を配分できることを証明しようとしており、国家は知能が国家インフラとなるほど安価になることを望んでいる
- 知能のコストはもはやソフトウェアの入力値ではなく、企業・市場・地政学が再編される**軸(axis)**として機能している
- AI投資がソフトウェア投資と異なる理由は、変数がはるかに多く、それらが不均等に**結合(coupled)**しており、各変数がそれぞれ独自のカーブで動く下位変数へと分解されるからである
- これは毎時間その方程式自体が書き換えられるシステムを分析することであり、どの変数でも十分に動けば他の変数の意味を変えてしまう再編の連続である
AI投資がソフトウェア投資と異なる理由
- ソフトウェアでは、パターンマッチングは難しくても機能しており、**配布コスト(distribution cost)**が顧客獲得効率を、**スイッチングコスト(switching cost)**が維持・拡大を決めていた
- CAC payback、NDR、magic number、Rule of 40は、いずれもこの二つの力の派生結果だった
- AIは三つの理由でこれを崩している
- システム内の変数がより多い
- 変数同士が不均等に結合している
- 各変数が、それぞれ独自のカーブで動く下位変数へと分解される
- Capability、cost、latency、deployment、regulation、talentのどれか一つでも動けば、残りの意味が変わり、一つの制約が解けると次に重要になる制約も変わる
各変数が変えるもの
- すでに議論されている馴染み深い変数はcapability、cost、latencyである
- より難しい変数は、研究や製品から生まれるunlocksであり、その性質や深さを事前にモデル化するのは難しく、到来速度は絶えず加速している
- ソフトウェアが固定値として扱っていた制約が、AIでは戦略的選択になる: geopolitics、deployment、talent
-
Capability
- reasoning、context、multimodality、tool use、planning、memory、controllabilityへと分解され、それぞれが独自のカーブ上で激しく動いている
- contextは3年で4,000トークンから100万トークン超へと拡大した
- reasoningはプロンプトの小手先の工夫から、独立したモデルクラスへと進化した
- retrieval pipelines、output parsers、prompt scaffoldsのようなインフラを吸収しており、これらはモデルの弱点を補う**補綴物(prosthetics)**だった
- プロンプトを収められるモデルと、コードベースや顧客履歴を収められるモデルは別の製品であり、性能向上はすべてのアプリケーションを均等に押し上げるのではなく、**ボトルネック(bottleneck)**を移動させる
- reasoning、context、multimodality、tool use、planning、memory、controllabilityへと分解され、それぞれが独自のカーブ上で激しく動いている
-
Cost
- コスト低下は単にマージンを改善するだけでなく、誰が競争できるかを変える
- かつてfrontier APIが必要だったワークフローが、安価なopen-weightモデル、ファインチューニングされた専門モデル、ルーティングされたスタックへと移行し、プレミアム製品がcommodity featureへと転落する
- DeepSeekは、モデル層におけるコスト期待値の変化が、その上にあるマージンプールを再配分しうることを、さらに激しく示している
- コスト低下は単にマージンを改善するだけでなく、誰が競争できるかを変える
-
Latency
- AIが非同期プロンプティングからリアルタイムワークフローへ移るにつれ、重要な変数となる
- 遅いモデルはメモ作成には向いていても、sales call、support conversation、tutoring session、security responseでは破綻する
- 相手側で人が待っている瞬間、latencyは性能の細部ではなく、市場として成立するかどうかを左右する
- voiceは、品質・割り込み処理・分単位で数セントの価格が同時に到来したとき、その一線を越えた
- latency低下は同じ製品を速くするだけでなく、**新しい利用面(surface)**を開く
- AIが非同期プロンプティングからリアルタイムワークフローへ移るにつれ、重要な変数となる
-
新しいカーブ
- 2年前には一覧に載せることすらできなかった、inference-time compute、task horizon、そしてAI自身による生産の入力
-
Inference-time compute
- 計算資源を10倍使えばより良い答えを得られるというダイヤルは、従来のソフトウェアにはなかった真に新しい要素であり、成果あたりのコストを選択の問題にする
- 同じモデルでも、10秒のクエリと10分のクエリは価格の異なる別製品であり、マージンはモデル価格ではなくシステムの判断に左右される
- これはラボに対するアプリケーション層の反撃でもあり、frontierモデルが製品ロジックを吸収するほど、各企業は自分たちの方が顧客のトークンをうまく配分できると主張しなければならない
- ラボには利用量拡大のインセンティブがあり、アプリケーションには成果価値のある場所にだけ支出するインセンティブがある
- 計算資源を10倍使えばより良い答えを得られるというダイヤルは、従来のソフトウェアにはなかった真に新しい要素であり、成果あたりのコストを選択の問題にする
-
Task horizon
- 深さのダイヤルがinference-time computeだとすれば、task horizonは長さのダイヤルであり、AIが人の介入前に自律して動作する時間を指す
- 単位はcallからworkflowへと移る
- エージェントは数時間動作し、下位エージェントを生成し、意思決定経路ごとに数百万トークンを消費するため、利用量はもはやseatに比例しない
- 長さと深さを掛け合わせたものが、あらゆるFortune 500のCFOが問うトークン請求額になる
- 深さのダイヤルがinference-time computeだとすれば、task horizonは長さのダイヤルであり、AIが人の介入前に自律して動作する時間を指す
-
AI自身による生産の入力
- synthetic data生成、コード作成、evals生成、実験サイクルの圧縮にAIが投入される
- 各世代が次の世代の構築時間を短縮することで、変化率そのものが**内生的(endogenous)**になる
- この再帰によって変化のサイクルは資金調達サイクルより短くなり、あるthesisの半減期も短くなりつつある
- synthetic data生成、コード作成、evals生成、実験サイクルの圧縮にAIが投入される
-
Geopolitics
- 戦いが明示的に現れる地点であり、中国は構造的に効率性とopen-weight公開へと押し出されている
- チップへのアクセス制限と、frontierスタックの一部からの排除が、その戦略を合理的にしている
- U.S.はopen-weight frontierモデルでもなお競争可能だが、まだ同じ構造的な解を打ち出せていない
- ソフトウェアには数十億ドル規模の学習は不要だったが、frontier open weightsにはcompute financing、patient capital、release governance、serving infrastructure、そして人材獲得競争の手段が必要になる
- いくつかの米国グループは、federationやfinancial engineeringを通じて、その学習コストを正当化しなければならない
- frontierラボは、自らの技術が危険だと信じてcapabilityベースの規制を主張しており、frontierへのアクセスが統制・監査・計量され、APIの背後に留まると利益を得る
- DeepSeekは単なるモデル公開ではなく、知能の価格を誰が決めるのかを巡る戦争における一発の銃声である
- 戦いが明示的に現れる地点であり、中国は構造的に効率性とopen-weight公開へと押し出されている
-
Deployment
- 価値がすべてcloudに帰属するわけではないため、依然として流動的である
- 推論は、製品を壊さない限り、最も安い場所へ移る: frontier reasoningはcloud、latencyはedge、プライバシーと個人化はon-device、三つすべてが必要なワークフローはhybrid
- モデルはデータを保存するだけでなく、ユーザーのcontext、memory、documents、voice、code、behavior、enterprise permissionsを推論するため、プライバシーはSaaS以上に重要になる
- 推論がどこで行われるかが、誰がマージンを取り、誰がcontextを所有し、顧客が誰を信頼するかを決める
- 価値がすべてcloudに帰属するわけではないため、依然として流動的である
-
Talent
- SaaSでは人材は実行変数であり、より優れたチームがより速く作り、よりうまく売り、より規律正しく運営していた
- AIでは人材は**生産の原材料(raw input)**であり、少数の研究者がarchitecture、data mixture、eval regime、cost-capabilityカーブそのものを変えうる
- チームは市場に合わせて実行するだけでなく、市場の形そのものを変えられる
- オペレーションの質だけでなく、research tasteも資産の一部になる
脅威はもはや競合他社ではない
- SaaSでは、通常は別の会社によって死ぬ: より資金力のある競合、より速いチーム、領域を拡張してくる既存企業
- 一つの例外は、他社プラットフォーム上に構築した会社が、価格や規約の変更によって競合なしに消滅する場合だった
- AIはこの例外をデフォルトにしてしまう
- AIにおける脅威は**レイヤー移動(layer migration)**であり、capability、cost、latency、deployment、regulation、trustのどの変数でも十分に変化すれば、仕事は移っていく
- モデル、open-weight代替、顧客のデータプラットフォーム、エージェントランタイム、あるいはデバイス自体へ移りうる
- もう一つの変数はdemandであり、買い手は動きが遅くても無知ではなく、lock-inコストを理解しているため、その遅れの中での裁定機会は閉じつつある
会社の作り方も逆転する
- 過去の前提や伝統的なVCアドバイスは消えつつある
- SaaSが生産性と心地よい体験を売っていたとすれば、AIはますますoutcomesとservicesを売る、より容赦のない事業であり、成果が出てはじめて製品は良いと言え、その成果が十分に効率よく生み出されてはじめて会社が成り立つ
-
ConsumerとEnterpriseの分岐
- consumerではbreadthだけでも十分である: 速く、安く、広く役に立ち、失敗しても許される
- enterpriseでは基準が異なる: 特定のワークフローの中で、顧客のcontext、permissions、data、risk toleranceを埋め込んだまま動作しなければならない
- だからfrontierモデル単体ではenterprise製品にならず、価値は、モデルを企業内で有用にするapplication、orchestration、services、proprietary dataの層に宿る
-
DistributionとTalent
- 昨日のモデルが新製品を可能にし、会社が火曜日にはポジションを変えられることもある
- 一部の会社はすでに営業人材のプロフィールを、動く標的を売れる人へと変えている
- 一部の会社では、最初からtop-down方式が機能している
- 昨日のモデルが新製品を可能にし、会社が火曜日にはポジションを変えられることもある
-
経済構造
- services-as-softwareが価格設定を変え、systems-integratorとのパートナーシップが従来のプレイブックより何年も早く生じている
- 市場は分裂している: ある投資家は、製品が絶えず再構築されるポートフォリオを見て、製品はほとんど重要でなくservicesこそ本当の事業だと結論づけ、別の投資家はコンサルティングのように見えるものに拒否感を示す
- より居心地の悪い真実は、AIではproduct、services、deployment、distributionが会社ごとに再結合されつつあるという点である
-
創業者のイノベーション
- 狭いICP、一つのwedge、ゆっくり作ること、予測可能な採用、product-ledの維持: 変数が静止せず、顧客がpoint solutionを望まない市場では、そのどれも十分ではない
- 勝っているように見える要素は、速いフィードバックループ、権限を持つ少人数チーム、6か月前の計画ではなく変化に合わせて再編することへの心地よさである
いま創業者と国家に問われること
- AIにおける価値は、一度獲得して防衛されるものではなく、継続的に再価格付け・再配置されるものであり、変数とはその再配置の方向と速度を読む手段である
- すべてのAI企業は仮定の積み重ねの上に立っており、強い会社は、自分がどの仮定にロングで、どの仮定にショートなのかを理解している
- AIへの投資と構築は、ソフトウェア企業をデューデリジェンスすることよりも、トレーディングブック(trading book)を運用することに近い
- あるカーブにはロングし、別のカーブにはショートし、最も重要な瞬間に壊れうる相関関係にさらされる
- どの変数に賭けるかを選び、どの変数が自分を殺しうるかを知り、間違った賭けが複利で積み上がる前に、より速く立て直せるように会社を作らなければならない
-
政治的次元
- U.S.政府が二つの変数を同時に扱えれば、状況はより良くなる: 危険なfrontierを統制しつつ、知能を、クローズドなlabsや競合国家だけが未来を定義できるほど高価なものにしないこと
- 勝つ国家とは、最も多く規制する国でも、最も多く公開する国でもなく、知能を信頼できるほど安全でありながら、広く行き渡るほど安価にする方法を見つける国である
まだコメントはありません。