4 ポイント 投稿者 GN⁺ 3 시간 전 | 2件のコメント | WhatsAppで共有
  • AIモデルが強力になるほど、ソフトウェアそのものの価値は下がり、生き残ろうとするアプリケーション企業は データ企業でありフィンテック企業 へ同時に転換する必要がある
  • エージェントがソフトウェアの主な利用者になるにつれ、per-seat価格モデルは崩壊する。1,000人が10万のエージェントを動かしても10万席ではないため、エージェントが残す意思決定(データ)と動かすお金(フィンテック) だけが課金対象として残る
  • フロンティアモデルは会社の運営方法を知らない天才集団のようなもので、人が持つ 暗黙的な判断(judgment) こそが本当の堀であり、ユーザーがモデル結果を直してきた 修正履歴(corrections) が学習シグナルでありテストセットの役割を果たす
  • データにお金が流れなければ科学プロジェクトにすぎず、Toast・Ramp・Shopifyのような ネットワークとロックインを持つフィンテック だけがモデル価格の下落速度の中でもマージンを維持できる
  • 判断の蓄積とお金の流れの掌握、そして 書き込み(writes)の防御 が、Labがすべてのトークンを見ていても代替不可能な会社として残る唯一の道だ

モデルの進化とソフトウェア価値の下落

  • 昨日Claude Fable 5がリリースされた。一般ユーザーが使える初のMythos-classモデルで、ほぼすべてのベンチマークで1位、作業が長くなるほど差が広がる
    • モデルが賢いほど、ソフトウェアそのものの価値は下がる
  • すべてのベンチャー投資先アプリケーション企業は、今やデータ企業かフィンテック企業、理想的にはその両方であるべきだ

誰がソフトウェアを使うのかの変化

  • 2年前の文章で、エージェントがユーザーになると per-seat価格モデル は壊れると指摘したが、その線を越えたように見える
    • Cloudflareは エージェントトラフィックが人間のトラフィックを初めて上回った と発表した
    • オンラインでは議論があるものの、エージェントがあらゆるソフトウェアの主な顧客になる流れは明らかだ
  • 1,000人の従業員が10万のエージェントを動かすことは、10万席を意味しない
  • エージェントが残す課金可能なものは2つ、そこから下される 意思決定(=データ) と動かされる お金(=フィンテック)

意思決定(Decisions)— データという堀

  • xAIはCursorを600億ドルで買収するオプションを保有しており、Cursorの年間経常売上は約40億ドル
    • それはソフトウェアが高値を付けた主な理由ではない
    • AnthropicとOpenAIはすでにClaude CodeとCodexで開発者の作業をリアルタイムで観察している
    • xAIがCursorを買う理由は、トークンフロー(token flow) に最速で入り込むためだ
    • Musk(世界初の兆万長者)は、100万人の開発者がモデルを実際に使う記録がGrokの学習に直接入ると述べており、その高額な価格はデータをゆっくり集める数年を飛ばすための通行料だ
  • Cursorはリリース直後の数週間で動くクローンが現れたが、どれも定着しなかった。勝負していたのは テイスト(taste) だったからだ
    • 何を見せ、いつ消すかに関する何千もの小さな判断
    • クローンはインターフェースを複製できても、開発者が何年もかけて受け入れ・拒否・書き直してきた履歴は受け継げない
    • Cursorは今やその diff で自前のモデルを学習しており、データが第一の堀になっている
  • 600億ドルという価値の理由は、従業員の90%を会社の運営方法をまったく知らない天才チームに置き換えるのと同じだからだ
    • Fable 5は、昨年の最高モデルが半分をやっとこなしていた実際のソフトウェア作業の80%を解決する。天才たちは互いに見分けがつきにくく、入れ替え可能だ
    • 彼らが失敗する理由は1つだけで、置き換えられた人たちが知っていたことを誰も知らないからだ

暗黙知(tacit knowledge)と判断の蓄積

  • 当面の対処法は、人の頭の中にある知識を取り出してモデルにコンテキストとして渡すことだが、その大半は構造化された形では存在しない
    • 見送った取引、午前2時に戻したコード1行、誰も追わず理由も書かれなかった顧客 — これこそが本当の核心だ
    • これはワークフローとして書ける判断ではなく、現時点では保存もされていない
  • 今は context → harness → judgment へ移行しつつある
    • Contextは検索(retrieval)、つまり正しい断片をモデルの前に置くこと
    • Harnessはモデルが回せるループ(scaffolding)
    • Judgment は最後の層であり、唯一複利で積み上がる層で、あらゆる呼び出し・修正・差し戻しがデータの上に残したものだ
  • 今見るAIアプリのピッチはどれも contextスライド を堀として掲げているが、もはやそれはtable stakesにすぎない
    • すべての競合が同じ方法でコンテキストを組み立てているからだ

修正履歴(corrections)の2つの役割

  • 修正は スコアカード(scorecard) として見ることができる。ユーザーがモデルの結果を直すたびに、その業務で何が正しいかが記録される
  • スコアカードは同時に2つの役割を果たす
    • 借りているモデルをその業務に合わせて調整する 学習シグナル
    • エージェントが実際に改善しているかを知る唯一の手段である テストセット。公開ベンチマークでは特定のワークフローを測れない
  • 最初からモデルを事前学習する必要はない。Cursorですらそうしていない
    • Cursorの自前モデルはオープンソースのベースの上に載っており、差別化を担うのはdiffだ
    • フロンティアモデル上でのfine-tuningとRLのコストは十分に安くなり、Series Bの企業でもこのループを回せる。2年前ならLabが必要だった
  • Sarah Guoはこの領域を the untrainable(外部から正解を採点できない仕事)と呼ぶ。修正こそがそれを所有する方法になる

垂直型(vertical)AIリーダーの事例

  • Harveyは110億ドル、Legoraは50億ドルを突破し、どちらも法務市場を対象にしている
    • 単独ツールを超えて 案件(matter)全体 の所有へ突き進んでいる。弁護士がドラフトに加える修正は、誰にも見えないcorrectionsだからだ
  • Rogoは金融で同じ戦略を取り、アナリストがモデルを作りメモを直す過程を捉えている
  • 彼らの誰もファウンデーションモデルを学習していない。借りたモデルの周囲にharnessを築き、その中を流れるjudgmentを保有している。これが複利で積み上がる
  • 既存の強者も同じだ
    • FigmaはSVG以上のものを所有している。デザインがv1からv47へ進んだ履歴と、その途中で捨てられたすべてのバージョン — デザインテイストの採点済み記録
    • Linearはクローズされたすべてのチケットの下にある議論を保有している
    • Notionは千回の編集にわたるチームの思考の形を保有している
    • 競合が顧客を奪おうとしても、これらはどれもexportできず、汎用モデルにはない答えだ

Labが判断を買い集める流れ

  • Labは判断を既製品として買い始めており、その出発点は人手でラベル付けされたデータだ
    • Mercorの評価額は100億ドルで、専門家ネットワークに時給85ドルを支払っている
    • Metaはパイプラインを所有するためにScaleへ140億ドルを支払った
    • ニューヨークのあるスタートアップは、全工程の撮影を許可すればアパートを 無料 で掃除する。ロボティクスチームが人間が次の行動を決める様子を見る必要があるためだ
    • 多くのRL environment企業が長期タスクに対する判断を売り、年間経常売上で数億ドルに達している
  • Labはインターネット全体からの学習をやり尽くし、今は意思決定そのものを直接買っている

お金(Dollars)— フィンテックという堀

  • 23andMeは1,500万人分のDNAを保有していたにもかかわらず、昨年破産した
    • データにお金が流れなければ、科学プロジェクトの資金待ちにすぎない
    • ほとんどの創業者はこの半分を見落としている
  • Toastは数年前にこれを見抜いた。レストランは本質的に厨房付きの決済処理機だ
    • 決済はソフトウェアよりはるかに大きな収益を生む
  • Rampはさらに先を行く。法人カードを無料で提供し、どこにも手数料はないが、10億ドルが流れるたびに1ドルごとに1〜2セントを取る
    • 丸め誤差のような収益で築いた320億ドル企業であり、無料カードはinterchangeへ向かう正面入口だ
    • swipe feeはネットワークが支えるため維持され、お金は滞留している間にも float を生み、収益をもたらす
  • すべてのマネーメーターに堀があるわけではない
    • ある人気のvibe-codingアプリは、販売するクレジットで約50%のマージンを得ており、年間経常売上の大半は推論(inference)への上乗せだ
    • トークンへの上乗せの裏にネットワークはなく、自前の推論コストも四半期ごとに下がるため、モデルが安くなるにつれてマージンは溶ける
    • 持続可能なフィンテックはロックインが組み込まれたものだ — ネットワークが守る決済、銀行が見られないデータで引き受ける融資

エージェント向け決済インフラ

  • エージェント向けの決済インフラがついに動き始めた
    • エージェントが航空券を予約し、部品を注文し、ベンダーに支払うとき、何かが請求を承認・運搬し、手数料を取らなければならない
    • Stripeはそのためのプロトコルを公開し、VisaとMastercardは標準の主導権を巡って競争している
    • OpenAIはすでに自社エージェントが購入するたびに数パーセントを差し引いている
    • 1兆のエージェント取引は、まもなく史上最大の決済経済として浮上する

一方を他方に変える

  • 長く続く最高のアプリケーション企業は、この2つの半分を切り離して扱わない
    • Judgmentは仕事に関する意思決定の記録であり、フィンテックはお金に関する意思決定の記録だ。強い会社は一方を他方へ変換する
  • Shopifyが最も良い例だ
    • 店舗ソフトウェアから始まり → 決済を追加 → Shopify Capitalで店舗を流れる売上データを担保にした融資を提供し、銀行だけではできない融資を実現した
    • 加盟店が成長すれば売上が増え、そのデータが次の融資を助ける
    • 現在、Shopify売上の約4分の3はソフトウェアサブスクリプションではなく お金側 から来ている
    • StripeはRadarで、Rampは支出データとカードで同じループを回している
  • Ripplingも似たことを試みており、中心オブジェクトは従業員だ
    • 給与・福利厚生・デバイス・カードが1つのsource of truthに依存している
    • まだ誰もロックインできておらず、GustoとDeelも並行して成長しているが、そのオブジェクトを保有する会社が複利で積み上げる一方、他は手作業で組み立てている

書き込みを守れ(Guard the writes)

  • まだ誰も解けていない「ヘッドレス(headless)」の緊張がある
    • すべてのソフトウェアがエージェントによって使われるようになるなら、有用であるにはエージェントを受け入れなければならず、生き残るには全部を持っていかせてもいけない
    • すべてのsystem of recordは、エージェントがどんなプロトコルでも接続できるほど開かれていながら、必要なものを得たあと誰も離脱できないほど閉じていなければならない
    • Salesforceは今年、SlackデータをGleanと外部エージェントから遮断した。公に現れた最初の事例だ
  • 持続可能な会社を作る道は分離にある
    • エージェントに 読ませる ことは許可する。読み取りは安価で、とにかく重要だ
    • 書き込みは防御する
  • 新しい判断が入力され、人間とエージェントが相互に承認・修正・差し戻しを行う地点こそ、競合が簡単には移せない部分だ
    • 彼らがスクレイピングして持っていけるのは昨日の状態であり、今この瞬間に下される意思決定だけが自分たちのものとして残る

「Anthropicがこれを作ったら?」

  • Labはすでにトークンフローの中にいるのだから、堀はどこにあるのかという反論はありうる
    • Claude Codeは開発者が実行するすべてのコマンドと無視した提案を見ており、ChatGPTは製品が1年かけて記録するより多くの意思決定を1日で観察する
  • その反論への答えは、彼らのツールが見ているものの大半は汎用的だということだ
    • すべてのモデルが見る同じコーディングと文章作成であり、まさにLab同士が互いにコモディティ化しようと競っているものだ
    • 希少な判断は1社の深部に存在する — 病院がスキャンを読む方法、会社が見送ると学んだ取引。どれもLabのチャットボックスには届かない
  • Labは何年ものあいだ、企業に対してそのデータでは学習しないと言ってきた
    • プロダクト内モデルを通過する暗黙知は、契約によってその企業のものとして保持される。彼らはtraceが通るのは見るが、保存しないと合意している
  • フィンテックの半分は、そもそもLabが欲しがるものでもない
    • Labはデータは喜んで取るが、loan book・詐欺損失・40州のmoney-transmitterライセンスは役に立たない
    • 買い手にとってデータは買収価値を作り、フィンテックは切り離しにくくする
  • Cursorはカテゴリ最高のデータエンジンを作り、それをLabが600億ドルで買った
    • これが夢なのか警告なのかは、変えるには遅すぎる時点まで分からない
    • 生き残る2つを作れ — 判断を蓄積することお金の流れの要所に座ること。それが「Anthropicがこれを作ったら?」という問いに耐える方法だ

2件のコメント

 
heim2 18 분 전

なんとなくそれらしく聞こえるけど、理解するのは難しいですね。

 
somang04 2 시간 전

「判断の蓄積と資金フローの掌握、そして書き込み(writes)の防御こそが、ラボ(lab)がすべてのトークンを見ていたとしても、代替不可能な会社であり続けるための唯一の道」→ これの意味が曖昧なのですが、補足説明していただけますか?