18 ポイント 投稿者 GN⁺ 2026-02-23 | まだコメントはありません。 | WhatsAppで共有
  • ソフトウェアエンジニアリングがAIエージェントのツール呼び出し全体の約50%を占める一方、ヘルスケア・法務・金融など16のバーティカルはそれぞれ5%未満にとどまる
  • AIモデルの実際の能力は、人間なら5時間かかる作業を実行できる水準にあるが、実運用での99.9パーセンタイルのセッションは約42分にとどまり、能力と信頼の間に大きな隔たりがある
  • ユーザー体験が蓄積されるほど、自動承認率は20%から40%以上へ上昇し、同時に熟練ユーザーは事前承認ではなく能動的モニタリング方式へと監督戦略を切り替える
  • バーティカルAIの中核は、独自データ連携、ドメイン特化コンテキストエンジニアリング、顧客の変革管理であり、これが単なるラッパーと防御力のある企業を分ける基準となる
  • SaaSが過去数十年で170社以上のユニコーンを生み出したように、各SaaSユニコーンに対応するバーティカルAIユニコーンが登場する可能性があり、AI版はソフトウェアだけでなくオペレーターまで代替できる

ソフトウェアエンジニアリングがAIエージェント活動の半分を占有

  • Anthropicが発表したAIエージェントの実利用研究によると、ソフトウェアエンジニアリングが全**エージェント型ツール呼び出しの49.7%**を占める
  • ヘルスケアは1%、法務は0.9%、教育は1.8%にすぎず、16のバーティカルのうち9%を超える分野はない
  • これは市場が飽和しているのではなく、まだ形成されていない状態であることを示している
  • Han Wangはこれを「大半の起業家が見落としているグリーンフィールドの機会」と表現した
  • この記事の執筆者Garry Tanは「今起業するなら、このチャートの赤い領域に注目すべきだ」と述べている

配備ギャップ(Deployment Overhang)

  • METR評価によると、Claudeモデルは人間なら5時間かかる作業をこなせるが、実際のセッションは平均42分にとどまる
  • AIができることと、ユーザーが許容することのあいだのギャップが大きな機会を生み出している
  • 2025年10月から2026年1月にかけて、99.9パーセンタイルのターン継続時間が25分未満から45分超へと、ほぼ2倍に増加した
    • これはモデル性能の向上だけでなく、ユーザーがセッションごとに信頼を蓄積した結果でもある
  • 内部データではClaude Codeの成功率が2倍に上昇し、セッション当たりの人間の介入は5.4回から3.3回に減少した
  • モデルの能力は十分だが配備が追いついていない状況であり、これは新たな製品機会である

信頼の進化のしかた

  • 新規ユーザーはClaude Codeセッションの20%しか自動承認しないが、750回のセッション経験後には40%以上完全自動承認へ移行する
  • 直感に反して、熟練ユーザーは介入を減らすのではなくより多く介入する — 新規ユーザーの介入率は5%、熟練者は9%
    • これは矛盾ではなく、監督(oversight)戦略の変化である。初心者は各段階を事前承認し、熟練者は委任したうえで問題が起きた時に介入する(事前承認 → 能動的モニタリング)
  • 安全性に関する発見として、複雑な作業ではClaude Codeは人間が介入する頻度の2倍以上の頻度で確認質問を行う
    • エージェントがやみくもに進まず、不確実なときは自ら止まる行動パターンを示している
  • Anthropicの重要な教訓は、エージェントが実際に行使する自律性はモデル・ユーザー・製品が共同で構成するということだ

Aaron LevieのバーティカルAIプレイブック

  • Aaron Levieが示すバーティカルAI構築の公式:
    • 各業界の固有のデータ・ワークフロー・規制障壁を理解することが、防御力の高い企業の中核である
    • 単なるラッパー(wrapper)ではなく、独自データ統合・ワークフロー自動化・変革管理の能力が必要
    • 独自データにつながるエージェント型ソフトウェアを構築する
    • 実際の人と問題に合わせてソフトウェアが機能するよう設計する
    • ドメイン特化のコンテキストエンジニアリングで出力の知能を最大化する
    • 大半の起業家が見落とす点: 顧客に対する**変革管理(change management)**を推進すること
  • バーティカルAIに防御力がある理由: 誰でもラッパーは作れるが、ヘルスケア請求、法務ディスカバリー、建設許認可といった具体的なワークフロー、規制上の制約、組織的摩擦を乗り越えられるところは少ない
  • SaaSは数十年にわたり10年ごとに10倍成長し、この20年間でVC投資額の40%以上がSaaSに集中し、170社以上のSaaSユニコーンを生み出した
  • 中核となるテーゼ: 各SaaSユニコーンに対応するバーティカルAIユニコーンが存在し、AI版はソフトウェアだけでなくオペレーターまで代替するため、10倍大きくなり得る

共同構成(Co-Construction)のインサイトと政策的示唆

  • Anthropicの重要な発見:
    • 自律性はモデル固有の属性ではなく、モデル・ユーザー・製品が共同で構成するものであり
    • 配備前評価だけではこれを捉えられないため、実環境での測定が不可欠である
  • 安全性の数値: 73%のツール呼び出しに人間が介入し、0.8%だけが取り返しのつかない行動に分類された
    • 最もリスクの高い配備(APIキー漏えい、自律型暗号資産取引など)の多くは、実際の本番運用ではなくセキュリティ評価である
  • 「すべての行動を承認せよ」という政策は、安全性を高めることなく生産性だけを損なうため、
    人間が監視し介入できることを保証するほうが、より良い政策目標である

ユニコーンが隠れている場所

  • ソフトウェアエンジニアリングはすでに先行者がいる一方で、ヘルスケア・法務・金融・教育・カスタマーサービス・物流など、
    1桁の市場シェアにとどまる16のバーティカルは、ドメイン専門性をエージェントに組み込む誰かを待っている
  • 以前に300のSaaSユニコーンが誕生し、次には300のバーティカルAIユニコーンが登場するだろう
  • バーティカルを選び、ドメイン専門性をエージェントに組み込み、変革管理を解決する起業家が、今後10年のエンタープライズソフトウェアを握ることになる
  • モデルはすでに5時間の作業が可能だが、ユーザーは42分しか許容していない
    • これはAI活用の初期段階であることを示し、
    • まだ1分たりとも知能が適用されていない分野が数多く存在することを示唆している

まだコメントはありません。

まだコメントはありません。