AIのロングテール

xguru · 2024-11-18T10:21:01+09:00

2022年11月のChatGPT公開以降、AIスタートアップは投資家の強い関心を集めており、2024年第2四半期にはベンチャー資金全体の49%がAIおよび機械学習スタートアップに投資された。 OpenAIのようなモデル提供企業や、PerplexityやJasperのようなAIネイティブ企業が注目を集めている一方で、実際にはAIの影響を受ける「非AI」企業のほうが数は多い。こうした非AI企業に及ぶAIの影響を、私たちは「AIのロングテール」と呼んでおり、このロングテールは企業がAIを統合する方法に応じて4つのカテゴリーに分けられる。独自モデルの構築 OpenAIのGPT-4のような既存モデルの活用 MetaのLlamaのようなオープンソースモデルを基盤にした構築 ChatGPTのような事前構築済みAIツールの利用独立した独自モデルの構築は、AI活用の中で最もリソース集約的な方法であり、一般に大規模で独自性の高いデータソースを持ち、新たなモデルを訓練するのに十分な人的・財務的資源を持つ企業に適している。 OpenAIのGPTモデルやAnthropicのClaudeのようなクローズドソースモデルは、数十億から数兆のパラメータで訓練されており、コーディングから顧客対応まで幅広い分野で正確かつ詳細な結果を生成でき、API経由で容易に利用できる。 MistralやMetaのLlamaのようなオープンソースモデルは強力なツールであり、Llama 3.1は4050億のパラメータで訓練されている。クローズドソースモデルと異なり、オープンソースモデルは透明性と柔軟性を提供し、モデルの重みを調整して顧客の特定ニーズに合わせることができる。 ChatGPTのようなサードパーティー製AIツールは統合が最も容易で、利用企業は内部でモデルを構築または調整する必要なく、完成済みのツールを使うことができる。 AI戦略は企業ごとに異なるが、成功している企業はAIを既存事業の補完に使い、同業他社の成功事例を模倣しつつ、AI技術の進化に応じて柔軟性を保っている。 AIにおけるHypeのパワー法則正規分布 vs. パワー法則: 正規分布はIQ、試験の点数、血圧など日常でよく見られる分布で、平均値の周辺にデータが集中する。一方、世の中の多くの現象は、少数の極端な事例が結果の大半を左右するパワー法則によって定義される。例えば、2023年のS&P 500指数の上昇分の半分以上は、わずか1.4%にすぎない7銘柄が占めた。ベンチャーキャピタルでも、少数の成功投資がファンド収益の大半を占める。例として、Union Square Ventures創業者のFred Wilsonは「1件の投資でファンド全体の利益を生み出せる」と述べている。 AI分野におけるパワー法則: ドットコムバブル期にインターネット企業へ資本が集中したように、2024年にはAI分野が同様の熱狂を見せている。 Y Combinatorの2024年夏コホートでは、**75%**がAI関連製品を開発中である。 2024年第2四半期のベンチャーキャピタル投資の**49%**がAIおよび機械学習スタートアップに集中した（2022年第2四半期は29%だった）。 2020年の初期段階AI、SaaS、フィンテック企業の評価額中央値はそれぞれ$25M、$27M、$28Mだったが、2024年には$70M、$46M、$50Mへと上昇した。 OpenAIは赤字だったにもかかわらず、2024年10月に**$157B**の評価額で新規資本を調達した（売上高の39倍の評価）。 AIネイティブスタートアップの限界: 生成AIとLLMの登場により、AIは企業の中核製品として定着しつつある。しかし、AIネイティブ企業が投資家の関心を独占している一方で、非AI企業もAI技術の進歩の影響を受けている。大半の企業は本質的にAI企業ではないが、AIの進展はそれらのビジネスモデルに大きな影響を及ぼすだろう。インターネットのロングテールからAIのロングテールへ: ドットコムバブル後、インターネットの潮流に適応した非インターネット企業が大きな成功を収めた。例えばWalmartは1962年設立だが、2023年のEC売上高は**$73Bに達し、2017年比で5倍**成長した。今日では「AIのロングテール」が登場しており、これはフィンテック、SaaS、ヘルスケア、Eコマース、物流など多様な産業分野の非AI企業を含んでいる。 AIの広範な影響: 事前構築済みAIツールの利用から内部ワークフローへのAI統合まで、さまざまな業界の企業がAIを活用している、あるいは活用を試みている。インターネットが非インターネット企業に与えた影響と同様に、AIも単にAIモデルを構築する企業だけにとどまらない広範な影響を及ぼすだろう。 AIのロングテールの定義 AI企業はAIに対する関心と投資の大半を占めており、2つのカテゴリーに分けられる。モデル企業: OpenAI、Anthropic、Mistralのように、独自またはオープンソースのLLM（大規模言語モデル）を開発し、ユーザーに提供する企業。 AIネイティブ企業: Perplexity、Jasperのように、AIモデルを基盤として製品やサービスを提供する企業。最初のカテゴリーでは、モデル自体が製品である。2番目のカテゴリーでは、AIモデルが機能の中核を成すが、モデルがなければ企業そのものが存在しない。たとえばBasetenのCEOであるTuhin Srivastavaは、「モデルがなければAIネイティブ企業は存在しない」と説明している。しかし、Bloomberg、Walmart、Canvaなど大半の企業はこれら2つのカテゴリーには属さない。こうした企業は、「AIのロングテール」と呼ばれる、より広い範囲に属している。ロングテールにおける主要な問い AI技術の進歩は、ChatGPT公開以前から存在していたビジネスモデルにどのような影響を与えるのか。コンサルティング会社のアナリストからテック企業のソフトウェアエンジニアまで、さまざまな業界の従業員はAIをどのように使っており、今後どのように使うのか。企業はAI市場でどのようにポジショニングしているのか。自社モデルを構築しているのか、それとも外部で開発されたツールを使っているのか。さまざまな企業のAI活用事例例: Ramp（経費管理プラットフォーム）とAtlassian（オーストラリアのSaaS企業）は、既存のデータとワークフローの上に生成AIを追加している。 Klarna（スウェーデンのフィンテック企業）は内部業務の効率改善のためにAIへ投資しており、AIチャットボットはフルタイムのカスタマーサービス担当者700人分に相当する成果を示した。 PwCは2024年5月に、10万人の従業員へChatGPT Enterpriseの機能を提供する契約を締結した。また、2024年の米国商工会議所の調査では、中小企業の98%がAIツールを使用していると回答した。過去と現在の比較インターネットブーム後に非インターネット企業がEコマース導入によって大きな成功を収めた事例と同様に、「AIのロングテール」は多様な業界にまたがる非AI企業がAIの影響を受けることを示している。インターネットが非インターネット企業に広範な影響を及ぼしたように、AIも単にAIモデルを構築する企業に限定されず、より広い経済に影響を与えるだろう。 AIロングテールの4つのレイヤー独立した社内AIモデルの構築: 独自データセットを活用して自社AIモデルを構築する企業。クローズドソースモデルの活用: OpenAI、Anthropicなどのクローズドソースモデルを利用する企業。オープンソースモデルの活用: Llama、Mistral、Hugging Faceのモデルを利用する企業。事前構築済みAIツールの統合: すでに開発されたAIツールをワークフローに統合する企業。これら4つのレイヤーは固定的なものではなく、さまざまな方法でAIを利用する企業は複数のレイヤーにまたがって分類されることがある。AI技術の急速な進歩に伴い、企業のAI活用方法も絶えず変化している。レイヤー1: 自社モデルの構築最もリソース消費の大きい戦略: AIのロングテールにおいて最もコストがかかる戦略は、独立したモデルをゼロから構築すること。この戦略に適した企業は、(1) 資本が豊富で、(2) 独自性があり価値の高いデータセットを保有している企業。例: Sam Altmanによると、GPT-4の学習コストは $100M に達する。自社モデルは高コストだが、独自データセットを保有する企業にとっては、(A) より精緻で企業向けに最適化された結果を提供し、(B) モデルと重みに対する完全な制御を可能にし、(C) クローズドソースモデルと比べてコスト削減の可能性をもたらす。ブルームバーグ (Bloomberg) Bloomberg はニューヨークに本社を置く金融データ・メディア企業で、年間 $12B を超える売上を上げている。代表製品のBloomberg Terminalは全売上の約 2/3 を占める。 Bloombergでは8,000人を超えるエンジニアのうち 350人以上がAIエンジニアリングチームに所属しており、毎年さまざまなAI研究論文を発表している。 2023年3月、Bloombergは金融特化型LLMである BloombergGPT を発表した。このモデルは合計 50B パラメータで構成され、345Bの公開データセットと、40年にわたって収集した363Bの金融文書データセットを組み合わせて学習された。学習コストは $2.7M から $10M 超と推定されている。 2024年1月、Bloombergは自社モデルとみられるAI生成要約機能をTerminalに導入し、これは社内アナリストの支援を受けて学習された。 Replit Replit はWebベースの統合開発環境 (IDE) で、コラボレーション機能やコード自動補完、デバッグ機能を提供している。 ReplitのAI機能は、独自開発モデル、オープンソースモデルのファインチューニング、さらにOpenAIおよびAnthropicのクローズドソースモデルを組み合わせて提供される。 2023年4月と10月、Replitは自社のコード補完モデルをリリースし、これをHugging Faceで公開した。 2024年4月、オープンソースモデルをファインチューニングして自動デバッグ機能をリリースした。 2024年9月、自社の 7Bパラメータモデルを基盤とする自動ペアプログラマーをリリースしたが、一部ユーザーは初期機能に不満を示した。 Canva Canva はオーストラリア拠点のWebデザインプラットフォームで、2024年10月時点で $49B の評価を受けている。 2023年10月、Canvaは Magic Studio という生成AIデザインスタジオをリリースした。このスタジオは、ユーザーが生成したコンテンツを学習データとして用いて「独自モデル」を構築している。ユーザーデータは許可なく使用されず、参加したユーザーには報酬が支払われる。 2024年7月、Canvaは画像生成プラットフォーム Leonardo.Ai を買収し、Magic Studioに統合する計画を示した。ウォルマート (Walmart) Walmart は2018年から顧客向けAIツールを構築しており、2024年6月にはすべての生成AI機能で自社モデルへ移行した。 2024年10月、Walmartは Wallaby という小売特化型LLMを発表した。このモデルはWalmartのデータで学習され、カスタマーサービスに関連する自然な応答を生成する。 WalmartはAIを活用して、顧客サポートチャットボット、商品カタログ整理、拡張現実ショッピング体験などを改善している。また、Robloxのようなオンラインプラットフォームで仮想ショッピング体験も提供している。 Walmartは自社モデルを好む一方、特定のユースケースに応じて他社モデルも引き続き利用する計画。レイヤー2: 既存のクローズドソースモデルの利用独自にモデルを構築する代わりに、企業はOpenAIやAnthropicなどのクローズドソースAIモデルにAPIでアクセスし、自社ソリューションを構築できる。クローズドソースモデルは多様な分野で高精度な出力を提供できるため、文字起こし、カスタマーサービス、データ抽出などの一般的な作業に有用。 OpenAIのGPTおよびAnthropicのClaudeモデルは非常に高品質な出力を提供する。 APIアクセスの容易さにより、エンジニアリングの観点でAI導入が最もしやすい方法の1つとされる。近年では、コスト効率と高速な推論性能を提供するために GPT-4o mini のような小型モデルも登場している。 Zapier Zapier はワークフロー自動化プラットフォームで、2011年に設立され、2023年8月時点で $5B の評価を受けている。 OpenAIモデルを活用して社内自動化プロセスを改善しており、たとえば会議の文字起こし生成と要約機能や Web記事要約機能などがある。 Zapierの Copilot ツールは、自然言語プロンプトを使ってワークフローを作成できるようにする。 Klarna Klarna はスウェーデンのフィンテック企業で、「Buy Now, Pay Later」サービスを提供しており、2024年9月にはSalesforceとWorkdayを AIで置き換えると発表した。 OpenAIモデルを活用したカスタマーサービスAIアシスタントを通じて、顧客サポート要請の 2/3 を処理し、フルタイム従業員700人分の業務量を代替している。社内ではAIアシスタント Kiki を使い、従業員が毎日2,000件を超える質問に回答できるよう支援している。 Ramp Ramp は2019年設立の B2Bフィンテックスタートアップで、さまざまな財務ソフトウェア製品を提供している。 GPT-4およびClaude モデルを使って、契約書データ分析、取引分類、領収書メモ作成などを自動化している。社内ではAIを使って顧客通話の要約や質疑応答機能を提供しており、これはSlackと統合されている。 Atlassian Atlassian はJira、Trello、Confluenceなどのチームコラボレーションソフトウェアを提供する $50B評価の企業。 2023年4月に Atlassian Intelligence という生成AI機能を発表した。この機能はOpenAIモデルとAtlassianの自社モデルを組み合わせて利用している。 AIアシスタント Rovo はJiraの検索機能を強化し、No-Codeエージェントを通じてマーケティングコンテンツ生成やフィードバック収集などを自動化する。 Canva Canva はMagic Studioで独自モデルを使用しているが、一部機能ではクローズドソースモデルを活用している。例: OpenAIモデルを使用したライティングエディタは、アップロードされたサンプルのトーンに合わせてコンテンツを生成する。 Canvaはまた、さまざまな AIアプリマーケットプレイスも運営しており、これにはOpenAIのDALL-E、GoogleのImagenアプリなどが含まれる。レイヤー 3: オープンソースモデルベースの開発独自にモデルを構築したり、OpenAIのGPT-4oのようなクローズドソースモデルを使ったりする代わりに、多くの企業がMetaのLlama、Mistral、Hugging Faceなどのオープンソースモデルを活用して独自ツールを構築している。オープンソースモデルは、高度なカスタマイズ性と透明性、データプライバシーの強化、コスト削減という利点を提供する。 Databricksの2024年レポートによると、LLMを利用する企業の**76%**がオープンソースを選択している。オープンソースモデルは別途ライセンス費用が不要で、自社ホスティングが可能なため、大規模なクラウドコストを回避できる。企業顧客にとっては、著作権問題やデータ漏えいリスクを低減できる点も重要な要因である。 VMware VMwareは仮想化ソフトウェアの提供企業で、2023年にBroadcomに**$69B**で買収された。 VMwareはHugging Faceと協力し、SafeCoderというオープンソースベースのコーディングアシスタントを開発した。 StarCoderという15.5Bパラメータモデルを活用しており、このモデルはオープンソースプロジェクトからデータを収集して著作権問題を最小化している。企業顧客はStarCoderモデルを自社コードでファインチューニングできるため、ドメイン知識が必要な社内業務に役立つ。 Mathpresso Mathpressoは韓国のエドテック企業で、代表的なアプリQANDAを通じて、学生が数学の問題のスクリーンショットをアップロードすると自動で解答を提供する。 2023年、MetaのLlama 2モデルを使って、MathGPTという数学特化型LLMを開発した。 MathGPTは学習データとしてQANDAの数学ソリューションを使用し、既存の商用モデルよりも高いカスタマイズ性と教育環境に合わせた精度を提供する。 MathGPTはMATHおよびGSM8KベンチマークでMicrosoft Toraを上回り、13Bパラメータ以下のモデルの中で1位を獲得した。 Brave Braveはプライバシー保護を最優先とするWebブラウザで、広告ブロックやトラッカーブロックなどの機能を提供する。 2023年8月、LeoというAIアシスタントをリリースし、MetaのLlama 2とMistralのMixtral 8x7Bオープンソースモデルを使用した。 Braveはユーザーデータを保存せず、ユーザープライバシー保護のために自社ホスティングモデルを使用している。 AnthropicのClaudeモデルにも対応しているが、デフォルト設定はオープンソースモデルになっている。 Replit Replitは、カスタムコード補完モデルに加えて、2024年4月にはHugging Faceの7Bパラメータモデルをファインチューニングし、Code Repair AIエージェントをリリースした。有料ユーザーはReplitのオープンソースモデルと他のクローズドソースモデルを切り替え可能で、多様な顧客ニーズに合わせたソリューションを提供している。レイヤー 4: 事前構築済みAIツールの利用企業が独自にAIモデルを構築せず、完成された生成AIツールを購入して利用するケースである。外部ツールの主な利点はコスト削減である。モデルを訓練したりファインチューニングしたりするよりも、特定のツールを購入する方が安価である。企業が外部AIツールを選ぶ主な理由は3つある: 一般的な知識調査およびブレインストーミングツールが必要な場合 - 例: BCGの研究によると、生成AIツールは業務生産性を高め、特に技術的な専門知識が不足している場合に役立つ。一般的なビジネスツール（例: カスタマーサポートチャットボット）が必要な場合 - 独自モデルを構築するよりも、サードパーティーツールを使って迅速に効果を得る方が費用対効果が高い。特定業界向けの専用ツールがすでに開発されている場合 - 例: 法務契約レビュー用ツールのKiraは、多くの法律事務所で活用されている。 Boston Consulting Group (BCG) BCGは、世界中に32K人の従業員を擁し、$12.3Bの売上を上げるグローバルなコンサルティング企業である。 2023年、BCGはOpenAIのChatGPTを使って社内実験を実施し、生成AIが創造的な作業で40%の成果改善を示した。例: 新しい靴製品のアイデア創出、マーケティングスローガン作成などの創造的な問題解決で成果が向上した。 2024年、BCGはChatGPT Enterpriseを全従業員に導入し、AIツールの高い有用性を認めた。 Dollar Shave Club Dollar Shave Clubは、Unileverに**$1B**で買収された後、Nexus Capital Managementに売却されたシェービング用品の供給企業である。独自チャットボットの代わりにZendeskのAnswer Botを使ってカスタマーサポートを自動化している。 Answer Botは12M件の顧客インタラクションデータを学習し、簡単な顧客の質問に数秒で回答する。毎月4.5K件のチケットを解決しており、同社の総チケット件数の10%を占める。 Law Firms (法律事務所) 法務契約レビューは複雑な用語や条項に満ちている。多くの法律事務所は社内AIツールを開発するリソースが不足しているため、Kiraのような外部AIツールを活用している。例: Skadden、Hogan Lovells、Paul, Weissなどの大手法律事務所は、Kiraを使って契約レビュー時間を**最大60%**短縮している。 Kiraは1K件以上の一般的な条項およびデータポイントを迅速に分析できるため、M&Aデューデリジェンスや融資契約レビューなどに使用されている。ロングテール企業がAIを活用する3つの方法 Long Tailに属する企業は、Bloombergが金融の専門家向けにカスタムツールを開発したり、BCGのコンサルタントがChatGPTを生産性ツールとして活用したりするなど、さまざまな形で生成AIを適用している。これらのツールを動かすモデルも、Canvaの画像生成モデルからRampのGPT統合モデルまで多岐にわたる。 AIを導入する企業のパターンを見ると、現在の技術進化の速さにもかかわらず、次の3つの主要トレンドが際立っている。 AIを既存ビジネスを補完するツールとして利用 Long Tail企業の大半は、すでに十分に確立された製品やサービスを提供しており、AIはそれらを補完し改善する役割を担っている。例: ReplitはAIツールをリリースする前からすでに成功しており、AIは既存の開発者向けツールの延長線上で製品改善に使われている。 BraveのLeo AIは、ブラウザのプライバシー優先ポリシーを拡張した生成AIツールである。Braveは8年間にわたってプライバシー保護に取り組んできており、Leoはその原則を受け継ぐツールである。 Walmartにとって重要なのは低価格と柔軟な返品ポリシーであり、AIはそれを補助する役割を果たすにすぎず、中核戦略を置き換えるものではない。結論として、企業はプロセス効率を高めるためにAIを社内導入する一方で、中核となるユーザー体験が優先される。同業界のAI戦略を複製企業は成功したAI戦略を素早く採用することで競争力を維持している。例: BCGはChatGPTを活用して創造的作業やコーディング作業の成果を大幅に向上させた。こうした結果は、他のコンサルティング会社であるMcKinseyやBainにも類似のAIツールの導入を促す可能性がある。 BraveとVMwareは異なる中核製品を提供しているが、どちらもデータプライバシーを重視しており、そのためにオープンソースモデルを選択している。もし先行企業がAI導入によって持続的な競争優位を確保するなら、他の企業も同様のAI戦略を採用せざるを得ないとみられる。柔軟なAI戦略を維持 AIの活用方法は固定されておらず、企業はさまざまな戦略を適用または修正できる。例: OpenAIは当初、より大きなモデルを次々と構築していたが、2024年にはGPT-4o miniのような小型で効率的なモデルをリリースした。これはコスト削減と高速な推論を実現する。 RampのCTOは、GPT-4o miniが要求の90%を満たすと述べ、大規模モデルより小規模モデルのほうが効率的な場合があると評価している。 BasetenのCEOであるTuhin Srivastavaは、企業には独自モデルを構築しようとする傾向があるものの、そのために過大なリソースと時間が費やされる可能性があると指摘している。 Srivastavaの助言: **「まず確かなツールを使い、段階的に独自モデルへ置き換える」**という戦略が重要である。企業は新しいAI技術が登場した際に柔軟に対応できる位置にいなければならず、そうすることで急速に改善された技術を活用できる。 Long Tail企業の最終目標現在、AIへの関心と熱気はモデル企業やAIネイティブ企業に集中しているが、非AIネイティブ企業の間でもAI活用事例はますます目立つようになっている。これらの企業は、カスタマーサービスのチャットボットから拡張現実のショッピング体験まで、さまざまなAIソリューションを導入している。 AIイノベーションのスピードを踏まえると、Long Tail企業がAIをどのように使っているかを理解する最も簡単な方法は、このディープダイブで示した4つのレイヤーに分類することだ。カスタムモデル、クローズドソースモデル、オープンソースモデル、サードパーティのAIツールこのディープダイブで扱ったさまざまな事例は、企業が異なるAIツールをどのように構築し採用してきたかを示しており、読者が自組織でAI統合にどう取り組むべきかを理解する助けになる。 4つのレイヤーはそれぞれ、学習時間、コスト、カスタマイズ、プライバシー、品質に関するトレードオフを提示するが、モデル間の切り替えコストが低いため、顧客はさまざまなソリューションを試す柔軟性を持てる。 Long Tail企業の最終目標はAI企業になることではなく、AIツールを活用して中核ビジネスを補完し加速させることである。

(research.contrary.com)

12 ポイント投稿者 xguru 2024-11-18 | まだコメントはありません。 | WhatsAppで共有

2022年11月のChatGPT公開以降、AIスタートアップは投資家の強い関心を集めており、2024年第2四半期にはベンチャー資金全体の49%がAIおよび機械学習スタートアップに投資された。
OpenAIのようなモデル提供企業や、PerplexityやJasperのようなAIネイティブ企業が注目を集めている一方で、実際にはAIの影響を受ける「非AI」企業のほうが数は多い。
こうした非AI企業に及ぶAIの影響を、私たちは「AIのロングテール」と呼んでおり、このロングテールは企業がAIを統合する方法に応じて4つのカテゴリーに分けられる。
- 独自モデルの構築
- OpenAIのGPT-4のような既存モデルの活用
- MetaのLlamaのようなオープンソースモデルを基盤にした構築
- ChatGPTのような事前構築済みAIツールの利用
独立した独自モデルの構築は、AI活用の中で最もリソース集約的な方法であり、一般に大規模で独自性の高いデータソースを持ち、新たなモデルを訓練するのに十分な人的・財務的資源を持つ企業に適している。
OpenAIのGPTモデルやAnthropicのClaudeのようなクローズドソースモデルは、数十億から数兆のパラメータで訓練されており、コーディングから顧客対応まで幅広い分野で正確かつ詳細な結果を生成でき、API経由で容易に利用できる。
MistralやMetaのLlamaのようなオープンソースモデルは強力なツールであり、Llama 3.1は4050億のパラメータで訓練されている。クローズドソースモデルと異なり、オープンソースモデルは透明性と柔軟性を提供し、モデルの重みを調整して顧客の特定ニーズに合わせることができる。
ChatGPTのようなサードパーティー製AIツールは統合が最も容易で、利用企業は内部でモデルを構築または調整する必要なく、完成済みのツールを使うことができる。
AI戦略は企業ごとに異なるが、成功している企業はAIを既存事業の補完に使い、同業他社の成功事例を模倣しつつ、AI技術の進化に応じて柔軟性を保っている。

AIにおけるHypeのパワー法則

正規分布 vs. パワー法則: 正規分布はIQ、試験の点数、血圧など日常でよく見られる分布で、平均値の周辺にデータが集中する。一方、世の中の多くの現象は、少数の極端な事例が結果の大半を左右するパワー法則によって定義される。
- 例えば、2023年のS&P 500指数の上昇分の半分以上は、わずか1.4%にすぎない7銘柄が占めた。
- ベンチャーキャピタルでも、少数の成功投資がファンド収益の大半を占める。例として、Union Square Ventures創業者のFred Wilsonは「1件の投資でファンド全体の利益を生み出せる」と述べている。
AI分野におけるパワー法則: ドットコムバブル期にインターネット企業へ資本が集中したように、2024年にはAI分野が同様の熱狂を見せている。
- Y Combinatorの2024年夏コホートでは、**75%**がAI関連製品を開発中である。
- 2024年第2四半期のベンチャーキャピタル投資の**49%**がAIおよび機械学習スタートアップに集中した（2022年第2四半期は29%だった）。
- 2020年の初期段階AI、SaaS、フィンテック企業の評価額中央値はそれぞれ$25M、$27M、$28Mだったが、2024年には$70M、$46M、$50Mへと上昇した。
- OpenAIは赤字だったにもかかわらず、2024年10月に**$157B**の評価額で新規資本を調達した（売上高の39倍の評価）。
AIネイティブスタートアップの限界: 生成AIとLLMの登場により、AIは企業の中核製品として定着しつつある。しかし、AIネイティブ企業が投資家の関心を独占している一方で、非AI企業もAI技術の進歩の影響を受けている。大半の企業は本質的にAI企業ではないが、AIの進展はそれらのビジネスモデルに大きな影響を及ぼすだろう。
インターネットのロングテールからAIのロングテールへ: ドットコムバブル後、インターネットの潮流に適応した非インターネット企業が大きな成功を収めた。例えばWalmartは1962年設立だが、2023年のEC売上高は**$73Bに達し、2017年比で5倍**成長した。
- 今日では「AIのロングテール」が登場しており、これはフィンテック、SaaS、ヘルスケア、Eコマース、物流など多様な産業分野の非AI企業を含んでいる。
AIの広範な影響: 事前構築済みAIツールの利用から内部ワークフローへのAI統合まで、さまざまな業界の企業がAIを活用している、あるいは活用を試みている。インターネットが非インターネット企業に与えた影響と同様に、AIも単にAIモデルを構築する企業だけにとどまらない広範な影響を及ぼすだろう。

AIのロングテールの定義

AI企業はAIに対する関心と投資の大半を占めており、2つのカテゴリーに分けられる。
- モデル企業: OpenAI、Anthropic、Mistralのように、独自またはオープンソースのLLM（大規模言語モデル）を開発し、ユーザーに提供する企業。
- AIネイティブ企業: Perplexity、Jasperのように、AIモデルを基盤として製品やサービスを提供する企業。
最初のカテゴリーでは、モデル自体が製品である。2番目のカテゴリーでは、AIモデルが機能の中核を成すが、モデルがなければ企業そのものが存在しない。たとえばBasetenのCEOであるTuhin Srivastavaは、「モデルがなければAIネイティブ企業は存在しない」と説明している。
しかし、Bloomberg、Walmart、Canvaなど大半の企業はこれら2つのカテゴリーには属さない。こうした企業は、「AIのロングテール」と呼ばれる、より広い範囲に属している。
ロングテールにおける主要な問い
- AI技術の進歩は、ChatGPT公開以前から存在していたビジネスモデルにどのような影響を与えるのか。
- コンサルティング会社のアナリストからテック企業のソフトウェアエンジニアまで、さまざまな業界の従業員はAIをどのように使っており、今後どのように使うのか。
- 企業はAI市場でどのようにポジショニングしているのか。自社モデルを構築しているのか、それとも外部で開発されたツールを使っているのか。
さまざまな企業のAI活用事例
- 例: Ramp（経費管理プラットフォーム）とAtlassian（オーストラリアのSaaS企業）は、既存のデータとワークフローの上に生成AIを追加している。
- Klarna（スウェーデンのフィンテック企業）は内部業務の効率改善のためにAIへ投資しており、AIチャットボットはフルタイムのカスタマーサービス担当者700人分に相当する成果を示した。
- PwCは2024年5月に、10万人の従業員へChatGPT Enterpriseの機能を提供する契約を締結した。また、2024年の米国商工会議所の調査では、中小企業の98%がAIツールを使用していると回答した。
過去と現在の比較
- インターネットブーム後に非インターネット企業がEコマース導入によって大きな成功を収めた事例と同様に、「AIのロングテール」は多様な業界にまたがる非AI企業がAIの影響を受けることを示している。
- インターネットが非インターネット企業に広範な影響を及ぼしたように、AIも単にAIモデルを構築する企業に限定されず、より広い経済に影響を与えるだろう。
AIロングテールの4つのレイヤー
- 独立した社内AIモデルの構築: 独自データセットを活用して自社AIモデルを構築する企業。
- クローズドソースモデルの活用: OpenAI、Anthropicなどのクローズドソースモデルを利用する企業。
- オープンソースモデルの活用: Llama、Mistral、Hugging Faceのモデルを利用する企業。
- 事前構築済みAIツールの統合: すでに開発されたAIツールをワークフローに統合する企業。
これら4つのレイヤーは固定的なものではなく、さまざまな方法でAIを利用する企業は複数のレイヤーにまたがって分類されることがある。AI技術の急速な進歩に伴い、企業のAI活用方法も絶えず変化している。

レイヤー1: 自社モデルの構築

最もリソース消費の大きい戦略: AIのロングテールにおいて最もコストがかかる戦略は、独立したモデルをゼロから構築すること。この戦略に適した企業は、(1) 資本が豊富で、(2) 独自性があり価値の高いデータセットを保有している企業。
- 例: Sam Altmanによると、GPT-4の学習コストは $100M に達する。
- 自社モデルは高コストだが、独自データセットを保有する企業にとっては、(A) より精緻で企業向けに最適化された結果を提供し、(B) モデルと重みに対する完全な制御を可能にし、(C) クローズドソースモデルと比べてコスト削減の可能性をもたらす。
ブルームバーグ (Bloomberg)
- Bloomberg はニューヨークに本社を置く金融データ・メディア企業で、年間 $12B を超える売上を上げている。代表製品のBloomberg Terminalは全売上の約 2/3 を占める。
- Bloombergでは8,000人を超えるエンジニアのうち 350人以上 がAIエンジニアリングチームに所属しており、毎年さまざまなAI研究論文を発表している。
- 2023年3月、Bloombergは金融特化型LLMである BloombergGPT を発表した。このモデルは合計 50B パラメータで構成され、345Bの公開データセットと、40年にわたって収集した363Bの金融文書データセットを組み合わせて学習された。
- 学習コストは $2.7M から $10M 超と推定されている。
- 2024年1月、Bloombergは自社モデルとみられるAI生成要約機能をTerminalに導入し、これは社内アナリストの支援を受けて学習された。
Replit
- Replit はWebベースの統合開発環境 (IDE) で、コラボレーション機能やコード自動補完、デバッグ機能を提供している。
- ReplitのAI機能は、独自開発モデル、オープンソースモデルのファインチューニング、さらにOpenAIおよびAnthropicのクローズドソースモデルを組み合わせて提供される。
  - 2023年4月と10月、Replitは自社のコード補完モデルをリリースし、これをHugging Faceで公開した。
  - 2024年4月、オープンソースモデルをファインチューニングして自動デバッグ機能をリリースした。
  - 2024年9月、自社の 7Bパラメータモデル を基盤とする自動ペアプログラマーをリリースしたが、一部ユーザーは初期機能に不満を示した。
Canva
- Canva はオーストラリア拠点のWebデザインプラットフォームで、2024年10月時点で $49B の評価を受けている。
- 2023年10月、Canvaは Magic Studio という生成AIデザインスタジオをリリースした。このスタジオは、ユーザーが生成したコンテンツを学習データとして用いて「独自モデル」を構築している。
  - ユーザーデータは許可なく使用されず、参加したユーザーには報酬が支払われる。
- 2024年7月、Canvaは画像生成プラットフォーム Leonardo.Ai を買収し、Magic Studioに統合する計画を示した。
ウォルマート (Walmart)
- Walmart は2018年から顧客向けAIツールを構築しており、2024年6月にはすべての生成AI機能で自社モデルへ移行した。
  - 2024年10月、Walmartは Wallaby という小売特化型LLMを発表した。このモデルはWalmartのデータで学習され、カスタマーサービスに関連する自然な応答を生成する。
- WalmartはAIを活用して、顧客サポートチャットボット、商品カタログ整理、拡張現実ショッピング体験などを改善している。また、Robloxのようなオンラインプラットフォームで仮想ショッピング体験も提供している。
- Walmartは自社モデルを好む一方、特定のユースケースに応じて他社モデルも引き続き利用する計画。

レイヤー2: 既存のクローズドソースモデルの利用

独自にモデルを構築する代わりに、企業はOpenAIやAnthropicなどの クローズドソースAIモデル にAPIでアクセスし、自社ソリューションを構築できる。
クローズドソースモデル は多様な分野で高精度な出力を提供できるため、文字起こし、カスタマーサービス、データ抽出などの一般的な作業に有用。
- OpenAIのGPTおよびAnthropicのClaudeモデルは非常に高品質な出力を提供する。
APIアクセスの容易さ により、エンジニアリングの観点でAI導入が最もしやすい方法の1つとされる。
近年では、コスト効率と高速な推論性能を提供するために GPT-4o mini のような小型モデルも登場している。
Zapier
- Zapier はワークフロー自動化プラットフォームで、2011年に設立され、2023年8月時点で $5B の評価を受けている。
- OpenAIモデル を活用して社内自動化プロセスを改善しており、たとえば 会議の文字起こし生成と要約 機能や Web記事要約 機能などがある。
- Zapierの Copilot ツールは、自然言語プロンプトを使ってワークフローを作成できるようにする。
Klarna
- Klarna はスウェーデンのフィンテック企業で、「Buy Now, Pay Later」サービスを提供しており、2024年9月にはSalesforceとWorkdayを AIで置き換える と発表した。
- OpenAIモデル を活用したカスタマーサービスAIアシスタントを通じて、顧客サポート要請の 2/3 を処理し、フルタイム従業員700人分の業務量を代替している。
- 社内ではAIアシスタント Kiki を使い、従業員が毎日2,000件を超える質問に回答できるよう支援している。
Ramp
- Ramp は2019年設立の B2Bフィンテックスタートアップ で、さまざまな財務ソフトウェア製品を提供している。
- GPT-4およびClaude モデルを使って、契約書データ分析、取引分類、領収書メモ作成などを自動化している。
- 社内ではAIを使って顧客通話の要約や質疑応答機能を提供しており、これはSlackと統合されている。
Atlassian
- Atlassian はJira、Trello、Confluenceなどのチームコラボレーションソフトウェアを提供する $50B評価 の企業。
- 2023年4月に Atlassian Intelligence という生成AI機能を発表した。
- この機能はOpenAIモデルとAtlassianの自社モデルを組み合わせて利用している。
- AIアシスタント Rovo はJiraの検索機能を強化し、No-Codeエージェントを通じてマーケティングコンテンツ生成やフィードバック収集などを自動化する。
Canva
- Canva はMagic Studioで独自モデルを使用しているが、一部機能では クローズドソースモデル を活用している。
  - 例: OpenAIモデルを使用した ライティングエディタ は、アップロードされたサンプルのトーンに合わせてコンテンツを生成する。
- Canvaはまた、さまざまな AIアプリマーケットプレイス も運営しており、これにはOpenAIのDALL-E、GoogleのImagenアプリなどが含まれる。

レイヤー 3: オープンソースモデルベースの開発

独自にモデルを構築したり、OpenAIのGPT-4oのようなクローズドソースモデルを使ったりする代わりに、多くの企業がMetaのLlama、Mistral、Hugging Faceなどのオープンソースモデルを活用して独自ツールを構築している。
オープンソースモデルは、高度なカスタマイズ性と透明性、データプライバシーの強化、コスト削減という利点を提供する。
- Databricksの2024年レポートによると、LLMを利用する企業の**76%**がオープンソースを選択している。
オープンソースモデルは別途ライセンス費用が不要で、自社ホスティングが可能なため、大規模なクラウドコストを回避できる。
企業顧客にとっては、著作権問題やデータ漏えいリスクを低減できる点も重要な要因である。
VMware
- VMwareは仮想化ソフトウェアの提供企業で、2023年にBroadcomに**$69B**で買収された。
- VMwareはHugging Faceと協力し、SafeCoderというオープンソースベースのコーディングアシスタントを開発した。
- StarCoderという15.5Bパラメータモデルを活用しており、このモデルはオープンソースプロジェクトからデータを収集して著作権問題を最小化している。
- 企業顧客はStarCoderモデルを自社コードでファインチューニングできるため、ドメイン知識が必要な社内業務に役立つ。
Mathpresso
- Mathpressoは韓国のエドテック企業で、代表的なアプリQANDAを通じて、学生が数学の問題のスクリーンショットをアップロードすると自動で解答を提供する。
- 2023年、MetaのLlama 2モデルを使って、MathGPTという数学特化型LLMを開発した。
- MathGPTは学習データとしてQANDAの数学ソリューションを使用し、既存の商用モデルよりも高いカスタマイズ性と教育環境に合わせた精度を提供する。
- MathGPTはMATHおよびGSM8KベンチマークでMicrosoft Toraを上回り、13Bパラメータ以下のモデルの中で1位を獲得した。
Brave
- Braveはプライバシー保護を最優先とするWebブラウザで、広告ブロックやトラッカーブロックなどの機能を提供する。
- 2023年8月、LeoというAIアシスタントをリリースし、MetaのLlama 2とMistralのMixtral 8x7Bオープンソースモデルを使用した。
- Braveはユーザーデータを保存せず、ユーザープライバシー保護のために自社ホスティングモデルを使用している。
- AnthropicのClaudeモデルにも対応しているが、デフォルト設定はオープンソースモデルになっている。
Replit
- Replitは、カスタムコード補完モデルに加えて、2024年4月にはHugging Faceの7Bパラメータモデルをファインチューニングし、Code Repair AIエージェントをリリースした。
- 有料ユーザーはReplitのオープンソースモデルと他のクローズドソースモデルを切り替え可能で、多様な顧客ニーズに合わせたソリューションを提供している。

レイヤー 4: 事前構築済みAIツールの利用

企業が独自にAIモデルを構築せず、完成された生成AIツールを購入して利用するケースである。
外部ツールの主な利点はコスト削減である。モデルを訓練したりファインチューニングしたりするよりも、特定のツールを購入する方が安価である。
企業が外部AIツールを選ぶ主な理由は3つある:
- 一般的な知識調査およびブレインストーミングツールが必要な場合
  - 例: BCGの研究によると、生成AIツールは業務生産性を高め、特に技術的な専門知識が不足している場合に役立つ。
- 一般的なビジネスツール（例: カスタマーサポートチャットボット）が必要な場合
  - 独自モデルを構築するよりも、サードパーティーツールを使って迅速に効果を得る方が費用対効果が高い。
- 特定業界向けの専用ツールがすでに開発されている場合
  - 例: 法務契約レビュー用ツールのKiraは、多くの法律事務所で活用されている。
Boston Consulting Group (BCG)
- BCGは、世界中に32K人の従業員を擁し、$12.3Bの売上を上げるグローバルなコンサルティング企業である。
- 2023年、BCGはOpenAIのChatGPTを使って社内実験を実施し、生成AIが創造的な作業で40%の成果改善を示した。
- 例: 新しい靴製品のアイデア創出、マーケティングスローガン作成などの創造的な問題解決で成果が向上した。
- 2024年、BCGはChatGPT Enterpriseを全従業員に導入し、AIツールの高い有用性を認めた。
Dollar Shave Club
- Dollar Shave Clubは、Unileverに**$1B**で買収された後、Nexus Capital Managementに売却されたシェービング用品の供給企業である。
- 独自チャットボットの代わりにZendeskのAnswer Botを使ってカスタマーサポートを自動化している。
  - Answer Botは12M件の顧客インタラクションデータを学習し、簡単な顧客の質問に数秒で回答する。
- 毎月4.5K件のチケットを解決しており、同社の総チケット件数の10%を占める。
Law Firms (法律事務所)
- 法務契約レビューは複雑な用語や条項に満ちている。
- 多くの法律事務所は社内AIツールを開発するリソースが不足しているため、Kiraのような外部AIツールを活用している。
  - 例: Skadden、Hogan Lovells、Paul, Weissなどの大手法律事務所は、Kiraを使って契約レビュー時間を**最大60%**短縮している。
- Kiraは1K件以上の一般的な条項およびデータポイントを迅速に分析できるため、M&Aデューデリジェンスや融資契約レビューなどに使用されている。

ロングテール企業がAIを活用する3つの方法

Long Tailに属する企業は、Bloombergが金融の専門家向けにカスタムツールを開発したり、BCGのコンサルタントがChatGPTを生産性ツールとして活用したりするなど、さまざまな形で生成AIを適用している。
これらのツールを動かすモデルも、Canvaの画像生成モデルからRampのGPT統合モデルまで多岐にわたる。
AIを導入する企業のパターンを見ると、現在の技術進化の速さにもかかわらず、次の3つの主要トレンドが際立っている。
- AIを既存ビジネスを補完するツールとして利用
  - Long Tail企業の大半は、すでに十分に確立された製品やサービスを提供しており、AIはそれらを補完し改善する役割を担っている。
    - 例: ReplitはAIツールをリリースする前からすでに成功しており、AIは既存の開発者向けツールの延長線上で製品改善に使われている。
    - BraveのLeo AIは、ブラウザのプライバシー優先ポリシーを拡張した生成AIツールである。Braveは8年間にわたってプライバシー保護に取り組んできており、Leoはその原則を受け継ぐツールである。
    - Walmartにとって重要なのは低価格と柔軟な返品ポリシーであり、AIはそれを補助する役割を果たすにすぎず、中核戦略を置き換えるものではない。
  - 結論として、企業はプロセス効率を高めるためにAIを社内導入する一方で、中核となるユーザー体験が優先される。
- 同業界のAI戦略を複製
  - 企業は成功したAI戦略を素早く採用することで競争力を維持している。
    - 例: BCGはChatGPTを活用して創造的作業やコーディング作業の成果を大幅に向上させた。こうした結果は、他のコンサルティング会社であるMcKinseyやBainにも類似のAIツールの導入を促す可能性がある。
    - BraveとVMwareは異なる中核製品を提供しているが、どちらもデータプライバシーを重視しており、そのためにオープンソースモデルを選択している。
  - もし先行企業がAI導入によって持続的な競争優位を確保するなら、他の企業も同様のAI戦略を採用せざるを得ないとみられる。
- 柔軟なAI戦略を維持
  - AIの活用方法は固定されておらず、企業はさまざまな戦略を適用または修正できる。
  - 例: OpenAIは当初、より大きなモデルを次々と構築していたが、2024年にはGPT-4o miniのような小型で効率的なモデルをリリースした。これはコスト削減と高速な推論を実現する。
  - RampのCTOは、GPT-4o miniが要求の90%を満たすと述べ、大規模モデルより小規模モデルのほうが効率的な場合があると評価している。
    - BasetenのCEOであるTuhin Srivastavaは、企業には独自モデルを構築しようとする傾向があるものの、そのために過大なリソースと時間が費やされる可能性があると指摘している。
    - Srivastavaの助言: **「まず確かなツールを使い、段階的に独自モデルへ置き換える」**という戦略が重要である。
    - 企業は新しいAI技術が登場した際に柔軟に対応できる位置にいなければならず、そうすることで急速に改善された技術を活用できる。

Long Tail企業の最終目標

現在、AIへの関心と熱気はモデル企業やAIネイティブ企業に集中しているが、非AIネイティブ企業の間でもAI活用事例はますます目立つようになっている。
- これらの企業は、カスタマーサービスのチャットボットから拡張現実のショッピング体験まで、さまざまなAIソリューションを導入している。
  - AIイノベーションのスピードを踏まえると、Long Tail企業がAIをどのように使っているかを理解する最も簡単な方法は、このディープダイブで示した4つのレイヤーに分類することだ。
    - カスタムモデル、クローズドソースモデル、オープンソースモデル、サードパーティのAIツール
このディープダイブで扱ったさまざまな事例は、企業が異なるAIツールをどのように構築し採用してきたかを示しており、読者が自組織でAI統合にどう取り組むべきかを理解する助けになる。
- 4つのレイヤーはそれぞれ、学習時間、コスト、カスタマイズ、プライバシー、品質に関するトレードオフを提示するが、モデル間の切り替えコストが低いため、顧客はさまざまなソリューションを試す柔軟性を持てる。
Long Tail企業の最終目標はAI企業になることではなく、AIツールを活用して中核ビジネスを補完し加速させることである。