2024年のML/AI/Data業界マップと最新トレンド
(mattturck.com)1枚の画像で整理した2024年MAD(ML、AI、Data)業界マップと、今年の24のテーマの説明
[Part I : Landscape]
- 2012年の初版では139社しかなかったが、2024年のMADエコシステムには2,011社が含まれている
- これは前年の1,416社から578社が新たに追加されたもの
- これほど多くの企業が含まれている理由は、この10年余りの間にデータインフラ技術とML/AI技術という2つの巨大な技術進化の波が相次いで起きたため
- 1つ目の波は、ビッグデータから始まりモダンデータスタックで終わる、およそ10年間のデータインフラ技術の進化
- 2つ目の波は、生成AI(Generative AI)から始まったML/AI技術の進化
- MADエコシステムは、データ収集から保存、処理、分析、そしてアプリケーションによる価値提供に至るまで、データのライフサイクル全体を示すことに焦点を当てている
インフラと分析領域の主な変化
- データインフラ領域(MADエコシステムの左側)では、最近大きな変化はなかった
- "Database Abstraction" を "Multi-Model Databases & Abstractions" に変更し、SurrealDB、EdgeDBなどのall-in-oneマルチモデルDBの登場を反映した
- 昨年試験的に作成した "Crypto / Web 3 Analytics" セクションは削除した
- "Query Engine" セクションも削除した(該当企業は引き続き含まれている)
機械学習と人工知能領域の主な変化
- 2023年のAI企業の爆発的増加により、この領域で最も多くの構造的変化があった
- MLOpsの隣に3つの新しいカテゴリーを追加した
- "AI Observability": LLMアプリケーションをテスト、評価、監視するスタートアップ
- "AI Developer Platforms": MLOpsに似ているが、LLMの訓練、デプロイ、推論に焦点を当てたAIアプリケーション開発プラットフォーム
- "AI Safety & Security": LLM固有の懸念事項(hallucination、倫理、規制順守など)を扱う企業
- "Horizontal AI/AGI" を "Commercial AI Research" と "Nonprofit AI Research" の2カテゴリーに分割した
- "GPU Cloud" を "GPU Cloud / ML Infra" に変更し、GPUクラウドプロバイダーの中核的なインフラ機能の追加を反映した
アプリケーション領域の主な変化
- アプリケーション層のすべての企業が、いまや自らを "AI企業" と呼んでいる
- "Horizontal Applications" に "Presentation & Design" カテゴリーを追加
- "Search" を "Search / Conversational AI" に変更し、PerplexityのようなLLMベースのチャットボットインターフェースの登場を反映した
- "Industry" では "Gov't & Intelligence" を "Aerospace, Defense & Gov't" に変更した
オープンソースインフラ領域の主な変化
- "Data Access" と "Data Ops" を包括する単一の "Data Management" カテゴリーを新設
- AIとLLMをローカル開発環境に持ち込むためのインフラツールを提供する "Local AI" という新しいカテゴリーを追加
[Part II: 2024年の24のテーマ]
1. 構造化データ vs 非構造化データ
- データには、行と列に当てはめられる構造化データと、テキスト・画像・音声・動画のような非構造化データがある
- 構造化データは分析目的で抽出・保存・変換され、BIツールで可視化されたり、従来型のML/AIモデルに使われたりする
- 非構造化データは主に生成AIモデル(LLMなど)を訓練し、利用(推論)するために使われる
- 現在は非構造化データ(ML/AI)が注目を集めている一方、構造化データ(モダンデータスタックなど)はそうではない
2. モダンデータスタックは死んだのか?
- モダンデータスタック(MDS)は構造化データのパイプラインを扱うもので、少し前まではソフトウェア業界で最も注目される概念の1つだった
- MDSはクラウドデータウェアハウスを中心に、上流にFivetran/Airbyte、中間にDBT、下流にLooker/Modeなどが位置する構造だった
- Snowflakeが史上最大規模でIPOに成功したことでMDSへの関心が爆発し、それが過熱したスタートアップ設立とVC投資につながった
- データカタログ、データオブザーバビリティ、ETL、リバースETLなど複数のカテゴリーが1〜2年で飽和状態に達した
- MDSは実際の問題に対する解決策でもあったが、同時にデータバリューチェーン上の複数スタートアップ間のマーケティング提携でもあった
- しかし現在のMDSは、①複数ベンダーのソリューションを組み合わせる必要がありコストが高いこと、②生成AIに押されてもはや注目を集められないことなどの圧力に直面している
3. データインフラ領域の統合と大手企業の成長
- 2024年のデータインフラと分析業界では、次のようなことが起こる見込み:
- 多くのMDS関連スタートアップが「AIインフラスタートアップ」へとポジショニングを転換しようとするだろう
- 一部は成功するかもしれないが、大半は構造化データから非構造化データへの移行のために、製品の根本的な進化が必要になるだろう
- データインフラ業界はついに一定レベルの統合を経験するだろう
- これまでM&Aは限定的だったが、2023年にはStemma(Teradataが買収)、Manta(IBMが買収)、Mode(Thoughtspotが買収)など、中小規模のM&Aが起きた
- スタートアップの失敗事例が大幅に増えるだろう
- VC資金が枯渇し、状況は悪化の一途をたどっている。多くのスタートアップが大幅なコスト削減を行ったものの、最終的には資金枯渇に直面するだろう。華やかな見出しは期待しにくそうだ
- 規模のある企業はプラットフォーム化にさらに注力するだろう
- M&Aを通じても進むだろうが、自社開発によってもより多くの機能を取り込もうとするはずだ
- 多くのMDS関連スタートアップが「AIインフラスタートアップ」へとポジショニングを転換しようとするだろう
4. Databricks vs Snowflake の現況
- 構造化データ業界のSnowflakeは依然として優れた企業であり、テック株の中でも最も高いバリュエーションを受けている(PER 14.8倍)
- ただし、多くのソフトウェア企業と同様に成長は大きく鈍化している
- 2024会計年度の売上高は前年比38%増の26.7億ドル、今後12カ月の予想成長率は22%
- 何よりも、製品イノベーションで苦戦しているような印象を与える
- AI対応が遅く、M&Aにも消極的
- 最近のやや突然なCEO交代も興味深いシグナルだ
- ただし、多くのソフトウェア企業と同様に成長は大きく鈍化している
- 非構造化データ業界のDatabricksは、全体として強いモメンタムを見せている
- 2024会計年度の売上高は16億ドルで、50%以上成長したと報じられている(非上場企業)
- Databricksは生成AIの主要企業として台頭している
- MosaicMLを13億ドルで買収するなど、M&Aと自社製品開発の両面で積極的だ
- LLMに供給される非構造化データの中核的な保存先であるだけでなく、Dollyから新たに発表した DBRX に至るまで、さまざまなモデルも自ら開発している
- 両社の競争構図における新たな変数は、MSのFabric投入だ
- 2023年5月に発表されたFabricは、エンドツーエンドのクラウドベースデータ分析SaaSプラットフォーム
- MSのデータレイクOneLake、BIツールPowerBI、Synapseなどを統合し、データ統合からエンジニアリング、データサイエンスまで全領域をカバーする
- 発表内容と実際の製品には隔たりがあるだろうが、MSの生成AI投資と組み合わされば強力な脅威になり得る
- Databricksが主にMSのクラウドAzure上で動いている点も興味深い
5. 2024年のBIの現況と、生成AIは分析を変えるのか?
- MDSと構造化データパイプライン領域の中で、最も再発明が切実に求められていた分野はBIである
- 2019年のMADで、BI業界の統合がほぼ完了していることを指摘しており、2021年にはメトリクスストアの登場を取り上げた
- しかし、BI/分析の変革は予想よりも遅々として進んでいる
- 依然としてPower BI、Tableau、Lookerなどの古い製品群が市場を支配しており、これらはしばしばより大きな営業契約に抱き合わせで無償提供されることもある
- 追加の統合も一部で起きており(ThoughtSpotによるMode買収、SnowflakeによるSisu買収)、dbt(セマンティックレイヤー/MetricFlow)、Trace(メトリクスツリー)など革新的なアプローチを試みる若い企業もあるが、まだ初期段階である
- 一方で生成AIは、データ抽出/変換だけでなく分析そのものにも大きな影響を与えうる
- OpenAIのCode Interpreter(現Advanced Data Analysis)、MSのExcel向けファイナンスチャットボットなど、活発な動きが見られた
- クラウドベンダー、Databricks、Snowflake、オープンソース陣営、多数のスタートアップが、自然言語でDBクエリを実行する「text to SQL」製品を開発中、またはすでに投入している
- これは興味深く、潜在的に破壊的な変化を予告している
- 分析の民主化は長年の宿願だったが、自然言語がノートブック/DB/BIツールのインターフェースになれば、はるかに多くの人が分析を実行できるようになるだろう
- しかし、BI業界の内部には懐疑的な見方もある
- SQLの精密さと、クエリの背後にあるビジネス文脈を理解することが、自動化の障害になるという指摘
6. モダンAIスタックの台頭
- ここまでの議論のかなりの部分は、構造化データパイプラインに関するものだった
- 非構造化データインフラは、構造化データインフラとは大きく異なる局面を迎えている。LLMに供給するデータへの需要が非常に高い
- 生成AIを実験または導入するすべての企業が、「データは新たな石油」というクリシェを再発見している
- 誰もがLLMの力を求めているが、自社のデータで学習されたモデルを望んでいる
- 大企業とスタートアップの双方が、生成AI向けインフラを提供するため競うように参入している
- 複数のAIスケールアップ企業が、勢いをつかもうと積極的に製品を進化させている
- Databricks、Scale AI(自動運転車向けラベリングインフラを、OpenAIなどとの提携を通じて企業向けデータパイプラインへ発展)、Dataiku(マルチベンダー/マルチモデル向けのLLM Meshを投入)など
- 一方で、新世代のAIインフラスタートアップが複数の領域で登場している
- ベクターDB: 生成AIモデルが利用できる形式(ベクトル埋め込み)でデータを保存する。Pinecone、Weaviate、Chroma、Qdrantなどの専門ベンダーが急成長しており、MongoDBなど既存のDB企業もベクトル検索機能の追加に積極的である。一方で、コンテキストウィンドウの拡大がベクターDBを不要にするのではないかという議論もある
- フレームワーク: LlamaIndex、LangChainなど、複数の要素を接続し調整する役割
- ガードレール(Guardrails): LLMとユーザーの間に入り、組織のルールを順守する出力を実現する
- 評価ツール(Evaluators): 生成AIモデルの性能をテスト/分析/監視する。公開ベンチマークへの不信感のため、難しい課題と認識されている
- ルーター: ユーザークエリをリアルタイムで複数モデルに分散し、性能/コスト/体験を最適化する
- コスト管理: LLM利用コストを監視する
- エンドポイント: モデルなど基盤インフラの複雑さを抽象化するAPI
- MDSの前例を見ると、「モダンAIスタック」という用語を使うことには慎重である
- とはいえ類似点は多い。これらのスタートアップは、過去のMDS企業のように「hot」で、群れをなし、マーケティングや製品提携を結んでいる
- この新しいAIインフラスタートアップ世代は、MDS企業と似た課題に直面するだろう
- 各カテゴリーは、数十億ドル規模の企業を生み出すのに十分な大きさがあるのか?
- どの部分をビッグテック(クラウド企業、Databricks、Snowflakeなど)が自前で作ってしまうのか?
7. AIハイプサイクル、今どこにいるのか?
- AIは数十年にわたり、AIの夏と冬を繰り返してきた。過去10〜12年だけを見ても、3回のハイプサイクルがあった
- 第1波: 2013〜2015年、ImageNet 2012以降ディープラーニングが注目を集め始めた時期
- 第2波: 2017〜2018年ごろ、チャットボットブームとTensorFlowの台頭
- 第3波: 2022年11月以降の現在まで、生成AI
- 今回のハイプサイクルは、AIバブルと感じられるほど特に強烈である。これはいくつかの理由による
- 技術そのものが驚異的に印象的で、テック領域を超えて一般大衆にも直感的に響く
- 未投資資金(ドライパウダー)を多く抱えるVCにとって、他の技術分野がすべて低迷する中で唯一の投資先だった
- ハイプにはいつものように多くの利点(「熱狂的な情熱なくして偉大な達成はない」「百花繚乱」式の野心的なプロジェクトに資金が集まる)と欠点(一夜にして誰もがAI専門家になり、あらゆるスタートアップがAI企業になり、AIカンファレンス/ポッドキャスト/ニュースレターが氾濫し、AIマーケットマップが洪水のように増える)が伴う
- しかし、ハイプサイクルの最大の問題は、避けがたい反動である
- 現在の局面には、さまざまな「奇妙さ(quirkiness)」とリスクが内在している
- 代表的企業(OpenAI)の特殊な法的/ガバナンス構造
- 十分に理解も公開もされていない「計算資源の提供と引き換えに持分を受け取る」取引の横行(round-trippingの可能性もある)
- 多くの有望スタートアップが、AI研究者主導の経営体制であること
- ゼロ金利時代を思わせるVCの取引行動(「陣取り合戦」、巨大ラウンド、設立間もない企業に目がくらむようなバリュエーション)
- AIハイプにひびが入り始めている兆候もあるが(下記参照)、まだ毎週のように新しい何かが皆を驚かせる局面である。サウジの400億ドルAIファンドの話などを見ると、当面は資金流入が止まりそうにない
8. 実験か、現実か? 2023年は見せかけだったのか?
- ハイプを踏まえると、ここまでどれほど実質的な進展があったのか、単なる実験にとどまっていなかったかを振り返る必要がある
- 2023年は非常に慌ただしい1年だった
- あらゆるテック企業が製品に生成AIを組み込むことを急ぎ
- グローバル2000企業の取締役会はこぞってAI導入を指示し、Morgan Stanley/Citigroupのような規制産業の企業でさえ記録的なスピードで導入を進めた
- 消費者は生成AIアプリに熱狂的な関心を示した
- その結果、OpenAI($2B ARR)、Anthropic(2024年予想売上 $850M)、Midjourney(資金調達なしで40人が$200M売上)、Perplexity(MAU 0→1000万)などが大きな成功を収めた
- しかし、冷笑的に見るべきだろうか。いくつかの懸念がある
- 企業の支出がPoCや目立つ成果にとどまることが多く、イノベーション予算から出ている場合が多かった
- 実際のビジネス課題の解決というより、経営陣が出遅れているように見られたくなくて推進しただけではないか?
- 消費者向けアプリは離脱率が高い。単なる物珍しさにすぎなかったのではないか?
- 個人でも業務でも、生成AIをどう活用すべきかよく分からないという人が多い
- 最高のAI専門家が作った製品であっても、すべてが魔法のように機能するわけではない
- $1.3Bを調達しながら、むなしく幕を閉じたInflection AIの事例をどう見るべきか。世の中に別のAIチャットボットやLLMはもう必要ないことの証左なのだろうか?
- 企業の支出がPoCや目立つ成果にとどまることが多く、イノベーション予算から出ている場合が多かった
9. LLM企業は、そこまでコモディティ化していないのでは?
- LLM企業には、ベンチャーキャピタルや企業資金による莫大な投資が行われている
- この18か月で最もよく聞かれた問いはこれだ。私たちは最終的にコモディティ化する製品に莫大な資本が焼却される光景を見ているのか。それとも、これらのLLM企業が新たなAWS、Azure、GCPになるのか。
- LLM企業にとって悩ましい事実は、どのLLMも持続的な性能優位を築けていないように見える点だ
- 現時点ではClaude 3 SonnetやGemini Pro 1.5がGPT-4より優れ、GPT-4はGemini 1.0 Ultraより優れている、といった具合だが、こうした優劣は数週間ごとに入れ替わっているようだ
- 性能の変動性もある。ChatGPTは一時期「正気を失い」「怠惰になった」が、その後一時的に回復した
- これに加えて、オープンソースモデル(Llama 3、Mistral、DBRXなど)の性能も急速に追い上げている
- 一方で、当初の予想よりはるかに多くのLLM企業が市場に登場している
- 数年前までは、トランスフォーマーのスケーリングに必要な専門性を持つ人材が世界的にもごくわずかだという理由から、LLM企業は1社か2社に限られ、勝者総取りの構図になるという見方が支配的だった
- しかし、優秀なチームは思っていたよりも多いようだ
- OpenAI、Anthropicに加え、Mistral、Cohere、Adept、AI21、Imbue、01.AIなど、基盤AI研究を行うスタートアップが多数あり、GoogleやMetaなどのチームもある
- それでも現時点でLLM企業は悪くない成果を出している。OpenAIとAnthropicは非常に速いペースで売上を伸ばしている
- LLM「モデル」はコモディティ化するかもしれないが、LLM「企業」には依然として巨大な事業機会がある
- 彼らはすでに、基盤モデルの上に消費者向け・企業向け・開発者向けのアプリケーションやツールを提供する「フルスタック」企業になっている
- クラウド企業とのアナロジーはかなり適切に見える
- AWS、Azure、GCPはアプリケーション/ツール層を通じて顧客を獲得・維持し、おおむね差別化されにくいコンピューティング/ストレージ層を通じて収益を上げている
10. ハイブリッドな未来: LLM、SLM
- 大規模LLM(GPT-3、GPT-4、GPT-5など)への関心は高いが、SLM(small language model)も急速に進化している
- MetaのLlama-2-13b、MistralのMistral-7b/Mixtral 8x7b、MSのPhi-2/Orca-2など
- SLMは運用コストが低く、ファインチューニングしやすく、性能も優れている
- 特定の作業(コーディング、金融など)に特化したモデルも登場している
- Code-Llama、Poolside AIなどのコーディング特化モデル
- Bloombergの金融モデル、Orbital Materialsの材料科学モデルなど、業界特化モデル
- 企業では、こうした多様なモデルを組み合わせたハイブリッドアーキテクチャへと急速に進化している
- 価格は下がってきているものの、大規模なプロプライエタリLLMは依然として高価で、レイテンシの問題もあるため、ユーザー/顧客はますます多様なモデルを組み合わせて展開するようになるだろう
- 大規模/小規模、商用/オープンソース、汎用/特化モデルを、ニーズと予算に応じて組み合わせて使う流れだ
11. 従来型AIは死んだのか?
- ChatGPTの登場により、それ以前まで最先端と見なされていたAI技術が一夜にして「従来型AI」と呼ばれるようになった
- しかし従来型AI(あるいは予測AI)は構造化データを扱い、生成AIとは相互補完的な関係にある
- 従来型AIはすでに数多くの企業で大規模に利用されている
- 今後、企業はLLMをどの業務に使い、従来型AIモデルをどの業務に使うのか、そして両者をどう組み合わせるのかを考えることになるだろう
12. 薄いラッパー、厚いラッパー、そしてフルスタック化競争
- 薄いラッパー(thin wrapper): OpenAIのような他社技術に依存する製品、という否定的な意味で2023年に流行した用語
- Jasperのようなスタートアップの苦境がそれを裏づけている
- しかし時間がたつにつれて、差別化の方法も見えてきている
- 特定の(垂直的な)課題に集中する
- ワークフロー、コラボレーション、深い統合機能を確保する
- モデルのファインチューニングやハイブリッドシステムの構築など、AIモデル層の作業を行う
- つまり、フルスタック(アプリケーション+インフラ)にならなければならず、同時に特化(narrow)もしなければならない
13. 注目すべき領域: AIエージェント、Edge AI
- AIエージェントは自動化の最終段階として大きな関心を集めている
- ただし、生成AIはまだ脆弱な面を見せており、期待に届いていない
- AIシステムへのメモリ機能の追加など、補完が必要だ
- それでも、今後1〜2年で最も興味深い分野になると見られる
- Edge AIも注目されている
- GPUなしでデバイス内で動作するモデルは長年の悲願だった
- スマートフォンやIoT機器などへの適用で大きな可能性がある
- Mixtral、Ollama、Llama.cppなど、活発なオープンソースプロジェクトが進んでいる
14. 生成AIはAGIへ向かっているのか、それとも停滞しているのか?
- 技術の急速な進歩にもかかわらず、生成AIが ① 資源(計算、データ)の限界に突き当たる、あるいは ② 推論能力の欠如によって限界に直面する可能性があるという懸念がある
- 2018年にも同様の議論があり、その後は資源投入の拡大が目立った
- 推論(reasoning)の分野では、DeepMindのAlphaGeometryなど意味のある進展があった
- 資源の限界は評価が難しい。計算量は増え続けており(NVIDIA Blackwell)、データについても合成データ生成などで乗り越える余地がありそうだ
- スタートアップエコシステムの参加者にとっては、GPT-5の性能がGPT-4に比べてどれほど向上するかが、技術進歩の速度を測るバロメーターになるだろう
- たとえ生成AIの進歩が今すぐ止まったとしても、しばらくは十分な事業機会があるように見える
15. GPU戦争(NVIDIAは過大評価されているのか?)
- 計算能力が世界で最も貴重な資源になる新時代なのか、それともGPUの過剰生産によるバブルなのか。
- NVIDIAはAI対応GPU市場を事実上独占し、株価が5倍に跳ね上がるなど好況を享受している
- VCがAIに投資した資金がNVIDIAに流れ込んでいるからかもしれない
- しかし、ハードウェア製造(TSMCの工場)は容易ではなく、NVIDIAの運命は現在の好況が持続可能かどうかにかかっている
- AMD、Intelなど競合他社の挑戦もあるが、長期的にはAIチップメーカーの見通しは明るいように見える
16. オープンソースAI、多すぎるのか?
- この1年でオープンソースAIは大きな脚光を浴びた
- MetaのLlama、Mistral、GoogleのGemmaなどが注目され、HuggingFaceも多数のモデルをホスティングしながら成長を続けている
- 生成AI分野で最も革新的な取り組みのかなりの部分がオープンソースコミュニティで行われている
- しかし、オープンソースコミュニティには過熱の兆候も出ている
- 数十万のオープンソースAIモデルが公開されたが、その大半はおもちゃレベルか週末プロジェクトにとどまる
- ランキングが頻繁に入れ替わり、数日で有名になっては消えるモデルも多い
- 市場は自浄作用を通じて、少数の成功したオープンソースプロジェクトだけがクラウド企業などの支援を受けるようになるだろう。しかし、それまでは混乱した状況が続く見通しだ
17. AIコストは実際いくらなのか?
- 生成AIの経済性は急速に進化しているテーマだ
- 検索市場でGoogleに挑戦するには、10件のリンクを提示するコストよりもAIベースの回答を提供するコストを低くしなければならない
- AIベースのソフトウェア企業は、推論コストが売上総利益を食いつぶさないようにしなければならない
- AIモデルの顧客/利用者にとっては朗報だ。価格引き下げ競争が予想より早く起きている
- オープンソースAIと商用推論ベンダーの登場により、顧客にとっての乗り換えコストは非常に低くなり、これはOpenAIとAnthropicへの圧力要因になっている
- 埋め込みモデルの価格が一斉に引き下げられたことがその一例だ
- 供給側の立場では、AIの構築/提供コストは依然として高い
- Anthropicは売上の半分以上をクラウドコストに費やしたという
- データライセンス費用も軽くない
- ユーザーの立場では、VC支援を受けた無料サービスを楽しむのも一つの方法だ
18. 巨大企業とAIの政治経済の変化: Microsoftが勝利したのか?
- 2022年末から提起されてきた問い: ビッグテックが生成AIの価値の大半を手にすることになるのか?
- AIでは、データ、計算資源、研究者が多いほど有利。ビッグテックはそれをよく理解しており、積極的に対応している
- MSは最も効果的に対応しているように見える(4次元チェスを指すかのように)
- OpenAIに130億ドルを投資
- オープンソースの競合Mistralと提携
- ChatGPTの競合であるInflection AIを買収
- Azureの売上も大きく成長中
- Google/AmazonはAnthropicと提携・出資し、AmazonはHugging Faceとも提携
- MetaはオープンソースAIに全面的に賭けている様子
- 中国発の変化も注目に値する
- スタートアップにどれだけ成長の余地があるかが焦点
- OpenAI、Anthropicなど少数は良いパートナーシップを通じて離陸速度を得たが
- 多くのスタートアップの将来は不透明
- Inflection AIの買収、Stability AIのCEO騒動などは「二軍」スタートアップの苦戦を示唆している
19. OpenAI熱狂 vs 冷笑
- OpenAIは依然として魅力的
- 企業価値860億ドル、高速な売上成長、創業者間の不和(?)、Sam Altmanはこの世代のスティーブ・ジョブズ
- 興味深い問い:
- OpenAIはあまりに多くのことをやろうとしているのではないか? 垂直にも水平にもAIのあらゆることをやろうとしているようだが、無理筋ではないか?
- 状況が似ていたCoinbaseの前例はある
- 競争が激化する状況で、非常に難しい挑戦になるだろう
- ChatGPTの問題、マーケットプレイス不振などは、OpenAIも困難に直面しうることを示唆している
- OpenAIとMSは決別するのか?
- MSの支援はOpenAIに大きな助けとなっている(リソース、企業顧客など)
- しかしMSはOpenAIに依存していないことを明確にしており(Mistralとの提携、Inflection AIの買収など)、独自のAI能力も十分にある
- 一方でOpenAIはMSだけに依存することを望まないかもしれない。別のクラウドへの展開を望む可能性がある
- OpenAIの巨大な野望とMSの支配力追求を考えると、両社が競合相手へと一変する可能性もありそうだ
- OpenAIはあまりに多くのことをやろうとしているのではないか? 垂直にも水平にもAIのあらゆることをやろうとしているようだが、無理筋ではないか?
20. 2024年は企業向けAIの年になるか?
- 2023年の企業のAI導入は概念実証レベルにとどまった
- 2023年に生成AIの最大の恩恵を受けたのは、AIコンサルティングで20億ドルの売上を上げたAccentureのような企業
- 2024年が企業向け生成AI元年になることを期待する空気がある(従来型AIはすでに広く導入されている状態)
- しかし、まだ解くべき課題は多い:
- ユースケースが開発者コパイロット、企業ナレッジ管理、顧客サービスチャットボットなど一部に限られている
- どのツールを選ぶべきかが曖昧(商用/オープンソース、大規模/小規模モデル、水平/垂直特化など、組み合わせが必要)
- 人材不足が深刻(開発者ですら採用が難しいのに、MLエンジニアはなおさら)
- 幻覚(hallucination)問題、ブラックボックス問題など、企業にとっては深刻なリスク
- ROIの検証が必要(Palo Alto Networksが出張管理コストを半減したなど、一部事例はある)
- 前向きな点は、企業がイノベーション予算ではなくOpEx予算を投入しようとしていること
- ただし、大規模導入までは3〜5年はかかりそうだ
21. AIはSaaSを殺すのか?
- この1年で流行したアイデアのひとつ
- AIのおかげでコーディング生産性が10倍に上がり、少人数の開発者でもカスタムSaaSを作れるようになれば、既存SaaSは不要になるという主張
- あるいはAIがHR/財務/営業などあらゆることを代替するようになれば、別個のソフトウェアは不要になるという主張も
- どちらのシナリオも完全な形で実現するのは難しそうだ
- むしろ既存SaaSにAIが組み込まれ、より強力になる可能性が高そうだ
22. AIはベンチャーキャピタルを殺すのか?
- AIがVCの企業選定と投資後の価値向上を自動化できるかどうかはさておき、AI時代にVCという資産クラスの規模が適切なのかについて議論が必要だ
- VCは小さすぎるのではないか?
- OpenAIのような企業には数十億ドル、さらに多くの資金が必要
- MSのような大企業がこうした資金のかなりの部分を提供している(計算資源の提供という形である可能性が高い)
- 一部のVCは大規模基盤モデル企業に投資しているが、従来のVCソフトウェア投資モデルとは距離がある
- AI投資にはメガサイズのファンドが必要かもしれない(サウジアラビアが米国VCと協力して400億ドルのAIファンドを組成するという話もある)
- VCは大きすぎるのではないか?
- AIで開発者の生産性が10倍になり、自動化された営業/マーケティングが可能になれば
- 少人数チームや、ひょっとすると1人会社でも数億ドルの売上を上げて上場できる時代が来るかもしれない
- 売上1億ドルの1人会社は、創業からEXITまで本当にVC資金が必要だろうか?
23. AIは消費者市場を蘇らせるか?
- ソーシャルメディア/モバイル時代以後、停滞期に入った消費者市場は、生成AIで反発できるだろうか?
- 興味深い領域:
- 検索: 数十年ぶりにGoogleへ挑戦状を突きつけたPerplexity AI、You.comなど、検索エンジンから回答エンジンへの進化を主導するスタートアップ群
- AIコンパニオン: ディストピア的な懸念はさておき、誰もが自分専用の、際限なく忍耐強く役に立つ伴侶を持てるとしたら?
- AIハードウェア: Humane、Rabbit、VisionProなど、消費者向けAIハードウェアの興味深い試み
- 超パーソナライズドなエンターテインメント: 生成AIツールが進化し低価格化する中、どのような新しい形の娯楽や芸術が生まれるのか?
24. AIとブロックチェーン: 荒唐無稽か、興味深いか?
- AIと暗号資産の出会いは、完璧なTwitterミームの題材だ
- しかし、計算資源、データ、人材などのAIリソースが少数企業に集中するのは懸念すべきこと
- ブロックチェーンの核心は、分散ネットワークを通じて参加者がリソースと資産を共有するようにすること
- 両者の間には探求に値する領域がある(数年前から考えてきたテーマ)
- Bittensor(分散AIプラットフォーム)、Render(分散GPUレンダリングプラットフォーム)、Arweave(分散データプラットフォーム)など、関連プロジェクトの加速が目立つ
- 暗号資産業界が自らを助けられるのか、それともAI関連のミームコインや詐欺へと堕してしまうのかが焦点だ
BONUS: 扱わなかったテーマたち
- AIは私たちを皆殺しにするのか? AI終末論者 vs AI加速主義者
- 規制、プライバシー、倫理、ディープフェイク
- AIはシリコンバレーでしか作れないのか?
[Part III: Financing, M&A & IPO]
Financing
- AI投資とそれ以外の分野への投資が鮮明に分かれる「二つの市場の物語」という様相を見せている
- 全体的な投資は引き続き減少しており、2023年には42%減の2,484億ドルを記録した。2024年最初の数カ月はやや回復傾向を見せているものの、まだ同様のトレンドにある
- データインフラは前述のさまざまな理由から資金調達が非常に低調で、Sigma ComputingとDatabricksがその例外的な事例だった
- 一方でAIはまったく別の話だった
- AI投資市場の特徴は次のとおり:
- 少数のスタートアップ、特にOpenAI、Anthropic、Inflection AI、Mistralなどに資本が集中
- MS、Google、NVIDIAなど企業投資家(CVC)の比率が異常に高い
- CVCの取引内容には、実際の現金と「コンピューティングパワー支援の対価として受け取った持分」との間に不透明さが存在
- 2023年MAD以降の注目すべき取引は次のとおり(時系列順、全一覧ではない):
- OpenAI(代表的な基盤モデル開発企業): 2回にわたり103億ドルを調達、企業価値860億ドル
- Adept(基盤モデル開発企業): 3.5億ドルを調達、企業価値10億ドル
- AlphaSense(金融リサーチプラットフォーム): 2回にわたり4.75億ドルを調達、企業価値25億ドル
- Anthropic(基盤モデル開発企業): 3回にわたり64.5億ドルを調達、企業価値184億ドル
- Pinecone(ベクトルDBプラットフォーム): 1億ドルを調達、企業価値7.5億ドル
- Celestial AI(光インターコネクトプラットフォーム): 2回にわたり2.75億ドルを調達
- CoreWeave(GPUクラウド): 4.21億ドルを調達、企業価値25億ドル
- Lightmatter(光チップ開発企業): 2回にわたり3.08億ドルを調達、企業価値12億ドル
- Sigma Computing(クラウド分析プラットフォーム): 3.4億ドルを調達、企業価値11億ドル
- Inflection(基盤モデル開発企業): 13億ドルを調達、企業価値40億ドル
- Mistral(基盤モデル開発企業): 2回にわたり5.28億ドルを調達、企業価値20億ドル
- Cohere(基盤モデル開発企業): 2.7億ドルを調達、企業価値20億ドル
- Runway(生成動画モデル開発企業): 1.91億ドルを調達、企業価値15億ドル
- Synthesia(企業向け動画生成プラットフォーム): 9,000万ドルを調達、企業価値10億ドル
- Hugging Face(オープンソースMLプラットフォーム): 2.35億ドルを調達、企業価値45億ドル
- Poolside(コーディング向け基盤モデル開発企業): 1.26億ドルを調達
- Modular(AI開発プラットフォーム): 1億ドルを調達、企業価値6億ドル
- Imbue(AIエージェント開発企業): 2.12億ドルを調達
- Databricks(データ/分析/AIソリューション): 6.84億ドルを調達、企業価値432億ドル
- Aleph Alpha(基盤モデル開発企業): 4.86億ドルを調達
- AI21 Labs(基盤モデル開発企業): 2.08億ドルを調達、企業価値14億ドル
- Together(生成AIクラウド): 2回にわたり2.085億ドルを調達、企業価値12.5億ドル
- VAST Data(ディープラーニングデータプラットフォーム): 1.18億ドルを調達、企業価値91億ドル
- Shield AI(航空宇宙/防衛向けAIパイロット): 5億ドルを調達、企業価値28億ドル
- 01.ai(基盤モデル開発企業): 2億ドルを調達、企業価値10億ドル
- Hadrian(航空宇宙/防衛向け部品製造): 1.17億ドルを調達
- Sierra AI(顧客サービス向けAIチャットボット): 2回にわたり1.1億ドルを調達
- Glean(企業向けAI検索): 2億ドルを調達、企業価値22億ドル
- Lambda Labs(GPUクラウド): 3.2億ドルを調達、企業価値15億ドル
- Magic(コーディング向け基盤モデル開発企業): 1.17億ドルを調達、企業価値5億ドル
M&A、未公開株取引
- 2023年MAD以降、M&A市場はかなり静かだった
- 多くの伝統的なソフトウェア企業は、M&Aよりも自社の株価と全般的な事業に注力する姿勢を見せている
- とりわけ厳格化した反トラスト環境も、潜在的な買い手にとっては負担として作用している
- プライベートエクイティ(PE)は悪化した市場で割安な機会を探し、比較的活発に動いている
- MADに登場した注目すべき取引は次のとおり(規模順):
- Broadcom(半導体メーカー)、VMWare(クラウド企業)を買収、$69B
- Cisco(ネットワーク/セキュリティインフラ)、Splunk(モニタリング/オブザーバビリティ)を買収、$28B
- Qualtrics(CX管理)、Silver Lake/CPPによる非公開化、$12.5B
- Coupa(支出管理プラットフォーム)、Thoma Bravoによる非公開化、$8B
- New Relic(モニタリング/オブザーバビリティ)、Francisco Partners/TPGが買収、$6.5B
- Alteryx(分析プラットフォーム)、Clearlake/Insightによる非公開化、$4.4B
- Salesloft(売上オーケストレーション)、Vista Equityが買収 $2.3B
- Vistaは顧客体験向けAIチャットボット企業Driftも買収
- Databricks(データレイクハウス)、MosaicML(AI開発プラットフォーム)を買収、$1.3B
- Arcion、Okeraなども小規模買収
- Thoughtspot(分析プラットフォーム)、Mode Analytics(BI)を買収、$200M
- Snowflake(データウェアハウス)、Neeva(AI検索エンジン)を買収、$150M
- DigitalOcean(クラウド)、Paperspace(AI開発)を買収、$111M
- NVIDIA(AIチップ)、OmniML(エッジAI最適化)を買収
- MSによるInflection AIの買収も特異な事例だ
- 2024年がAI M&Aの年になるかどうかは、市場モメンタムにかかっている
- 下位市場では、過去1〜2年で有望なAIスタートアップの多くが資金調達を受けた。過去のAIブーム期には、初期投資後に実績に比べて高額な人材買収(acquihire)が多く起きていた。AI人材はいまなお希少だ
- 上位市場では、先導的なデータプラットフォームとAIプラットフォームの間のコンバージェンスが勢いを得ているが、価格は決して安くなさそうだ
IPO
- AIは株式市場でも熱い話題だった。「マグニフィセント・セブン」(NVIDIA、Meta、Amazon、MS、Alphabet、Apple、Tesla)の株価は2023年に49%以上上昇し、市場全体の上昇を牽引した
- しかし、純粋なAI銘柄は依然としてかなり不足している状況だ。数少ないAI銘柄にはプレミアムが付いている(Palantirの株価は2023年に167%上昇)
- これは多くのAI関連IPO候補スタートアップにとって好材料になりそうだ。Databricksを筆頭に、Celonis、Scale AI、Dataiku、Fivetranなど相当規模の企業がIPOを準備中だ
- OpenAIとAnthropicが上場に対してどのような立場を取るかも興味深いテーマだ
- 一方、2023年のIPO市場は非常に低調だった。MAD関連企業のうち、上場に成功したのはごく一部のみ:
- Klaviyo(マーケティング自動化): 2023年9月上場、企業価値 $9.2B
- Reddit(AI企業にコンテンツライセンスを提供): 2024年3月上場、企業価値 $6.4B
- Astera Labs(AI/クラウド向け半導体): 2024年3月上場、企業価値 $5.5B
結論
- 私たちは非常に特別な時代に生きている。パラダイムシフトの入り口にいる
- 実験し、新しいことを試すときだ。私たちはまだ始まったばかりだ
1件のコメント
The 2020 Data & AI Landscape
2021年データ/ML/AI業界マップと最新トレンド