12 ポイント 投稿者 GN⁺ 2025-08-22 | 1件のコメント | WhatsAppで共有
  • MITの報告書によると、世界中の企業の95%が生成AI導入で実質的な収益を得られていない
  • 企業はChatGPTやCopilotなどの大規模言語モデルを大規模に実験してきたが、その活用の大半は生産性向上にとどまっている
  • 成功事例はわずか5%の統合AIパイロットでのみ確認され、大半は売上や利益に影響を与えていなかった
  • 生成AIが実際の業務手順とうまく適合しないことや、フィードバックを記憶できず文脈に適応できないことが主な要因である
  • 報告書は大規模な雇用代替への懸念を退け、外部コストの削減は可能でも、社内構造の再編や大規模解雇は当面現実的ではないと分析している
  • 結論として、AIは戦略全体ではなく特定のタスクに強みがあり、企業は全社的な変革ではなく、限定的で即効性のある成果が見込める領域に集中すべきだと勧告している

企業の生成AI投資と収益

  • この3年間で企業は生成AIプロジェクトに300億〜400億ドルを投資してきた
  • しかし、実質的なビジネス収益を得た企業はごく少数にとどまる
  • MITの新たな研究では、95%の企業がAI導入後も測定可能な利益がないと回答した
  • わずか5%のAIパイロットプロジェクトだけが数百万ドル規模の価値を生み出している

大規模言語モデル導入の現状と限界

  • 80%以上の大企業がChatGPTやCopilotなど主要なLLMをテストするか、パイロット運用している
  • 40%の企業がこれらのシステムをある程度導入しているが、その大半は従業員の個人生産性向上に限定されている
  • 企業の全体売上や利益の改善にはほとんど影響していない

生成AIの技術的限界

  • 生成AIツールは実際の業務プロセスとうまく適合しない場合が多い
    • 代表的な問題点として、不安定なワークフロー、文脈学習の欠如、非効率な業務連携が指摘されている
    広告
  • 大多数の生成AIモデルは過去のフィードバックを保持できず、文脈や業務をまたいだ教訓の転移が難しい
  • 報告書によれば、大半のGenAIシステムはフィードバック保持、文脈適応、長期的改善が不可能である
  • こうした特性のため、企業内での長期的な統合コストばかりが高まり、実質的な効率化は不十分となっている

ビジネス期待と現実のギャップ

  • 生成AIに対する期待と投資規模は大きかったものの、コスト削減や実質的な収益創出にはつながっていない
  • 実際にはカスタマーサービス、マーケティング、文書作成などの限定的な業務に活用され、時間は節約できても直接的な売上増加効果は小さい

雇用および組織構造への影響

  • 生成AIが短期的に大規模な雇用減少をもたらすという懸念は根拠が弱い
  • AIの効果は社内の人員構成の変化よりも、外注費削減など外部コスト最適化にとどまる見通しである
  • 直ちに人員を大規模に代替するというより、アウトソーシング費用を減らす程度にとどまると予想される
広告

技術的な誤解と発展の限界

  • 企業がAIの実際の可能性と限界を正確に理解できていないため、失敗事例が多数発生している
  • 生成AIはテキストやコードを素早く作れるが、人間のような継続的学習や柔軟性には欠ける
  • 例えば従業員は過去のミスや新たな要求に応じて柔軟に対応できるが、AIにはそのような連続的な記憶の転移ができない

投資と今後の方向性

  • 投資家と経営陣はAI技術の継続的な進歩を期待しているが、短期的には想定より進展が遅い
  • 報告書は、あらゆる業種やワークフローに即座にAIを導入するのは時期尚早であることを示唆している
  • 組織は即時かつ測定可能な効果が期待できる狭い領域に導入を集中させる必要がある
    • 例: 顧客支援の自動化、開発支援ツール、文書ドラフト作成など
  • 企業全体にわたるAI統合は依然としてリスクが大きく、失敗確率も高い

結論と示唆

  • 生成AIの企業価値実現は一部の成功事例に限られている
  • 大半の企業は日常業務でわずかな助けを得ているにすぎない
  • 報告書は、企業が生成AIを全面的な成長エンジンではなく限定的なツールとして認識する必要があると強調している
  • 期待は高いが、現行システムが人間のように適応できない限り、企業がAIから大きな収益を得るのは難しい

1件のコメント

 
GN⁺ 2025-08-22
Hacker Newsの意見
  • 今週、重複した議論があった(162件のコメント) https://news.ycombinator.com/item?id=44941118 この記事でリンクされていない実際のソースレポートは https://mlq.ai/media/quarterly_decks/v0.1_State_of_AI_in_Business_2025_Report.pdf とのこと
  • そのレポートは記事の内容とはまったく違うと述べている。いくつか情報を共有すると、失敗した予算の50%はマーケティングとセールスに使われており、AIは2.3兆ドル分の労働価値を自動化できる可能性があり、3,900万のポジションに影響がある点、そして失敗の最大要因は新しいツール導入への拒否と経営陣の支援不足だと強調している。AIが機能しないという結論を急ぎすぎていると思う。レポートが言っているのはそういうことではない
    • 「AIが2.3兆ドルの労働価値を自動化し、3,900万のポジションに影響する」と言っているが、現在の米国で自動化可能な労働価値は2.27%だ。米国のGDPは現在27兆ドルで、610億ドル分の労働価値を最適化しながら米国の労働人口の15%程度を置き換え、それで2.3兆ドルの価値を生み出すという話だが、これが本当に計算として合っているのか疑問だ。このすべてを誰が買うのか(労働者でないなら誰が?)も気になる。2025年のAI投資額はすでにその半分を超えている。この状況で「労働価値」をどう測るべきか分からない。GDPは適切な指標ではない気がする
    • 自分の受けた印象もレポートと一致している。一部のニュースは単にクリックを稼ぐために刺激的なナラティブを押し出しているだけで、実際のレポート内容を深刻に誤解している。AIの失敗ではなく、現状では従業員がツールをうまく導入していない、あるいは少なくとも会社が提供するツールを導入していないことのほうが大きな原因だ。彼らが言及した「シャドーAI経済」も実際の問題だ。人々は会社が提供するツールの代わりに個人契約のLLMを使っている。うちの大学でも全学生と教職員にChatGPT Enterprise版を提供したが、クラウドベースの最新バージョン(例: GPT-5)と比べるとかなり見劣りする。そのためシステム導入率もユーザー維持率も低い。大半のユースケースではクラウド利用が違法ではないデータを扱うので、制約もそれほど大きくない
    • レポートでこの部分が特に印象的だった。中堅法律事務所の弁護士が会社で5万ドルの契約分析ツールを購入したのに、実務では依然としてChatGPTを使っている。会社が買ったAIツールは要約が硬すぎてカスタマイズもしづらいが、ChatGPTは対話を通じて望む結果を繰り返し引き出せる。つまり、20ドルのツールが数千万ウォン級のエンタープライズソリューションより、実際のユーザー満足度でははるかに優れているという逆説だ。だから多くの企業がGenAIディバイドの間違った側に立つことになると説明している
    • 3,900万のポジションに影響するというのは本当に驚くべき数字だ。米国の就業人口は1億6,300万人なので、ほぼ4分の1が危険という意味になる
    • 「多くの人がAIはダメだという結論を急いでいる」というコメントに対して、「人の給料が理解しないことにかかっているなら、その人は理解しようとしない」という有名な言葉が共有されていた
  • 自分は現在AIエンジニアリングチームのリーダーで、当然ながらAIが価値を生み出すという認識は自分の利害とも一致する。うちの会社ではAI導入によって数百万ドルを節約できるようになった。大規模なコールセンターを運営しているのだが、以前はスタッフが各通話ごとに3〜5分かけて手作業で要約を書いていた。最近AIで通話要約を自動化した。要約の品質も良くなり、人はより価値の高い仕事に集中できるようになった。革新的ではないが、実際に測定可能な効率向上だ
    • 豆知識として、要約自体を書かず、資料が必要になった時だけ生成することを提案する。通話音声は24Kb/s Opusで保存すれば1分あたり180KBで済み、一定期間保存後に削除するプロセスにすれば年間でさらに数百万ドル削減できる
    • うちの会社はGoogle MeetとGeminiで会議内容を文字起こしにしている。だが実際の内容は非常に不正確だ。誰が話したのか混乱するし、意味を逆にしてしまうことすらある。文脈がなく、社内用語も理解できないので、実際には使えないレベルだ
    • コールセンターのスタッフがAI要約のほうが本当に自分たちより良いと感じているのか気になる。自分の場合、会議要約には使いづらいと思う。これは一方向の通話でしかうまくいかない気がする
    • うちも会議要約にAIを使ってみたが、結果があまりに不十分で再び人が直接書いている。もし効果が良かった具体例や、トレーニングやカスタマイズがあったなら知りたい
    • なぜコールセンタースタッフがわざわざすべての通話ごとに3〜5分もかけて要約を書く必要があったのか疑問だ。さまざまなAI活用事例の中には、実際には不要な仕事を自動化しているケースをよく見る。レポートを誰も読まないなら要約品質は問題にならず、AIが下手に書いても構わない。運用効率化で重要なのは不要なプロセスを自動化することではなく取り除くことだ。結局AIは組織の無駄な業務を覆い隠す役割を果たしていることが多いように思う。もしそうした最適化ができないなら、これですら必要なのかもしれない
  • 今は「幻滅の谷(Trough of disillusionment)」に入りつつある時期だ。こうした誇大宣伝のサイクルは予測可能だ。GPT-5が大きな期待の末に失望だったという評価が出てきたことで、GenAIの「もう終わり」が始まるかもしれない。ROIを問われ始めると現実が見えてくる。賢い人たちはすでに次の変革を準備しており、まだ谷の底まで落ちていく人たちもいる。ますます切羽詰まったPRが「本当に価値がある」と押し寄せてくるだろう
    • 大半の企業が金の無駄だと分かっていながら、株価のために仕方なく投資していたとしても驚かない
    • Geminiはアップデートのたびにかなり良い印象を与えるが、最近は改善の速度も内容の質も大きく鈍化している。これは壁が近づいている兆候に見える。停滞期が来た後に再びジャンプするパターンを考えると、LLMはコンピュータビジョンよりは明るい将来を持ちそうだ
    • Sam AltmanはGPT-5の性能を過度に宣伝していた。ユーザーの立場からするとGPT-4に比べて大きな飛躍は感じられない。しかし、trainable dynamic router方式が推論コストをかなり下げた点は大きい。ユーザーよりもOpenAIと電力網のほうに恩恵が大きい革新だ
    • OpenAIがGPT-3.5-TurboからGPT-4へ移行した時は革命的な変化で、他モデルもなかった。しかしGPT-5が出る前にはすでにoシリーズ、Llama、DeepSeek、Geminiなど数多くのモデルが登場している。今後はGPT-3.5から4へ移った時のようなジャンプはないだろう。GPT-5は複数モデルを1つに統合しているが、「最初」の称号は持っていない
    • Windsurfチームが早期に売却して去った理由はこれなのだろうか
  • 実際に売上を伸ばしたりコストを下げたりする現実的なAI活用事例には何があるのかという質問。1. オンラインコンテンツ生成(すでに飽和) 2. junior開発者の置き換え(生産性は限定的) 3. 顧客サービス担当者の置き換え(コスト削減効果はあるが売上への影響は小さい) 4. 補助ツール(文章作成、分析など限界あり) 5. ビデオゲームやロボットキャラクターなど次世代インタラクション 6. AIバーチャル恋人やNSFW。この市場はしばらく収益性が高そう。ほかにもっと現実的な例があるかと尋ねている
    • 自分はLLMを使って半構造化文書から特定情報を抽出し、その後に自動分類・ファイリングするプロジェクトを進めている。精度は95%以上で、まだファインチューニングもしていない。最終的には手作業の承認を通すが、それでもすでに年間数百時間の削減効果がある。情報抽出と分類にはAIが非常に有効だ
    • ヘルスケアでは診療ノート、データ、画像解釈など、あらゆる記録がそのまま収益に直結する。毎年この部分の事務コストに数十億ドルが使われている。GenAIでノートの品質と正確性を大きく高めれば、直接的な売上増加が可能だ。保険分野も同様で、膨大な文書作業と確認が必要になる。結局、AIたちが互いに文書だけをやり取りし、人間はプールサイドに座るだけになるのかもしれない
    • AIカスタマーサービスはユーザーの立場では腹立たしい体験だ
    • 月200ドルで生産性が50%向上するなら、とてつもない価値だ。大半の国の年間生産性上昇率は0〜2%だ
    • 社内文書・Wiki・コードベースをRAGで束ねて、オンボーディングと情報検索を容易にするAIがあればよいと思う。人間を置き換えるよりも、もっと仕事しやすくする方法を探すほうが望ましい
  • 人々が犯す最大の間違いは、AIをサービスではなく機能として見るべきだという点だ。誰も「今日はAIと会話したい!」とは思わない。ユーザーは退屈すぎず、負担が大きすぎない形で仕事をうまく終えたいだけだ。そういう時にAIが静かに助けるのが正しい。しかし私たちが売っているのは機能ではなくサービス(=製品)なので、マーケティングではAIを前面に出さざるを得ない。Notion、Slack、AirtableなどはどこもAIを見出しに掲げているが、本質はAIそのものではなく、それが助ける仕事の本質だ
    • 自分はAIが機能だという話ですらないと思う。AIは結局技術だ。「この製品にAIを入れてほしい」というより、「この作業ができたらいいのに」という欲求のほうが先にある。製品が自分の仕事を解決してくれるなら、方法は何でも構わない。あまりに多くの会社がAIそのものを簡単に差し込もうとするが、ユーザーが求める問題解決に集中していない
    • 言っていることは正しいが、現実にはこうなると市場の高いバリュエーションや過熱した雰囲気が消える。こうした覚醒の瞬間が来れば、残っている「ホット」なソフトウェア分野まで冷え込み、業界全体が5〜10年前ほどの市場ではもうないという現実を受け入れることになるだろう
    • AIが単なる別のツールとして紹介されればいいのにと思う。「こういうユースケースがあります」と1回通知を出す程度で十分だ。現実にはあらゆるUIがAIロゴやオートコンプリートなどで埋め尽くされ、集中力を削いでいる。ツールではなく主役になった感じだ。本来はユーザーがそれぞれ必要に応じて使えるようガイドするだけでいいのに、あまりに無理やり押し込もうとしている感じが強い。こういう会社は少し立ち止まって、ユーザーに任せることを覚えるべきだ
    • 心から同感する。結局重要なのは製品そのものの価値であって、その下で何が使われているかは重要ではない
    • 最近のAI活用アプリケーションはほとんど「問題を探しているソリューション」のように見える
  • レポートPDFのリンクがランディングページにリダイレクトされ、CTAが「AI製品の成功を早く実現しましょう」となっていて、むしろ客観的なレポートではなく普通のコンテンツマーケティングに近く見える。著者名をクリックしてみたが何も出てこない。サイトも著者も信頼できない。HNも今やRedditのように、タイトルだけ見て入ってきて賛否だけコメントして去っていくようになった
  • 本当に人々がレポートを直接読んだらどう思うのか気になる https://mlq.ai/media/quarterly_decks/v0.1_State_of_AI_in_Business_2025_Report.pdf 公式LLMサブスクリプションがある企業は40%しかないが、90%以上の企業従業員が個人のAIツールを日常業務で使っている。実際、ほぼすべての従業員が何らかの形でLLMを使っている。「シャドーAI」利用者は、会社の公式プロジェクトがパイロット段階にとどまっている間も、毎日何度もLLMを活用している。企業の公式AI事業は失敗しているのに、実際には社内でLLM活用が広がっているという逆説的な状況だ。この話は記事のような新しい爆弾ニュースではなく、むしろ完全に違う話かもしれない
  • こういう形で米国は技術革新のたびに常に先行しているように見える。多くの金を使って失いもするが、リスクも引き受けることで、結局は追いつけないほど先に進む。AIや米国企業を相手にあまりに早く勝利宣言するのは危険だ
    • 米国があらゆる分野で先行していると一般化するのは難しいと思う。金融など多くの分野では他国より遅れている。中国はEVや太陽光などで先行している。ソフトウェア分野はその通りだが、米国の防壁は独占、ロックイン、富裕層向けに最適化された規制などによって形成されている
    • こうした考え方は単純すぎる。現実をむしろ歪める可能性がある
    • 太陽光、EV、ドローンなどの例を挙げて、米国が必ずしも先行しているわけではないと述べている
    • GSMの歴史にも触れながら、常に米国がイノベーションを主導してきたわけではないという意見を示している
  • 自己生産性に関する自己評価が実際とは異なる可能性がある点が興味深い。METRの研究では、開発者たちはAIによって20%速くなったと感じていたが、実際には19%遅くなっていた https://metr.org/blog/2025-07-10-early-2025-ai-experienced-os-dev-study/
    • こうした研究でも捉えにくいニュアンスは多い。使っているAIの種類、使用ツール、習熟度、開発プロセス、チーム規模、そしてユーザーの職位や細かさなど、さまざまな要素が結果に影響する。今は投資家たちが市場シェア確保のためにAI価格を大幅に補助しているが、それが終われば価格はむしろさらに下がるかもしれないと思う。自分はAIの進歩のおかげですでに十分利益を得ていると考えており、今後は漸進的改善やユーザー体験向上が中心になる気がする。今のところAI企業に投資するつもりはない
    • ある時はAIがオートコンプリートのように自分の考えを完璧に読んでいるように感じるが、別の時にはまったく的外れな提案をして邪魔になるだけだ
    • AIがむしろ人を細部の改善ばかりに集中させ、大局を見失わせるのではないかという疑問もある。開発速度はむしろ全体的・戦略的な判断(このツールを使ってよいか、この機能は本当に必要か、など)で決まる
    • サンプル数は少ないが、逸話や自己申告データよりはるかに意味のある研究だ