GPT-5：公開の遅延、過大評価、期待に届かず、さらに深刻な問題

(garymarcus.substack.com)

6 ポイント投稿者 GN⁺ 2025-08-11 | 5件のコメント | WhatsAppで共有

GPT-5の期待に反し、実際の公開後、コミュニティの失望感は大きく高まった
GPT-5は既存モデルと実質的に大きな差別化がなく、むしろ一部ベンチマークでは逆に性能が悪化したことも確認された
最新研究で、大規模言語モデル（LLM）の汎化の限界と分布シフト問題が依然として深刻であることが示された
OpenAIの技術リーダーシップ喪失、主要人材の離脱、競争他社の追い上げなどにより、企業価値の維持が不透明になった
AGI実現をめぐる主張への懐疑感が強まり、業界全体で**「純粋なスケーリング」アプローチ**の限界認識が広がっている

GPT-5公開と期待感

OpenAIが長い間告知を続けてきたGPT-5公開が、ついに実現した
CEOのSam Altmanは公開の前後で、自信に満ちた発言とマーケティングイメージを積極的に活用した
しかしGPT-5公開後、インフルエンサーを一部除けば、大半のコミュニティで失望感が主流となった
ユーザーは新モデルに対し大きく失望し、旧バージョンへの要求署名が実現する現象すら起きた
Altmanのマーケティングや主張とは対照的に、実際の使用レビューは明確に否定的評価へ傾いた

コミュニティとメディアの反応

OpenAI Reddit、Hacker Newsなど複数のコミュニティで、**エラー、ハルシネーション（hallucination）**などGPT-5の問題点が集中的に指摘された
主要な性能ベンチマークでは、Grok 4など競合モデルに及ばないケースも見られた
自動ルーティングといった新機能も、混乱と未熟さを露呈した
期待値が急速に高まったコミュニティにおいて、GPT-5は逆に大きな失望を残した
公開当日のPolymarket調査では、OpenAIのAIリーダーシップ信頼度が1時間の間に75%から14%へ急落した

構造的な限界：チェス、視覚理解、推論の問題

著者や複数の専門家が指摘してきた基本的な推論エラーとチェス規則遵守の失敗は依然として存在する
画像生成などの分野では、部分-全体関係、視覚的一貫性などで明確な限界が示された
機械工学の博士号保持者や一般人であっても間違えないはずのレベルの問題で、GPT-5は誤りを犯した
要約や読解などの基本タスクでも、複数の誤り事例が報告されている
GPT-5は穏やかな段階的改善モデルだが、昨年と比べて目立った革新は見られない

OpenAIの現状と展望

GPT-5は前作と比べて段階的改善の範囲にとどまり、致命的な欠点が繰り返された
市場と業界ではOpenAIの技術リーダーシップへの信頼が低下している
多くの主要人材が離脱し、競合他社を設立したり転職したりし、Anthropic、Google、Elon Muskらが急速に追い上げている
価格引き下げ圧力、収益性の問題、Microsoftとの関係悪化など構造的リスクが拡大している
LLMベースのAGI実現可能性に対する懐疑とCEO Sam Altmanに対する信頼低下が深まっている

LLMの根本的な限界：汎化と分布シフトの問題

Arizona State University（アリゾナ州立大学）の最新論文で、Chain of Thought推論でさえも訓練分布から外れると崩壊する現象が確認された
Appleなど他社がすでに指摘してきた分布シフト（distribution shift）に脆弱な構造が最新モデルでも同様に確認された
これはLLMが継続的に本質的な限界に突き当たる根本原因であり、巨大なパラメータ数だけでは克服できないことが明らかになった
数十億ドルが投入されたスケーリング戦略が、本質的な問題解決では失敗していることを示した
新しいパラダイムを模索する必要性が広がっている

AI業界全体と「スケーリング」の限界

AGI、運転の自動化、過度に楽観的なタイムラインなど、誇張されたマーケティングが横行している
性能を歪めたベンチマーク、ブラックボックス的評価、透明性不足は深刻である
多くの人々が**「AGI」**という用語が投資家と一般大衆を惑わせる手段であることを認識し始めている
AIへの楽観論と過熱が同時に高まっている
純粋なスケーリングアプローチが行き詰まりに直面しているのが現実である

代替案と結論

GPT-5はより安価になった可能性はあるが、チェス、推論、視覚、数理能力など質的な限界は依然として残る
Grok、Claude、Geminiなどの競合モデルも同様の問題を繰り返している
**分布シフト（distribution shift）**問題は依然として未解決のままである
今後は神経記号（neurosymbolic）AIや世界モデルベース手法などの新たなアプローチが必要だという主張が出ている
純粋なスケーリングではなく複合的なアルゴリズム革新こそがAGI実現の必須要素であることが再確認された

今後の論点予告とPS

今週明らかになったLLMの限界に加えて、さらに深刻な科学的問題が明らかになる見込みが示唆されている
次回のフォローアップ記事で別件について共有することを告知

まとめ

GPT-5公開前後で、業界とコミュニティの期待と反応、LLMの構造的限界、OpenAIの将来、AGIフレームの現実が幅広く議論された
全体として、この内容はLLM、GPT-5の実質的な限界、AI投資/期待/失望、イノベーション論点、研究動向など、スタートアップとIT実務者に重要な示唆を与える

5件のコメント

gnsdl116 2025-08-12

過剰な悲観論のようだ。
懸念点は理解できるが、技術の発展過程が必ずしも常に上向きとは限らない。

mammal 2025-08-11

投稿を書いた人物が、ただでさえデタラメばかり言うGary Marcusだったから…

dongho42 2025-08-11

Googleのように、静かにshow&proveを出していれば、ここまでにはならなかったと思うんだけど、これまで「怖すぎる」「死の星はどうだ」「核爆弾を作ってしまった」みたいに、ハイプと言えばハイプのようなことをたくさん言ってきた自業自得じゃないかなと思います。