OpenAI、Googleの追い上げを受けてChatGPT改善に「コード・レッド」発動

(theverge.com)

2 ポイント投稿者 GN⁺ 2025-12-03 | 3件のコメント | WhatsAppで共有

OpenAIはChatGPTの品質改善のため『コード・レッド』段階に緊急移行し、Googleの追い上げで揺らぐ優位性を取り戻そうと取り組んでいる
現在、パーソナライズ・速度・信頼性・回答可能な質問範囲の拡大など主要機能の補完が急務であり、そのため広告・Pulse（パーソナルアシスタント）・ヘルス・ショッピングエージェントを含むすべての新規プロジェクトが中断または遅延している
GoogleのGemini 3が最近の多数のベンチマークでOpenAIモデルを上回り、画像モデルNano Bananaの成功によりMAUが4.5億→6.5億まで急増した点が主要な脅威として浮上した
OpenAIは数千億ドル規模のデータセンター投資契約を締結し、2030年までに年間2,000億ドルの売上が必要という見通しなど、財務圧力も増しており、Anthropicの法人顧客成長も競争要素として作用している
OpenAIは毎日点検体制を稼働させ、チーム再配置を実施し、まもなく公開される新しい推論(reasoning)モデルがGeminiの最新バージョンより先行していると社内で明らかにするなど、主導権回復が重要な岐路として示されている

コードレッド発動とChatGPT改善計画

OpenAIがChatGPTの問題解決のため、**最上位の緊急モードである『コード・レッド』**を発動したことが内部メモで明らかになった
- OpenAIはyellow → orange → redの3段階アラート体制を用いており、今回の措置はコード・オレンジからさらに一段階上がった状態である
改善対象はパーソナライズ強化、レスポンス速度の向上、サーバー信頼性の改善、回答できる質問範囲の拡大など、ユーザー体験全般を含む
そのため広告、Pulse（個人秘書）、ヘルス・ショッピングエージェントなど、すべての新規プロジェクトが後回しにされている
- 全社的な人員再配置を促し、**開発状況を毎日点検する専用コール(daily call)**を運用することになった
最近のGPT-5には冷たいトーンや基本的な質問の誤りへの不満があり、これに伴いモデルのトーンと指示実行能力が再調整された

Google Geminiの追い上げと競争圧力

Googleの最新Gemini 3モデルが複数の産業ベンチマークでOpenAIを上回り、競争構図が大きく揺らいでいる状況が示された
- Gemini発表直後、Google株価が上昇し、性能が市場で強く注目された
画像生成モデルNano Bananaが8月に公開された後、Google AI全体の月間アクティブユーザー(MAU)は
- 7月4.5億 → 10月6.5億へ急増したデータが示された
Anthropicも法人顧客基盤で拡大しており、OpenAI単独の優位性が弱体化する流れが明確になっている
ChatGPT登場直後にGoogleが「コード・レッド」を発表した状況は、今ではOpenAI側へ逆流した皮肉な状況として記されている

投資、財務的圧力と市場の不安

OpenAIはMicrosoft・Amazonとの契約で36GW規模のデータセンター電力契約を締結し、
- 今後年間6,200億ドル規模のデータセンター賃借費が発生する可能性がある
2030年の黒字化を達成するには年間約2,000億ドルの売上が必要という内部見通しも示されている
OpenAIは上場計画がないが、
- この財務構造はNvidia、Oracle、Microsoftなど主要テック企業の株価とも密接に連動しており、市場全体にも影響を及ぼしている
OpenAIは依然として赤字で、継続的な大規模資金調達がなければ生存が難しい構造だと評価されている

新モデル公開予告と社内の自信

アルトマンはメモで、来週公開される新しい推論(reasoning)モデルがGoogle Geminiの最新バージョンより先行すると述べた
- これは社内の士気を高める要素と見られ、ChatGPTの成長性と主導権回復への意思を強調した形である
ChatGPTは依然として週次ユーザー8億人以上という強力なユーザーベースを有しており、
- OpenAIはここにさらに速度・正確性・パーソナライズ改善を加えて成長を維持する計画である

全体の文脈

GoogleとAnthropicによる競争激化、製品品質をめぐる論争、大規模インフラコストの組み合わせから、
ChatGPTの基本品質を取り戻すことがOpenAIの生存戦略であり最優先課題として浮上している

3件のコメント

slowandsnow 2025-12-04

ChatGPTの問題点
バグが多すぎる。送信を押してもメッセージ生成が始まらなかったり、メッセージのストリーミング中にエラーが出て全部消えたりするなど。Deep Researchは思考モードよりも出典が少ない。Deep Researchを使う理由がなくなった。
Codexの問題点
あまりにも遅い。Claude Codeなら5分で終わる作業が、Codexでは10分以上かかる。あまりにも賢くない

yinn27 2025-12-04

でも、GeminiはUIとか全体的に見て、ChatGPTより使いにくくないですか……？

GN⁺ 2025-12-03

Hacker Newsの意見

先週、顧客から私が一部を書いた機能について問い合わせが来た。サポートエンジニアがClaudeで回答を生成したのだが、社内・公開ドキュメントを学習しているにもかかわらず、もっともらしいでたらめを実に自信満々に作り出した
私がなぜ間違っているのかを説明している最中に、別のエンジニアがAugmentで回してみたところ、今度はまた別のたわごとを自信満々に出してきた。結局、泣き顔の絵文字を送り合うだけになり、私はこれからも自分の生身の知能を使うつもりだ
- 私のコードは0.11秒、Geminiのコードは0.5秒かかる。上司が理由を聞いてくるが、どう説明すればいいのかわからない ¯\(ツ)/¯
- LLMは不可能なことに対して本当に弱い。むしろ、彼らが幻覚ででっち上げた機能を実際に実装したほうがましなことすらある。すでに一部の公開APIプロバイダーはそうしている
OpenAIが2024年半ば以降、成功したpre-trainingを行えていないという噂を聞いた。ChatGPT 5.1にインターネットなしで現在の出来事を聞くと、知識カットオフが2024年6月だと言う。これが小さいモデルのせいなのかはわからないが、今の時点で18か月前というのは不安な兆候に思える
- SemiAnalysisニュースレターでも同じ話が出ており、否定されたことはない
- たまにGPTモデルでコーディングを試してみると、簡潔な会話スタイルのおかげで数日は良く見える。しかし結局はClaudeやGeminiより品質が劣り、失敗パターンも多い
- ChatGPT 5.1にcodex CLIのインストール問題を聞いたところ、codexは廃止されており、私がopenaiコマンドを間違って使っているのだと自信満々に言ってきた
- Googleも2000年代初頭にはWebクロールの遅延問題を抱えていたが生き残った。ただ、今のOpenAIは当時のGoogleほど差別化された立ち位置ではないので、はるかに危うい状況かもしれない
- PS5とPCのどちらでIndiana Jonesを遊ぶべきかと聞いたら、最初はタイプミスだと勘違いし、その後で結局インターネットから拾ってきて私のゲームリーグを褒め始めた
去年から続いているOpenAI中核研究者の離脱が、いよいよ本格的に影響し始めているように見える。Sam Altmanは営業屋であって研究者ではない。Ilyaもおらず、主要人材はGoogle・Meta・Anthropicへ移ったか起業した。残った人たちは反復的な改善には強いが、次の飛躍を自力で主導できるのかは疑わしい
今のOpenAIはまるでNetscapeのようだ。革新的ではあるが、持続可能な収益モデルがない。片方ではGoogleが既存製品にAIを無料でバンドルし、もう片方ではDeepseekやQwenがオープンソースで価格を切り下げている。結局、両側から圧迫される構図だ
- OpenAIは今年、年間200億ドルの売上を超える見込みだという（CNBC記事）
- もしOpenAIが商業化に失敗し、再び非営利モデルに戻って無料ツールを共有するなら、Mozillaの道を歩むことになるだろう
- 「GoogleはGeminiを無料でバンドルするだろう」と言うが、すでにほぼすべての製品でそうしているのではないかと思う
- 妻はClaudeへの乗り換えを拒んでいる。ChatGPTが自分の好みに完璧にチューニングされていると感じているからだ
- Geminiを無料でバンドルするには、Flash 3.0の推論コストを2.5よりずっと低くしなければ無理だろう
本気で気になることがある。どうしてOpenAIがpre-trainingに失敗し得るのか。すでに成功体験があり、人材も最高レベルなのに、単に2024年のモデルをもう一度学習させればいいだけではないのか？
- みなが失敗するのと同じ理由だ。ハイパーパラメータを新しいハードウェア向けに調整し、論文で見た改善点を反映するが、数か月と数百万ドルを費やした末にlossが頭打ちになり、結果はわずかしか伸びない
- 「成功」が前モデルより目に見えて優れた性能を意味するなら、それは本当に難しいことだ
- GPT-4.5がそうした試みだったと聞いた。単に性能が足りず公開しなかっただけだ
- 新しいモデルは以前のモデルを継続学習しない。アーキテクチャが完全に異なるからだ。今回はその設計がまずく、2024年半ばのモデルより悪くなった可能性が高い
私が経験した「Code Red」は、たいてい会社全体が方向を見失っている状態を取り繕う言葉だった。中間管理職が何をすべきかわからず、結局エンジニアが負担を背負わされる
- PMや中間管理職を解雇したからといって、こうした事態が防げるわけではない。大規模組織の意思決定構造をあまりに単純化しすぎた見方だ
- まともなCode Redなら、会社の優先順位を一本化し、エンジニアを中核プロジェクトへ再配置すべきだ
- 私が見た唯一の例では、実際にPMを解雇したが、予想外の問題が次々に噴き出し、それを「問題に気づけてよかった」と受け止めていた
- 「すべての問題は他人のせいで、自分だけ残れば解決する」というエンジニアの思い込みもある
- 今回のCode Redは、収益化機能の停止の言い訳かもしれない。現実的な企業価値との乖離を避けようとする動きだ
本当のCode Redは、GoogleがOpenAIを追い抜いたことではなく、AI業界に堀がない事実が露呈したことだ。結局みな、最も高くつく底辺競争をしている
- こうした企業は最終的に政府契約や間接的な救済で損失を社会化するだろう
- Gemini 3の性能が実際にChatGPTユーザー離れにつながったのかは不明だ
- 投資家が赤字構造の商品化競争に興奮しているのが理解できない。私もGPT3〜4の頃はファンだったが、今はClaudeとGeminiを併用している。忠誠心はゼロだ
- それなら、なぜGoogle株はGemini 2.5 Proの公開後に急騰したのだろうか？
- 私もOpenAIが秘密の学習技術を持っているのだろうと思っていたが、そんなものはなかった
OpenAIはStargateプロジェクトなどで、5,000億ドル規模の長期支出を約束している。Microsoft Azureに2,500億ドル、AMD GPUにも数十億ドルを投じる予定だ。Oracleはそのために180億ドルの債券と96億ドルの融資を受けた
もしOpenAIが後れを取れば、これらの契約を支えきれず、連鎖倒産のリスクが生じる。政府介入の可能性もある
- Altmanは救済はないと言っているが、その発言自体が信用確保戦略だ
- 5,000億ドルは支出の約束であって、収益ではない。大きな違いだ
- むしろ議会の膠着状態がこうした救済を防いでくれることを願う
- 大半は非拘束的なLOIなので、実際に見えるほど固い約束ではない
- LLMアーキテクチャではAGIに到達できないかもしれない。代替構造を開発しなければ、これらすべての契約は無意味になるだろう
OpenAIは広告・ショッピング・ヘルスエージェント・Pulseのようなプロジェクトを後回しにしてChatGPT改善へ集中するというが、根本的には中核人材は少数であり、残りの人員は広告や商用機能を担当できる。両者は衝突しない
- ボトルネックは人員ではなく、リーダーシップの戦略的思考余力だ
- 問題は製品の品質ではなく、エコシステム構築力かもしれない。Googleはすでに日常的なツールに統合されている
- LLMの発展は二層に分かれる: ①低レベルのアーキテクチャ ②応用・検証システム。後者は自動化された検証データ生成によって中核モデルの改善に寄与する
- 「延期」は完全停止ではなく、計算資源の再配分かもしれない
- 消費者の立場としては、こうした競争がモデル品質の向上につながることを願う
WSJによれば、OpenAIは広告、ヘルス・ショッピング向けAI、個人アシスタントPulseなどを先送りしている。Jony Iveとのハードウェア協業まで見ると、集中力が散漫になっている印象だ
- そのほかにも、ソーシャルネットワークやブラウザのようなプロジェクトも発表していた
- Googleと競争するには、広告市場への参入が最も重要だ。そうでなければ広告予算はMeta・Amazon・Googleへ流れていく
- 結局、広告とSiri/Alexa型アシスタントが中核なのに、それを先送りするのはおかしい
- 単に焦点を失ったのではなく、今や短期業績重視の企業になってしまった。Googleのように25年間そのゲームを続けてきた相手に勝つのは難しい。ハードウェア拡張だけでは限界がある
- 実際のところ、これはGoogleとの競争というより、広告がOpenAIの生存試験台だという話だ。
  もし広告で稼げるならOpenAIはMag 7級企業になるだろうが、失敗すれば現実が露わになる。
  すでに広告実験の結果が期待外れなら、「Code Red」はそれを覆い隠すための時間稼ぎのシグナルかもしれない。
  ChatGPTはGoogleのような検索の入口ではなく、Metaのようなフィード型広告も不可能だ。
  結局、Alexaの失敗を繰り返す可能性が高い.