GPT 5.5 vs Opus 4.7、コーディング/プログラミングにより優れたモデルは?
(reddit.com)- Redditのr/codexコミュニティで、2つのモデルのコーディング性能を比較する議論が進行中で、現時点では大多数のユーザーが GPT 5.5の優位 を支持
- GPT 5.5は 安定性と精度 に優れ、Opus 4.7は最近の性能低下や利用制限の問題に対する不満が大きい
- Opus 4.7は フロントエンド/UIデザイン 領域では依然としてわずかに優位だという評価もある
- 複数のユーザーが、Claude(Opus)の 計算資源不足 による性能の下方調整(lobotomize)を指摘し、信頼性の問題を提起
- AIモデルの性能は今後も向上し続けるため、現在の優位性よりも アクセシビリティ・価格・利用制限・検閲ポリシー などが長期的にはより重要な選択基準になり得るとの意見も提示
全体的なコーディング性能の比較
- ほとんどのコメントが、GPT 5.5がコーディング/プログラミング全般で優位 という点に同意
- GPT 5.5は高速で有能であり、細部への注意力 がOpus 4.7より優れている
- GPT 5.5はバグ修正および欠落した依存関係の検出に効果的
- Opus 4.7は純粋なコーディング能力自体は近いという評価もあるが、「怠惰(lazy)」な傾向 があり、最小限の作業しか行わない場合がある
- GPT 5.5はコードの 影響範囲を評価 し、考慮事項を把握したうえで行動する一方、Opus 4.7は素早く中程度のソリューションを作ろうとする傾向がある
UI/フロントエンドデザイン
- デザインおよびフロントエンド 作業では、Opus 4.7がやや良い結果を示す
- ただしGPT 5.5でも、バンドのウェブサイトデザインをロゴだけで ワンショット(one-shot)でほぼ完璧に実装 した事例がある
- CodexのUI/UX作業は、プロンプトの品質と視覚的な手がかり の有無によって結果が変わる
- 戦略として、GPT 5.5で 土台と構造を構築 し、Opus 4.7でフロントエンドデザインを磨き上げる組み合わせが推奨されている
- UI部分を補完するために、Meta Muse Spark のような無料ツールを活用する提案もある
Opus 4.7の安定性・利用制限の問題
- Opus 4.7は新規ユーザーの急増により 計算資源が不足 し、性能が下方調整されたという認識が広く広がっている
- 4.7(および4.6)が 繰り返し性能を弱体化(nerfed) されたという不満が多数ある
- Opus 4.7の max effortモードで幻覚(hallucination) が多いという報告
- 18分のセッションで未完了のプロンプト1件が 5時間分の利用制限 を使い切った事例
- $20のClaude Proサブスクリプションでは、Opusの利用制限が非常に厳しいとの評価
GPT 5.5の長所と短所
- GPT 5.5は 安定しており、性能の後退(regress)なく 一貫した品質を維持
- 虚偽情報を生成することがまだ確認されていないというユーザー評価
- ただし、プロンプトに明示された内容だけを 最小限に実行する「怠惰」な傾向 があり、詳細なプロンプティングや事前計画・Q&Aの過程が必要
- トークン消費量が多い 傾向がある
- GPT 5.4($20サブスクリプション)と比べると、5.5は 利用制限を2倍消費 する一方で、ベンチマーク向上は2〜5%水準にとどまり、コストパフォーマンスに疑問もある
価格とサブスクリプションの比較
- 個人利用基準では $100のChatGPT Proサブスクリプション がコストパフォーマンスに優れるという意見
- Codex + $10のKimi または $22のGemini を組み合わせてUI作業を補完する戦略が推奨されている
- Googleストレージをすでに利用しているなら、Geminiは実質$10〜15 水準
- Claude MaxアカウントからGPT Plusへ完全移行を検討するユーザーもいる
長期的な視点
- 数か月以内に中国モデルを含む すべてのモデルがOpus 4.6水準以上 に到達し、より低価格で提供される可能性がある
- モデル性能そのものより アクセシビリティ、価格、利用制限、検閲、コンテキスト認識能力 の方が重要な差別化要因になる見通し
- 現在はGPT 5.5が優位だが、過去にClaudeが全盛期から性能低下したように、Codexも近いうちに性能が下方調整される可能性がある という懸念
- Kimi 2.6、GLM、MiniMaxなど 他モデルとの比較 への関心もある
16件のコメント
性能を下げるようなサイレントパッチを当てても気づかれないと思っているんでしょうけど、実際には人の勘というのも思った以上に鋭いので、自分の勘+コミュニティの人たちの話を総合すると、すぐに答えは出ます。
「それでお前に何ができるんだよw」って話なので、結局は仕方なく使ってるだけです……
3.5の頃からずっとClaudeをメインで使っていましたが、5.5からはGPTをメインで使い始めました。かなり良い感じでした。
Claudeで計画だけ立てて、Codexで実行だけする方法はどうですか
私も最近はそのようにしています。ただ、Codex CLI はサンドボックスのポリシーが厳しすぎて、ビルドやテストまで任せようとするとかなり不便なんですよね。
どっちも話し方がひどくてイラッとします。ところで、どっちも怠け気味ですね。指示したことも抜けたままやりますし
これは完全に私が感じたことと似ていますね。だからGPTの100ドルのプランを課金して使っていて、
Claudeの200ドルのプランは100ドルに下げようかと考えています
codex 5.4 は日本語が少し不自然だったけど、性能はすでに opus 4.6 や opus 4.7 より上だった(変な言い回しが参入障壁 / 「開きました」「閉じました」「押します」みたいな感じなど)。
codex 5.5 は話し方も自然になって、ずっと丁寧で賢くなった。opus 4.7 = 怠け気味で推論コストを節約しているのがかなり伝わってきて、体感では opus 4.6 より退化したようにも感じる
codex専用モデルの5.3のときは、本当に話の前置きがなくて、コーディングだけはうまい部下社員と会話している感じでしたが、
5.4から少しずつしゃべるようになって、5.5からは半分くらいは正気に戻った気がします。
まだAPIを契約と言ったり、たまに英語と韓国語をめちゃくちゃに混ぜて話したりするので、「わかりやすく、できるだけ英語を抜いて話してくれ」と書かなければならないこともありますが。
それでも、コードを出す性能は体感では5.4を境にopusを超えたと思います。opus 4.7は出ましたが、触ってみる気にもなりませんでした。また「Anthropic」式のマーケティングなのが目に見えているので。
むしろ Opus 4.6、4.7のほうが、韓国語がおかしくなり始めていましたね(笑)
既存でClaudeでハーネスを構築している人にはClaudeが向いていて、初めて使うならGPTのほうが良いですね。コスパはGPTが圧倒的で、20ドルのものでも十分です。
もともと開発をしていた人にはGPT 5.5のほうが向いていて、
非開発者にはClaudeのほうが向いていると思います。
でも、あまり議論する必要はなく、
役に立つものを作るのが一番ですよね..
全体的には GPT 5.5 のほうがより優秀だという流れですね。Claude Code (Opus 4.7) ばかり使ってきましたが……Codex も本格的に使ってみようと思います。
実際、すでにGPT-5の時点から計画やフロントデザイン以外ではより優位でした。
コミュニティの反応がかなり遅いんですよね..
同感です
これまで実際の体感とコミュニティの反応が食い違っていて、ずっと乖離感を覚えていましたね
そうですね
1年前ならClaudeを強く勧めていましたが、最近はCodex appを強く勧めます。