25 ポイント 投稿者 GN⁺ 2026-04-27 | 16件のコメント | WhatsAppで共有
  • Redditのr/codexコミュニティで、2つのモデルのコーディング性能を比較する議論が進行中で、現時点では大多数のユーザーが GPT 5.5の優位 を支持
  • GPT 5.5は 安定性と精度 に優れ、Opus 4.7は最近の性能低下や利用量制限の問題への不満が大きい
  • Opus 4.7は フロントエンド/UIデザイン の分野では依然としてわずかに優位という評価もある
  • 複数のユーザーが、Claude(Opus)の 計算資源不足 による性能の引き下げ(lobotomize)を指摘し、信頼性の問題を提起
  • AIモデルの性能は今後も向上し続けるため、現在の優位性よりも アクセシビリティ・価格・利用制限・検閲ポリシー などが長期的にはより重要な選択基準になり得るという意見も示されている

全体的なコーディング性能の比較

  • コメントの大半が、GPT 5.5がコーディング/プログラミング全般で優位 だという点に同意
  • GPT 5.5は高速で有能であり、細部への注意力 がOpus 4.7より優れている
  • GPT 5.5はバグ修正や不足している依存関係の検出に効果的
  • Opus 4.7は純粋なコーディング能力そのものは近いという評価もあるが、「怠惰(lazy)」な傾向 があり、最小限の作業しか行わない場合がある
  • GPT 5.5はコードの 影響範囲を評価 して考慮事項を把握したうえで行動する一方、Opus 4.7は素早く中程度の解決策を作ろうとする傾向がある

UI/フロントエンドデザイン

  • デザインおよびフロントエンド の作業では、Opus 4.7のほうがやや良い結果を示す
  • ただしGPT 5.5でも、バンドのWebサイトデザインをロゴだけで ワンショット(one-shot)でほぼ完璧に実装 した事例がある
  • CodexのUI/UX作業は、プロンプトの質と視覚的手がかり の有無によって結果が変わる
  • 戦略として、GPT 5.5で 土台と構造を構築 し、Opus 4.7でフロントエンドデザインを整える組み合わせが推奨されている
  • UI部分を補完するために、Meta Muse Spark のような無料ツールを活用する提案もある

Opus 4.7の安定性・利用制限の問題

  • Opus 4.7は新規ユーザーの急増で 計算資源が不足 し、性能が引き下げられたという認識が広く広がっている
  • 4.7(および4.6)が 繰り返し性能を弱体化(nerfed) されたという不満が多い
  • Opus 4.7の max effortモードで幻覚(hallucination) が多いという報告
  • 18分のセッションで未完了のプロンプト1件が 5時間分の利用制限 を消費した事例
  • $20のClaude Proサブスクリプションでは、Opusの利用制限が非常に厳しいという評価
広告

GPT 5.5の長所と短所

  • GPT 5.5は 安定しており、性能の後退(regress)がなく 一貫した品質を維持
  • 虚偽情報を生成することがまだ見つかっていないというユーザー評価
  • ただし、プロンプトに明示された内容だけを 最小限に実行する「怠惰」な傾向 があり、詳細なプロンプティングや事前計画・Q&Aの過程が必要
  • トークン消費量が多い 傾向
  • GPT 5.4($20サブスクリプション)と比べると、5.5は 利用制限を2倍 消費する一方でベンチマーク向上は2〜5%程度であり、費用対効果に疑問もある

価格とサブスクリプションの比較

  • 個人利用基準では $100のChatGPT Proサブスクリプション が費用対効果に優れるという意見
  • Codex + $10のKimi または $22のGemini を組み合わせ、UI作業を補完する戦略が推奨されている
  • Googleストレージをすでに利用しているなら、Geminiは実質$10〜15 という見方
  • Claude MaxアカウントからGPT Plusへの完全移行を検討するユーザーもいる

長期的な視点

  • 数か月以内に中国モデルを含む すべてのモデルがOpus 4.6レベル以上 に達し、より低価格で提供される可能性
  • モデル性能そのものよりも、アクセシビリティ、価格、利用制限、検閲、コンテキスト認識能力 がより重要な差別化要因になる見通し
  • 現在はGPT 5.5が優位だが、過去にClaudeが全盛期から性能低下したように、Codexもまもなく性能が引き下げられる可能性がある という懸念
  • Kimi 2.6、GLM、MiniMaxなど 他モデルとの比較 への関心もある

16件のコメント

 
dicebattle 2026-04-28

性能を下げるようなサイレントパッチを当てても気づかれないと思っているんでしょうけど、実際には人の勘というのも思った以上に鋭いので、自分の勘+コミュニティの人たちの話を総合すると、すぐに答えは出ます。

「それでお前に何ができるんだよw」って話なので、結局は仕方なく使ってるだけです……

 
funnycat 2026-04-28

3.5の頃からずっとClaudeをメインで使っていましたが、5.5からはGPTをメインで使い始めました。かなり良い感じでした。

 
tkddls8848 2026-04-28

Claudeで計画だけ立てて、Codexで実行だけする方法はどうですか

 
cosine20 2026-04-28

私も最近はそのようにしています。ただ、Codex CLI はサンドボックスのポリシーが厳しすぎて、ビルドやテストまで任せようとするとかなり不便なんですよね。

 
kaydash 2026-04-28

どっちも話し方がひどくてイラッとします。ところで、どっちも怠け気味ですね。指示したことも抜けたままやりますし

 
jimmy2056 2026-04-27

これは完全に私が感じたことと似ていますね。だからGPTの100ドルのプランを課金して使っていて、
Claudeの200ドルのプランは100ドルに下げようかと考えています

 
mse9000 2026-04-27

codex 5.4 は日本語が少し不自然だったけど、性能はすでに opus 4.6 や opus 4.7 より上だった(変な言い回しが参入障壁 / 「開きました」「閉じました」「押します」みたいな感じなど)。

codex 5.5 は話し方も自然になって、ずっと丁寧で賢くなった。opus 4.7 = 怠け気味で推論コストを節約しているのがかなり伝わってきて、体感では opus 4.6 より退化したようにも感じる

 
dicebattle 2026-04-28

codex専用モデルの5.3のときは、本当に話の前置きがなくて、コーディングだけはうまい部下社員と会話している感じでしたが、
5.4から少しずつしゃべるようになって、5.5からは半分くらいは正気に戻った気がします。
まだAPIを契約と言ったり、たまに英語と韓国語をめちゃくちゃに混ぜて話したりするので、「わかりやすく、できるだけ英語を抜いて話してくれ」と書かなければならないこともありますが。

それでも、コードを出す性能は体感では5.4を境にopusを超えたと思います。opus 4.7は出ましたが、触ってみる気にもなりませんでした。また「Anthropic」式のマーケティングなのが目に見えているので。

 
cosine20 2026-04-28

むしろ Opus 4.6、4.7のほうが、韓国語がおかしくなり始めていましたね(笑)

 
bungker 2026-04-27

既存でClaudeでハーネスを構築している人にはClaudeが向いていて、初めて使うならGPTのほうが良いですね。コスパはGPTが圧倒的で、20ドルのものでも十分です。

 
memevibe82 2026-04-27

もともと開発をしていた人にはGPT 5.5のほうが向いていて、

非開発者にはClaudeのほうが向いていると思います。

でも、あまり議論する必要はなく、

役に立つものを作るのが一番ですよね..

 
rkjun 2026-04-27

全体的には GPT 5.5 のほうがより優秀だという流れですね。Claude Code (Opus 4.7) ばかり使ってきましたが……Codex も本格的に使ってみようと思います。

 
brainer 2026-04-27

実際、すでにGPT-5の時点から計画やフロントデザイン以外ではより優位でした。

コミュニティの反応がかなり遅いんですよね..

 
unknowncyder 2026-04-28

同感です
これまで実際の体感とコミュニティの反応が食い違っていて、ずっと乖離感を覚えていましたね

 
love7peace 2026-04-28

そうですね

 
treestae 2026-04-29

1年前ならClaudeを強く勧めていましたが、最近はCodex appを強く勧めます。