- コーディング関連の完成度: GPT5.2 > GPT5.1 >>> Sonnet4.5 >> GEMINI 3 pro
- ChatGPT5 系列はコーディング時のハルシネーションや文脈忘れが他社比で圧倒的に少ない。5.2 は 5.1 と比べて価格が 40% 上昇
- CLAUDE Sonnet 4.5 は 自動キャッシュがないため料金プラン全般に大きな落とし穴がある。$20 でアカウントを 2 つほど作って使うのを推奨
- Google Gemini 3 Pro は スーツを着た認知症の紳士。自動キャッシュが適用されるため料金プランの落とし穴はない。しかしトークン消費量が他モデルより 10〜20 倍高い
- 大きな人気を集めている Gemini3 は最もハルシネーションがひどいモデル
9件のコメント
こういう話を見ると、私は単純にツールのシステムプロンプトの重要性を感じます。今のところ Cursor で使うなら、個人的には opus >= gpt 5.2 > gemini 3 だと思っています。それ以外の Sonnet や 5.1 などは……個人的にはもう使っていません。ただ……gpt 5.2 は effort ごとの差がかなり大きいです……でも、いつも高い effort が良いとは限らないんですよね……なので、opus と gemini を主力で使うようになります。たまに難題にぶつかったら、3つ全部にコーディングさせて、互いにコードを評価させたあと、私が確認して適用しています。
ChatGPTの有料サブスクを契約して、AntigravityでOpusを回している。Codeは遅すぎて使い物にならない。Claudeなら5分で済む作業に10分はかかる。Claude Codeのツール使用は、CodexやGemini CLIより圧倒的だ
Antigravityでのopusと、Claude Codeでのopusでは、どちらのほうが良いでしょうか?
Opus 4.5 に言及されていないのが落とし穴
でも、もう圧倒的な性能差が出ないなら、設定変更が面倒であまり乗り換えなくなるんですよね…
opus や codex max のようなものはないんですね…。
自動キャッシュが効かないというのがどういう意味なのか、いまいち分かりません……。Claude Codeでキャッシュ設定をしていないということなのか、それともAPIを直接取得して使っているということなのでしょうか……?
確かに私も gemini 3 を使いながら、コンテキストをよく見失う(わざとトークンを節約するために失わせている)ような感覚をかなり受けました。
アプリケーションの立場からすると、なぜ人々がジェミナイ3の性能が良いと言うのか理解できない一人です。
画像生成みたいなものはすごいですが..
claude opus 4.5 がないですね