- 複数のAIエージェントを同時に管理し、並列作業と長期的な協業を支援するAI開発統合環境
- 各エージェントが独立したスレッドで実行され、プロジェクトごとのマルチタスク、コードレビュー、diffコメント、手動修正が可能
- Skills機能により、コード作成だけでなく、情報収集、問題解決、画像生成、文書作成、クラウド配備など多様な作業へ拡張
- Automations機能により、定めたスケジュールに従ってバックグラウンドで自動的に反復作業を実行可能
- 基本的にサンドボックスセキュリティが適用され、ネットワークアクセスなど上位権限が必要なコマンドはユーザー承認が必要
- ChatGPT FreeおよびGoユーザーにも期間限定でCodexを提供、有料プランは利用上限が2倍に増加
Codexアプリ概要: エージェントのためのコマンドセンター
- 2025年4月のCodex公開以降、開発者によるエージェント活用の方法が根本的に変化
- モデルが複雑で長期的な作業を最初から最後まで処理できるようになった
- 開発者は今や複数のエージェントをプロジェクト全体で調整しながら作業を委任し、並列実行している
- 中核課題は「エージェントが何をできるか」から、**「人がどのようにエージェントを大規模に指揮・監督し、協業できるか」**へと移行
- 既存のIDEやターミナルベースのツールはこうした作業様式を支援するよう設計されておらず、新しいツールが必要
- macOS向けCodexアプリは、複数のAIエージェントを同時に管理し、並列で作業を実行できる
- 長時間実行される作業を支援し、エージェント間の協業を通じてソフトウェアの設計・開発・配備・保守の全工程を管理
複数エージェントによる並列作業
- Codexアプリはエージェントとのマルチタスクのための集中空間を提供
- エージェントはプロジェクトごとに構成された別個のスレッドで実行され、コンテキストを失うことなく作業間を切り替えられる
- スレッド内でエージェントの変更内容を確認し、diffにコメントを付けたり、エディタで直接修正したりできる
- Worktreesを標準サポートし、複数のエージェントが同一リポジトリ上で競合なく作業
- 各エージェントはコードの隔離されたコピーで作業するため、ローカルのgit状態に影響を与えずにさまざまな経路を探索できる
- エージェント作業中の変更をローカルでチェックアウトしたり、ローカルのgit状態を変更せずに作業を継続したりできる
- Codex CLIおよびIDE拡張からセッション履歴と設定を自動で取り込み、既存プロジェクトですぐ利用可能
Skills: コード生成を超える拡張
- Codexはコードを書くエージェントから、コードを使ってコンピュータ上で作業を実行するエージェントへ進化中
- Skillsにより、情報収集と統合、問題解決、文書作成など、コード生成を超える作業へ拡張可能
- 指示、リソース、スクリプトをバンドルとしてまとめ、Codexがツールに接続してワークフローを実行できる
- チームの好みに応じて作業を安定して完了できる
- CodexアプリにはSkillsを作成・管理する専用インターフェースを搭載
- 特定のSkillsの利用を明示的に要求したり、作業内容に応じて自動使用するよう設定したりできる
-
Skills活用例: レーシングゲームの生成
- Codexに、多様なレーサー、8つのマップ、スペースバーで使用できるアイテムを含むレーシングゲームの制作を依頼
- 画像生成スキル(GPT Imageベース)とWebゲーム開発スキルを活用
- 単一の初期プロンプトで700万トークン超を自律的に処理してゲームを完成
- デザイナー、ゲーム開発者、QAテスターの役割を担い、実際にゲームをプレイして検証
- ゲーム名: Voxel Velocity、Three.jsを使った3Dボクセルカートレーサー
- シングルレースモード(常に3ラップ、人間1人 vs CPU7人、8つのトラックを即時利用可能)
- アーケードドライビングモデル、ドリフトチャージシステム、ブーストティア(Tier 1 0.7秒、Tier 2 1.1秒、Tier 3 1.5秒)
- 8キャラクター、8アイテム、CPU難易度プリセット、AIスプライン実装
-
提供される主なSkills
- Implement designs: Figmaからデザインコンテキスト、アセット、スクリーンショットを取り込み、1:1の視覚的一致を持つ本番用UIコードへ変換
- Manage projects: Linearでバグの分類、リリース追跡、チームのワークロード管理
- Deploy to the cloud: Cloudflare、Netlify、Render、Vercelなど主要クラウドホストへWebアプリを配備
- Generate images: GPT Imageベースの画像生成スキルで、Webサイト、UIモックアップ、製品ビジュアル、ゲームアセット向けの画像を生成・編集
- Build with OpenAI APIs: OpenAI APIで構築する際に最新ドキュメントを参照
- Create documents: PDF、スプレッドシート、docxファイルの読み取り、生成、編集(専門的な書式とレイアウトをサポート)
- アプリで新しいスキルを作成すると、アプリ、CLI、IDE拡張のどこからでも利用可能
- スキルをリポジトリにチェックインして、チーム全体で共有可能
Automations: 反復作業の自動化
- Automations機能により、Codexが定義済みスケジュールに従ってバックグラウンドで自動作業を実行
- 指示と任意のスキルを組み合わせて設定
- 完了時の結果はレビュー待ちキューに保存され、必要に応じて作業を継続できる
- OpenAI社内での活用例
- 日次のイシュー分類
- CI失敗の検出と要約
- 日次リリースブリーフの作成
- バグ確認
Personality: 作業スタイルのカスタマイズ
- 開発者ごとにエージェントとの作業スタイルの好みは異なる
- 簡潔で実行重視のパートナーを求める場合
- より会話的で共感的なやり取りを好む場合
- Codexでは2種類のパーソナリティを選択可能: 簡潔で実用的なスタイル vs 会話的で共感的なスタイル
- 機能の変化なく、好みの方式に合わせられる
- アプリ、CLI、IDE拡張で**/personality**コマンドにより設定
セキュリティ: 標準適用かつ設定可能
- Codexエージェントスタック全体に設計段階からセキュリティを統合
- Codex CLIと同様に、ネイティブでオープンソース、設定可能なシステムレベルのサンドボックスを使用
- デフォルト設定
- エージェントは作業中のフォルダまたはブランチ内ファイルの編集と、キャッシュされたWeb検索のみ許可
- ネットワークアクセスなど上位権限が必要なコマンド実行時はユーザー承認を要求
- プロジェクトまたはチーム向けルールを構成し、特定コマンドを上位権限で自動実行するよう設定可能
利用可能性と価格
- Codexアプリは本日よりmacOSで利用可能
- ChatGPT Plus、Pro、Business、Enterprise、Eduの購読者は、ChatGPTログインでCLI、Web、IDE拡張、アプリからCodexを利用可能
- 利用量はChatGPT購読に含まれ、必要に応じて追加クレジット購入オプションを提供
- 期間限定でChatGPT FreeおよびGoユーザーにもCodexを提供
- この期間中、すべての有料プランの既存Codexユーザーに対して利用上限を2倍に増加
今後の計画
- 2024年12月中旬のGPT-5.2-Codex公開以降、Codex全体の利用量が2倍に増加
- 過去1か月で100万人以上の開発者がCodexを利用
- 今後の計画
- Windowsアプリを公開予定
- モデル機能の最前線を拡張
- より高速な推論を提供
- アプリ内の改善点
- 実際のフィードバックに基づき、複数エージェントのワークフローを継続的に改善
- 並列作業の管理と、エージェント間の切り替え時におけるコンテキスト維持のしやすさを向上
- Automationsの拡張
- クラウドベースのトリガー対応を構築中
- コンピュータが開いていなくてもCodexがバックグラウンドで継続実行可能に
Codexの中核となる前提
- すべてがコードで制御されるという単純な前提に基づく
- エージェントがコードについて推論し生成する能力が高いほど、あらゆる種類の技術・知識作業でより有能になる
- 現在の中核課題: フロンティアモデルの能力と、人々が実際に簡単に使える度合いとの間のギャップ
- Codexは、モデルの持つ知能全体を実作業へ容易に指揮・監督・適用できるようにすることで、このギャップを埋めるよう設計されている
- 最高のコーディングエージェントを作ることに注力しており、これはコード作成を超えて広範な知識労働のための強力なエージェントの基盤になると見込まれる
9件のコメント
私も最近は Codex がメインですが、いいですね。Windows版も早く出てほしいです。
最初に起動すると、これまで Codex で作業していたプロジェクトを一気に読み込んで、左側にプロジェクト/スレッド単位でずらっと表示してくれるので、複数を同時に動かすのにちょうどいいです。
Claude Codeではなく、Codexがメインである理由はありますか?
自分は長めのプラン文書を作って「これで進めて」と投げるやり方をすることが多いんですが、Codexのほうがこの手の使い方にはより合っていると感じました。
それと、確かにレートリミットにもあまり引っかかりません。安いアカウントで複数のプロジェクトを同時に回すことが多いのに、です。
おお、コメントありがとうございます。
OpenClaw の作者が Codex を使っているのもそうですし、
> MoltBot 제작자: “나는 읽지 않은 코드를 배포한다”
Codex も評判は悪くなさそうですが、Hacker News のコメントを見るとまたそうでもないような気もします……
本当に Windows/Linux もお願いします…
ChatGPTブラウザのAtlasも使ってみたかったのに、Windows版は coming soon としておいてずっと音沙汰がないですね
今日使ってみたのですが、すごく良かったです。
VSCodeフォーク勢は、滅びる覚悟をしておいたほうがよさそうですね。
もちろん、開発者の仕事が減る可能性もありそうです。
Windowsにはサンドボックス技術がないので、いろいろやるのは難しそうですね
WSLかWindows版をくれ…
Hacker Newsの意見
大半は単なるチャットUI程度なのに、ElectronではOS API(例: Win32)を直接呼び出しにくく、深い統合ができない
Blender、Godot、Unity、UE5のような複雑なソフトウェアもすべてネイティブで動いているのに、こうした企業が言い訳ばかりしているのはもどかしい
WindowsではElectronが事実上の標準で、Microsoft自身もよく使っている
macOSはずっとましだが、チームは結局Mac専用に閉じるか、Electronでクロスプラットフォームを選ぶことになる
UE5のUIもほとんどネイティブ感がなく、Electronより良いと言えるかも怪しい
ElectronでもネイティブAPIの呼び出しは可能だ
ほとんどのユーザーはアプリがネイティブかどうかを気にせず、Web開発者をデスクトップアプリ開発に再活用できる点が企業にとっては大きな利点だ
TUIやGUIは不要な抽象化レイヤーで、自動化を難しくする
重要なのは単純なコマンド呼び出しとログ記録だ。[headlessモードやセッションログ]がその方向に近い
ほとんどの人はアプリがWeb技術で作られているかどうかを気にしない
ElectronのおかげでLinuxへの移植も簡単になる。ネイティブにこだわっていたらこうしたことは不可能だっただろう
完璧ではないが、中堅エンジニア級の結果を安定して出してくる
ただしアプリが「Loading projects...」で止まってしまう
ドキュメントのリンクも壊れていたが、このリンクは今は動く
複数のVM環境をVS Code Remoteで使っているので、ポートオフセット設定を少し変える必要がありそうだ
Codexは問題解決中にループにはまることが多く、Claudeがそういう部分をうまく締めてくれる
2つのモデルを交互に使うやり方はかなり効率的だ
それでも着実に改善されているので期待している
CoworkはClaude CodeをVMで呼び出し、CodexはCLIをOSサンドボックス内で実行する
技術スタックはElectron 40、React 19、TypeScript、Node.js、SQLite、Viteなどで構成されている
macOS向けにはSparkle、Squirrel、Sentryなどを使っている
指示に従わず、途中で止まったり、とんちんかんなコードを投げてきたりする
Nuxt 4+に関する最新データがなく、ずっとエラーを出していた
Undo機能もまともに動かず、フィードバックもない
Claude Codeは同じ作業を一発で処理したのに、Codexは時間がかかるうえにひどい出来だった
これを見ていると、昔Nokia N800を使っていたときのように、可能性はあるのに完成度が低すぎてOpenAIの方向性が心配になる
Anthropicも似たようなClaude Codeマルチエージェントアプリを出すのか気になる
明確な契約(API定義など)があるなら、独立したセッションで並列作業したほうが効率的だ
自分でも似たものを作りかけたことがある
Recursive Language Models論文の要点は、要求事項や設計、計画などを文脈ではなく不変オブジェクトとして管理することだ
自分は各段階(spec、analysis、planなど)を.mdファイルで管理し、承認ステップを置いたkanbanプロセスで運用している
こうするとUIがなくてもうまく回り、コード品質が保たれて、長期的には開発速度が10倍速くなる
.claude/commandsと.claude/agentsを使えば複数の作業を同時に走らせられるCodexはClaudeが見落とす部分をうまく拾ってくれ、2つのモデルを相互補完的に使うと効率が高い
Codexは安価でほぼ無制限に近い利用量が長所で、Claudeは品質がより高い
plan.mdをベースにプロセスを組み立て、動的にステップやフックを追加できる
ワークフロー自動化を文書ベースで制御できるので便利だ
すでに主要3モデルにお金を払っているので、こういうサービスは長続きしない気がする
700万トークンを使ったと言うのに、こんなQAミスを見逃したのは驚きだ
こういう微妙な問題はテストハーネスやQAエージェントでは拾いにくい
トークンが増えても完成度が上がっただけで、プレイ内容は同じだ。あの追加トークンで何をしたのか気になる
CLI版でも同じ機能をサポートする予定があるのか気になる
内部ネットワーク内だけで動作する管理クラスタ機能があるといい
チームメンバーと作業進捗の共有もできれば理想的だ
こうした機能をツール側でサポートしてくれると、ずっと便利だと思う
最近のGPT-5.xの品質も落ちており、今回の発表でもMac専用リリースだけだったのが残念だ
記事に誤字も多く、実際に使われたプロンプトを公開していない点にも不満がある
それでも改善されるなら、また使ってみるつもりはある
SonnetやGemini 3.0 Flashの速度に慣れているせいかもしれない
20ドルのChatGPTのほうが200ドルのClaudeより効率的だ