ソフトウェアエンジニアのためのCodex
(academy.openai.com)- OpenAIが公開した、開発者向けCodex講義のウェビナー動画(58分)
- Codexはコード補完やペアプログラミングを超え、エンジニアが大規模な作業をエージェントに委任できるよう設計されたコーディングエージェントプラットフォーム
- Codexアプリ、CLI、IDE拡張などさまざまなインターフェースで同一のバックエンドを共有し、複数の作業を並列に同時実行可能
- 計画(Plan)、設計(Design)、ビルド(Build)、テスト(Test)、レビュー(Review)、ドキュメント化(Document)、デプロイと保守(Deploy & Maintenance)まで、ソフトウェア開発ライフサイクル(SDLC)全体をカバー
- agents.mdファイルを通じて、エージェントの行動指針をリポジトリ単位で設定し、SkillsとAutomationsで反復ワークフローをパッケージ化して自動実行可能
- 25時間の連続作業と13〜14回の**サーバーサイドコンパクション(compaction)**による長時間コンテキスト維持が可能で、OSレベルのサンドボックスでセキュリティを確保
AIコーディングの進化: コード補完からエージェント委任へ
- 過去数年間でAIコーディングは、コード補完(タイピング速度を約10%向上)→ ペアプログラミング(ファイル横断の計画、テスト実行、リポジトリ修正)という段階を経て進化
- どちらのアプローチも「より良い共同作業者」を作ることに焦点を当てていたが、Codexは1年前から委任可能なエージェントの構築を目標に開発開始
- 2025年12月、GT 5.2 Codexモデルが長時間の連続作業と高い操縦性(steerability)を確保し、「真のエージェント委任」における主要な障壁を解消
- その後、より高速で効率的なGT 5.3、そして最新のGT 5.4モデルへと性能が継続的に向上
- 大規模なエンタープライズコードベースを安定して探索し、ユーザーの意図に合わせて長時間アラインメントを維持することが、主要な進化ポイント
Codexで利用可能なインターフェース
- Codexは1つのエージェントをCLI、IDE拡張、Codexアプリなど複数のサーフェスで利用でき、すべて同じバックエンドを共有
- Codexアプリは並列作業実行に最も視覚的なインターフェースで、複数のエージェントを同時に動かし、出力をレビューするのに最適化
- Peter Steinberger(OpenClaw創業者)の事例: 従来は10個以上のCLIウィンドウを管理していた方法からCodexアプリへ移行し、並列エージェント管理の効率が向上
- macOSとWindowsの両方に対応し、openai.com/codexからダウンロード可能。WindowsはMicrosoft Storeでも提供
- CLIでは
codex loginコマンドで初回ログイン後、codexコマンドでセッションを開始
CodexアプリのUIと設定
- モデル選択(GPT 5.4など)と**推論努力レベル(reasoning effort)**の調整が可能: low、medium、high、extra high
- mediumがデフォルトで、速度と推論の深さのバランスが最も良い
- 簡単な質問にはlow、長時間の深い思考が必要な場合はhighまたはextra highが適切
- Speedモード(fast/standard)トグルで応答速度を調整可能
- ローカル作業に加え、Git worktreeモードとリモートクラウドコンテナ起動オプションを提供
- 権限設定: 基本権限(プロジェクト内ファイルの読み取り/編集、危険なコマンド時に承認要求)とフルアクセス(コンピュータ内の全ファイル、ネットワークアクセス、承認なし実行)から選択可能
- 新規ユーザーには基本権限を推奨
- 左サイドバーからプロジェクト(フォルダ)の追加と切り替えが可能
SDLC全段階でのCodex活用
- OpenAIは「Building an AI Native Engineering Team」ガイドを発行し、コーディングエージェントがSDLCの7段階(計画、設計、ビルド、テスト、レビュー、ドキュメント化、デプロイ/保守)全体を加速する方法を整理
- 特にテストとレビュー段階は、コード生成能力の向上に伴ってさらに重要になっている
- 複雑なコードベースでの推論と、プロダクションレベルのコード作成においてCodexが特に高く評価されている
計画(Plan)段階
- Planモードを有効化(
/planまたはShift+Tab)すると、Codexが実装前にまず計画を立案 - デモではSwiftUIのiOSコンパニオンアプリの計画を依頼すると、Codexがコードベースを探索した後に追加質問(認証方式、初回リリース範囲など)を提示
- 推奨オプションの受け入れ、または直接入力によってエージェントを調整可能
- 計画に関する仮定(assumptions)を明示し、ユーザーが検証・修正できる構造
設計(Design)段階 — MCP連携
- **MCP(Model Context Protocol)**を通じて、Figma、Linearなど外部ツールのコンテキストをCodexへ直接接続
- CLI、IDE拡張、Codexアプリのすべてのインターフェースで対応
- Figma MCP連携時はデザインリンクを貼り付けると、Codexがデザインコンテキストを取得してコードへ変換
- MCPが未設定の場合、Codexが自動でインストール案内を表示
- ChatGPTアプリ統合もサードパーティ製の連携としてCodexから直接利用可能
- これによりエンジニアはコアロジックに集中でき、デザイナーはより多くのデザインコンセプト探索に時間を使える
ビルド(Build)段階
- SDLCの中でコーディングエージェントの影響が最も大きい段階
- デモではN+1クエリの非効率修正と回帰テスト追加、APIルートの認証漏れ監査、NextAuth v4からAuth.js v5へのマイグレーションなどを並列実行
- Figmaデザインベースのコード生成結果: 10ファイルを変更し、320行のコードを作成、CSSの手作業は不要
- Worktree機能により、ローカルプロジェクトのコピーを自動生成して並列作業間の衝突を防止し、別途リポジトリを複製する必要がない
- agents.mdに指定した
npx tsc、npm testなどの検証・ビルド・lintコマンドをCodexが自動実行し、チーム規約への準拠を確認 - ビルドそのものはもはやボトルネックではなく、エンタープライズ環境ではコードがチーム規約に適合しているかの検証が核心
- Command+Jでアプリ内から直接ターミナルを開いて利用可能
- iOSアプリもXcodeを直接開かずにCodexアプリ内で
xcode buildを実行可能
スラッシュコマンド(Slash Commands)
- CLI、IDE拡張、Codexアプリのすべてでスラッシュコマンドをサポート: planモード、ファイルメンション、セッション状態確認、権限変更など
/experimentalコマンドで実験的機能をトグル可能- **マルチエージェント(sub-agents)**生成機能を含む
- CLIは他のインターフェースよりやや先行して新機能を搭載
- あるインターフェースで切り替えた設定は同一バックエンドを共有するため、すべてのインターフェースに反映
レビュー(Review)段階
/reviewコマンドで、ベースブランチとの差分またはローカルの未コミット変更に対するコードレビューを実行- CodexエージェントはP0/P1レベルのバグ特定に特化して訓練されており、ノイズの少ない高シグナルなフィードバックを提供
- PRがCI/CDパイプラインに到達する前に、ローカルで早期に問題を発見できる
- GitHub Cloudネイティブ統合: CodexがPRに対して事前(proactive)または事後(reactive)のコードレビューを自動実行
- regexルールのレビューのように、人間が見落としやすいP1問題を捉えた事例を紹介
- GitLab、Bitbucketなど他のSCMはCodex SDKを通じて直接連携を構築可能
- diffパネルで直接コードレビューコメントを追加すると、次の会話のコンテキストへ自動反映
Skills — 再利用可能なワークフローパッケージ化
- Skillは、Codexが実行する再利用可能なワークフロー手順をパッケージ化したオープン標準
- 構造としては1つのフォルダで、必須ファイルはskill.md(メタデータ + エージェント指示)
- 任意で実行スクリプト、ドキュメント、テンプレートを追加可能
- MCPをskill内に埋め込んで、外部ツール連携も可能
- デモ例: PRコメント処理、BuildKiteビルド失敗の自動修正、デッドコード検出など
- Skill Creator(システムスキル): 会話中に「create a skill to find dead code paths」のように依頼すると、自動でskill.mdをスキャフォールド
- Skill Installer(システムスキル): 生成したスキルをローカルのCodexスキルディレクトリへ即時インストール
- 長い会話の後に繰り返されるワークフローをskillへ変換しておけば、次回は1回の呼び出しでワークフロー全体を実行可能
- GitHub Issue Plan PRスキルの例: 1つのプロンプトでGitHub Issueトリアージ → 計画 → 編集 → ドキュメント化 → ドラフトPR作成まで、SDLC全段階を一括実行
ドキュメント化(Documentation)段階
- Codexの最も過小評価されている活用領域の1つ
- システムダイアグラム生成、機能実装時のドキュメント自動更新などを支援
- Linear MCPと連携し、特定チケットの修正内容、回帰テスト結果、検証内容をLinearボードへ自動記録するデモを紹介
デプロイと保守(Deploy & Maintenance)段階
- CodexアプリからCommit、Push、PR作成をボタンクリックで直接実行(Gitベース)
- スタックトレースを貼り付けると、Codexがコードベース全体を推論して問題の原因を把握
- Triage Pageスキル: インシデントIDを入力すると、詳細情報の収集、インシデント確認、メトリクス・ログ検査、パッチ適用までをワンストップで処理
- ページャー対応を手動ログ解析からエージェント委任へ転換
- PR Babysitterスキル: PRのCI/CDパイプライン進行を継続監視し、問題発生時は自動修正して最終的にマージまで自動完了
- OpenAIの大規模モノレポ環境で実運用中
- オープンソースのスキルリポジトリからダウンロード可能
Automations — スケジュールベースの自動実行
- スキル活用に慣れた後は、Automations機能で特定スケジュールに作業を自動実行する設定が可能
- Sentryスキル自動化: 毎週木曜日(または毎日)に特定リポジトリの問題を見つけて修正提案または自動修正
- 「What is everyone up to?」自動化: 毎朝9時に、リポジトリにおけるチームメンバーの活動状況を要約出力
- プロンプトを直接入力しなくても、Codexがバックグラウンドで継続的に作業を実行
Codexエージェントの動作原理
- Codexエージェントはループベースで動作: ユーザーが明確な目標と初期方針を与える → エージェントが推論、ツール呼び出し、ファイル読み取り、リポジトリ検索、コード作成、コマンド実行を繰り返す
- 各ツール結果は次のモデル呼び出しへフィードバックされ、段階的な理解の構築と進行につながる
- **コンテキスト(context)**がエージェント性能を左右する核心変数であり、適切な量の入力で正しい方向を示すことが重要
- OSレベルのサンドボックス化: ハーネスレベルの軽量制限ではなく、OSレベルでネットワーク・ファイルアクセスを制御
- モデル進化により軽量保護を回避する可能性を見越した設計
- すべてのシステム(Mac、Windows)でサンドボックスをサポートし、WindowsではWSLより安全性を高めたネイティブWindowsサンドボックスを実装
- config TOMLファイルでapproval mode(承認タイミング)とsandbox mode(アクセス範囲)の詳細設定が可能
- デフォルトは「on request」で、通常実行しつつ権限昇格が必要な場合に一時停止
コンパクション(Compaction) — 長時間スレッド管理
- 会話がモデルのコンテキスト制限に近づくと、Codexが冒頭部分を圧縮するコンパクションを実行
- コンパクションはサーバーサイドで生の思考チェーン(chain of thought)ベースに処理されるため、クライアントサイドよりも作業の実質的内容をよりよく保持
- 実例: 25時間の連続作業中に13〜14回のコンパクションを実行しながら、コンテキスト維持に成功
効果的な委任のためのプロンプティングベストプラクティス
- 最小限のプロンプトに、明確な目標、制約条件、「完了」の基準を含める
- 検証条件をプロンプトに内蔵: 成功基準、実行するテスト・ビルドコマンドを明記
- オープンエンドなプロンプトを活用: 性能改善アイデアやテストカバレッジ不足領域などをCodexに尋ね、思考パートナーとして活用
agents.md — エージェント行動指針ファイル
- CursorのRules、Windsurfの設定などに似たオープンフォーマットで、OpenAI専用ではない
- すべてのCodexセッションで自動ロードされ、一貫した結果の生成に寄与
- 3段階の優先順位体系:
- グローバル(
~/.codex/agents.md): 個人のデフォルト設定(チーム非依存) - リポジトリルート(
agents.md): リポジトリ全体の規約 - サブディレクトリ(
agents.md): マイクロサービス/サブフォルダごとの詳細指示 - Codexはプロジェクトルートから現在ディレクトリまで**パスに沿ってagents.mdを連結(concatenate)**し、より具体的なファイルを優先
- グローバル(
- 推奨される記載内容: リポジトリ概要、実行コマンド、テスト期待値、主要モジュールの場所、コミット/PRガイドライン
/initコマンド(CLI)で最初のagents.mdを自動生成でき、コールドスタート問題を解消- 100行以下の簡潔さを保つことを推奨(OpenAI内部モノレポのagents.md基準)
- 内容が長くなる場合は、タスク別Markdownファイル(planning.md、code-review.md、architecture.mdなど)へ分割し、agents.mdから参照
- Codexにローカルセッションログ(保存パス提供あり)を分析させ、毎週agents.md改善案を自動提案させる自動化パターンを紹介
- Codexに**会話の振り返り(retrospective)**を依頼し、gotchaセクションや参考事項をagents.mdへ自動反映する活用法
まとめ — Codex導入のための3つの重要な実践事項
- agents.mdの作成とカスタム設定の構成
- 実際の業務タスクをCodexに任せ、日常的に使うツール(MCP)と接続する
- ビルド段階だけでなく、設計からデプロイ・保守まで開発ループ全体でCodexを動かし、継続的に反復する
3件のコメント
OpenAIアカデミーもオープンしてからもうほぼ1年で、かなり良い講義がたくさん蓄積されています。
(ただ、自動生成の英語字幕しかないのは少し残念)
日本語字幕があればよかったのですが、残念ですね……
これを聞いた方いますか?
1時間を投資するだけの価値はありますか?
AIでサクッと済む時代だからこそ、時間が貴重でして(笑)