ソフトウェアエンジニアのためのCodex

(academy.openai.com)

69 ポイント投稿者 GN⁺ 2026-03-19 | 3件のコメント | WhatsAppで共有

OpenAIが公開した、開発者向けCodex講義のウェビナー動画（58分）
Codexはコード補完やペアプログラミングを超え、エンジニアが大規模な作業をエージェントに委任できるよう設計されたコーディングエージェントプラットフォーム
Codexアプリ、CLI、IDE拡張などさまざまなインターフェースで同一のバックエンドを共有し、複数の作業を並列に同時実行可能
計画（Plan）、設計（Design）、ビルド（Build）、テスト（Test）、レビュー（Review）、ドキュメント化（Document）、デプロイと保守（Deploy & Maintenance）まで、ソフトウェア開発ライフサイクル（SDLC）全体をカバー
agents.mdファイルを通じて、エージェントの行動指針をリポジトリ単位で設定し、SkillsとAutomationsで反復ワークフローをパッケージ化して自動実行可能
25時間の連続作業と13〜14回の**サーバーサイドコンパクション（compaction）**による長時間コンテキスト維持が可能で、OSレベルのサンドボックスでセキュリティを確保

AIコーディングの進化: コード補完からエージェント委任へ

過去数年間でAIコーディングは、コード補完（タイピング速度を約10%向上）→ ペアプログラミング（ファイル横断の計画、テスト実行、リポジトリ修正）という段階を経て進化
どちらのアプローチも「より良い共同作業者」を作ることに焦点を当てていたが、Codexは1年前から委任可能なエージェントの構築を目標に開発開始
2025年12月、GT 5.2 Codexモデルが長時間の連続作業と高い操縦性（steerability）を確保し、「真のエージェント委任」における主要な障壁を解消
その後、より高速で効率的なGT 5.3、そして最新のGT 5.4モデルへと性能が継続的に向上
大規模なエンタープライズコードベースを安定して探索し、ユーザーの意図に合わせて長時間アラインメントを維持することが、主要な進化ポイント

Codexで利用可能なインターフェース

Codexは1つのエージェントをCLI、IDE拡張、Codexアプリなど複数のサーフェスで利用でき、すべて同じバックエンドを共有
Codexアプリは並列作業実行に最も視覚的なインターフェースで、複数のエージェントを同時に動かし、出力をレビューするのに最適化
Peter Steinberger（OpenClaw創業者）の事例: 従来は10個以上のCLIウィンドウを管理していた方法からCodexアプリへ移行し、並列エージェント管理の効率が向上
macOSとWindowsの両方に対応し、openai.com/codexからダウンロード可能。WindowsはMicrosoft Storeでも提供
CLIではcodex loginコマンドで初回ログイン後、codexコマンドでセッションを開始

CodexアプリのUIと設定

モデル選択（GPT 5.4など）と**推論努力レベル（reasoning effort）**の調整が可能: low、medium、high、extra high
- mediumがデフォルトで、速度と推論の深さのバランスが最も良い
- 簡単な質問にはlow、長時間の深い思考が必要な場合はhighまたはextra highが適切
Speedモード（fast/standard）トグルで応答速度を調整可能
ローカル作業に加え、Git worktreeモードとリモートクラウドコンテナ起動オプションを提供
権限設定: 基本権限（プロジェクト内ファイルの読み取り/編集、危険なコマンド時に承認要求）とフルアクセス（コンピュータ内の全ファイル、ネットワークアクセス、承認なし実行）から選択可能
- 新規ユーザーには基本権限を推奨
左サイドバーからプロジェクト（フォルダ）の追加と切り替えが可能

SDLC全段階でのCodex活用

OpenAIは「Building an AI Native Engineering Team」ガイドを発行し、コーディングエージェントがSDLCの7段階（計画、設計、ビルド、テスト、レビュー、ドキュメント化、デプロイ/保守）全体を加速する方法を整理
特にテストとレビュー段階は、コード生成能力の向上に伴ってさらに重要になっている
複雑なコードベースでの推論と、プロダクションレベルのコード作成においてCodexが特に高く評価されている

計画（Plan）段階

Planモードを有効化（/planまたはShift+Tab）すると、Codexが実装前にまず計画を立案
デモではSwiftUIのiOSコンパニオンアプリの計画を依頼すると、Codexがコードベースを探索した後に追加質問（認証方式、初回リリース範囲など）を提示
推奨オプションの受け入れ、または直接入力によってエージェントを調整可能
計画に関する仮定（assumptions）を明示し、ユーザーが検証・修正できる構造

設計（Design）段階 — MCP連携

**MCP（Model Context Protocol）**を通じて、Figma、Linearなど外部ツールのコンテキストをCodexへ直接接続
- CLI、IDE拡張、Codexアプリのすべてのインターフェースで対応
Figma MCP連携時はデザインリンクを貼り付けると、Codexがデザインコンテキストを取得してコードへ変換
- MCPが未設定の場合、Codexが自動でインストール案内を表示
ChatGPTアプリ統合もサードパーティ製の連携としてCodexから直接利用可能
これによりエンジニアはコアロジックに集中でき、デザイナーはより多くのデザインコンセプト探索に時間を使える

ビルド（Build）段階

SDLCの中でコーディングエージェントの影響が最も大きい段階
デモではN+1クエリの非効率修正と回帰テスト追加、APIルートの認証漏れ監査、NextAuth v4からAuth.js v5へのマイグレーションなどを並列実行
Figmaデザインベースのコード生成結果: 10ファイルを変更し、320行のコードを作成、CSSの手作業は不要
Worktree機能により、ローカルプロジェクトのコピーを自動生成して並列作業間の衝突を防止し、別途リポジトリを複製する必要がない
agents.mdに指定したnpx tsc、npm testなどの検証・ビルド・lintコマンドをCodexが自動実行し、チーム規約への準拠を確認
ビルドそのものはもはやボトルネックではなく、エンタープライズ環境ではコードがチーム規約に適合しているかの検証が核心
Command+Jでアプリ内から直接ターミナルを開いて利用可能
iOSアプリもXcodeを直接開かずにCodexアプリ内でxcode buildを実行可能

スラッシュコマンド（Slash Commands）

CLI、IDE拡張、Codexアプリのすべてでスラッシュコマンドをサポート: planモード、ファイルメンション、セッション状態確認、権限変更など
/experimentalコマンドで実験的機能をトグル可能
- **マルチエージェント（sub-agents）**生成機能を含む
- CLIは他のインターフェースよりやや先行して新機能を搭載
あるインターフェースで切り替えた設定は同一バックエンドを共有するため、すべてのインターフェースに反映

レビュー（Review）段階

/reviewコマンドで、ベースブランチとの差分またはローカルの未コミット変更に対するコードレビューを実行
CodexエージェントはP0/P1レベルのバグ特定に特化して訓練されており、ノイズの少ない高シグナルなフィードバックを提供
PRがCI/CDパイプラインに到達する前に、ローカルで早期に問題を発見できる
GitHub Cloudネイティブ統合: CodexがPRに対して事前（proactive）または事後（reactive）のコードレビューを自動実行
- regexルールのレビューのように、人間が見落としやすいP1問題を捉えた事例を紹介
GitLab、Bitbucketなど他のSCMはCodex SDKを通じて直接連携を構築可能
diffパネルで直接コードレビューコメントを追加すると、次の会話のコンテキストへ自動反映

Skills — 再利用可能なワークフローパッケージ化

Skillは、Codexが実行する再利用可能なワークフロー手順をパッケージ化したオープン標準
- 構造としては1つのフォルダで、必須ファイルはskill.md（メタデータ + エージェント指示）
- 任意で実行スクリプト、ドキュメント、テンプレートを追加可能
MCPをskill内に埋め込んで、外部ツール連携も可能
デモ例: PRコメント処理、BuildKiteビルド失敗の自動修正、デッドコード検出など
Skill Creator（システムスキル）: 会話中に「create a skill to find dead code paths」のように依頼すると、自動でskill.mdをスキャフォールド
Skill Installer（システムスキル）: 生成したスキルをローカルのCodexスキルディレクトリへ即時インストール
長い会話の後に繰り返されるワークフローをskillへ変換しておけば、次回は1回の呼び出しでワークフロー全体を実行可能
GitHub Issue Plan PRスキルの例: 1つのプロンプトでGitHub Issueトリアージ → 計画 → 編集 → ドキュメント化 → ドラフトPR作成まで、SDLC全段階を一括実行

ドキュメント化（Documentation）段階

Codexの最も過小評価されている活用領域の1つ
システムダイアグラム生成、機能実装時のドキュメント自動更新などを支援
Linear MCPと連携し、特定チケットの修正内容、回帰テスト結果、検証内容をLinearボードへ自動記録するデモを紹介

デプロイと保守（Deploy & Maintenance）段階

CodexアプリからCommit、Push、PR作成をボタンクリックで直接実行（Gitベース）
スタックトレースを貼り付けると、Codexがコードベース全体を推論して問題の原因を把握
Triage Pageスキル: インシデントIDを入力すると、詳細情報の収集、インシデント確認、メトリクス・ログ検査、パッチ適用までをワンストップで処理
- ページャー対応を手動ログ解析からエージェント委任へ転換
PR Babysitterスキル: PRのCI/CDパイプライン進行を継続監視し、問題発生時は自動修正して最終的にマージまで自動完了
- OpenAIの大規模モノレポ環境で実運用中
- オープンソースのスキルリポジトリからダウンロード可能

Automations — スケジュールベースの自動実行

スキル活用に慣れた後は、Automations機能で特定スケジュールに作業を自動実行する設定が可能
Sentryスキル自動化: 毎週木曜日（または毎日）に特定リポジトリの問題を見つけて修正提案または自動修正
「What is everyone up to?」自動化: 毎朝9時に、リポジトリにおけるチームメンバーの活動状況を要約出力
プロンプトを直接入力しなくても、Codexがバックグラウンドで継続的に作業を実行

Codexエージェントの動作原理

Codexエージェントはループベースで動作: ユーザーが明確な目標と初期方針を与える → エージェントが推論、ツール呼び出し、ファイル読み取り、リポジトリ検索、コード作成、コマンド実行を繰り返す
各ツール結果は次のモデル呼び出しへフィードバックされ、段階的な理解の構築と進行につながる
**コンテキスト（context）**がエージェント性能を左右する核心変数であり、適切な量の入力で正しい方向を示すことが重要
OSレベルのサンドボックス化: ハーネスレベルの軽量制限ではなく、OSレベルでネットワーク・ファイルアクセスを制御
- モデル進化により軽量保護を回避する可能性を見越した設計
- すべてのシステム（Mac、Windows）でサンドボックスをサポートし、WindowsではWSLより安全性を高めたネイティブWindowsサンドボックスを実装
config TOMLファイルでapproval mode（承認タイミング）とsandbox mode（アクセス範囲）の詳細設定が可能
- デフォルトは「on request」で、通常実行しつつ権限昇格が必要な場合に一時停止

コンパクション（Compaction） — 長時間スレッド管理

会話がモデルのコンテキスト制限に近づくと、Codexが冒頭部分を圧縮するコンパクションを実行
コンパクションはサーバーサイドで生の思考チェーン（chain of thought）ベースに処理されるため、クライアントサイドよりも作業の実質的内容をよりよく保持
実例: 25時間の連続作業中に13〜14回のコンパクションを実行しながら、コンテキスト維持に成功

効果的な委任のためのプロンプティングベストプラクティス

最小限のプロンプトに、明確な目標、制約条件、「完了」の基準を含める
検証条件をプロンプトに内蔵: 成功基準、実行するテスト・ビルドコマンドを明記
オープンエンドなプロンプトを活用: 性能改善アイデアやテストカバレッジ不足領域などをCodexに尋ね、思考パートナーとして活用

agents.md — エージェント行動指針ファイル

CursorのRules、Windsurfの設定などに似たオープンフォーマットで、OpenAI専用ではない
すべてのCodexセッションで自動ロードされ、一貫した結果の生成に寄与
3段階の優先順位体系:
- グローバル（~/.codex/agents.md）: 個人のデフォルト設定（チーム非依存）
- リポジトリルート（agents.md）: リポジトリ全体の規約
- サブディレクトリ（agents.md）: マイクロサービス/サブフォルダごとの詳細指示
- Codexはプロジェクトルートから現在ディレクトリまで**パスに沿ってagents.mdを連結（concatenate）**し、より具体的なファイルを優先
推奨される記載内容: リポジトリ概要、実行コマンド、テスト期待値、主要モジュールの場所、コミット/PRガイドライン
/initコマンド（CLI）で最初のagents.mdを自動生成でき、コールドスタート問題を解消
100行以下の簡潔さを保つことを推奨（OpenAI内部モノレポのagents.md基準）
内容が長くなる場合は、タスク別Markdownファイル（planning.md、code-review.md、architecture.mdなど）へ分割し、agents.mdから参照
Codexにローカルセッションログ（保存パス提供あり）を分析させ、毎週agents.md改善案を自動提案させる自動化パターンを紹介
Codexに**会話の振り返り（retrospective）**を依頼し、gotchaセクションや参考事項をagents.mdへ自動反映する活用法

まとめ — Codex導入のための3つの重要な実践事項

agents.mdの作成とカスタム設定の構成
実際の業務タスクをCodexに任せ、日常的に使うツール（MCP）と接続する
ビルド段階だけでなく、設計からデプロイ・保守まで開発ループ全体でCodexを動かし、継続的に反復する

3件のコメント

xguru 2026-03-19

OpenAIアカデミーもオープンしてからもうほぼ1年で、かなり良い講義がたくさん蓄積されています。
（ただ、自動生成の英語字幕しかないのは少し残念）

mindok 2026-03-20

日本語字幕があればよかったのですが、残念ですね……

j2sus91 2026-03-19

これを聞いた方いますか？
1時間を投資するだけの価値はありますか？

AIでサクッと済む時代だからこそ、時間が貴重でして（笑）