69 ポイント 投稿者 GN⁺ 2026-03-19 | 3件のコメント | WhatsAppで共有
  • OpenAIが公開した、開発者向けCodex講義のウェビナー動画(58分)
  • Codexはコード補完やペアプログラミングを超え、エンジニアが大規模な作業をエージェントに委任できるよう設計されたコーディングエージェントプラットフォーム
  • Codexアプリ、CLI、IDE拡張などさまざまなインターフェースで同一のバックエンドを共有し、複数の作業を並列に同時実行可能
  • 計画(Plan)、設計(Design)、ビルド(Build)、テスト(Test)、レビュー(Review)、ドキュメント化(Document)、デプロイと保守(Deploy & Maintenance)まで、ソフトウェア開発ライフサイクル(SDLC)全体をカバー
  • agents.mdファイルを通じて、エージェントの行動指針をリポジトリ単位で設定し、SkillsAutomationsで反復ワークフローをパッケージ化して自動実行可能
  • 25時間の連続作業と13〜14回の**サーバーサイドコンパクション(compaction)**による長時間コンテキスト維持が可能で、OSレベルのサンドボックスでセキュリティを確保

AIコーディングの進化: コード補完からエージェント委任へ

  • 過去数年間でAIコーディングは、コード補完(タイピング速度を約10%向上)→ ペアプログラミング(ファイル横断の計画、テスト実行、リポジトリ修正)という段階を経て進化
  • どちらのアプローチも「より良い共同作業者」を作ることに焦点を当てていたが、Codexは1年前から委任可能なエージェントの構築を目標に開発開始
  • 2025年12月、GT 5.2 Codexモデルが長時間の連続作業と高い操縦性(steerability)を確保し、「真のエージェント委任」における主要な障壁を解消
  • その後、より高速で効率的なGT 5.3、そして最新のGT 5.4モデルへと性能が継続的に向上
  • 大規模なエンタープライズコードベースを安定して探索し、ユーザーの意図に合わせて長時間アラインメントを維持することが、主要な進化ポイント

Codexで利用可能なインターフェース

  • Codexは1つのエージェントをCLI、IDE拡張、Codexアプリなど複数のサーフェスで利用でき、すべて同じバックエンドを共有
  • Codexアプリは並列作業実行に最も視覚的なインターフェースで、複数のエージェントを同時に動かし、出力をレビューするのに最適化
  • Peter Steinberger(OpenClaw創業者)の事例: 従来は10個以上のCLIウィンドウを管理していた方法からCodexアプリへ移行し、並列エージェント管理の効率が向上
  • macOSとWindowsの両方に対応し、openai.com/codexからダウンロード可能。WindowsはMicrosoft Storeでも提供
  • CLIではcodex loginコマンドで初回ログイン後、codexコマンドでセッションを開始

CodexアプリのUIと設定

  • モデル選択(GPT 5.4など)と**推論努力レベル(reasoning effort)**の調整が可能: low、medium、high、extra high
    • mediumがデフォルトで、速度と推論の深さのバランスが最も良い
    • 簡単な質問にはlow、長時間の深い思考が必要な場合はhighまたはextra highが適切
  • Speedモード(fast/standard)トグルで応答速度を調整可能
  • ローカル作業に加え、Git worktreeモードとリモートクラウドコンテナ起動オプションを提供
  • 権限設定: 基本権限(プロジェクト内ファイルの読み取り/編集、危険なコマンド時に承認要求)とフルアクセス(コンピュータ内の全ファイル、ネットワークアクセス、承認なし実行)から選択可能
    • 新規ユーザーには基本権限を推奨
  • 左サイドバーからプロジェクト(フォルダ)の追加と切り替えが可能

SDLC全段階でのCodex活用

  • OpenAIは「Building an AI Native Engineering Team」ガイドを発行し、コーディングエージェントがSDLCの7段階(計画、設計、ビルド、テスト、レビュー、ドキュメント化、デプロイ/保守)全体を加速する方法を整理
  • 特にテストとレビュー段階は、コード生成能力の向上に伴ってさらに重要になっている
  • 複雑なコードベースでの推論と、プロダクションレベルのコード作成においてCodexが特に高く評価されている

計画(Plan)段階

  • Planモードを有効化(/planまたはShift+Tab)すると、Codexが実装前にまず計画を立案
  • デモではSwiftUIのiOSコンパニオンアプリの計画を依頼すると、Codexがコードベースを探索した後に追加質問(認証方式、初回リリース範囲など)を提示
  • 推奨オプションの受け入れ、または直接入力によってエージェントを調整可能
  • 計画に関する仮定(assumptions)を明示し、ユーザーが検証・修正できる構造

設計(Design)段階 — MCP連携

  • **MCP(Model Context Protocol)**を通じて、Figma、Linearなど外部ツールのコンテキストをCodexへ直接接続
    • CLI、IDE拡張、Codexアプリのすべてのインターフェースで対応
  • Figma MCP連携時はデザインリンクを貼り付けると、Codexがデザインコンテキストを取得してコードへ変換
    • MCPが未設定の場合、Codexが自動でインストール案内を表示
  • ChatGPTアプリ統合もサードパーティ製の連携としてCodexから直接利用可能
  • これによりエンジニアはコアロジックに集中でき、デザイナーはより多くのデザインコンセプト探索に時間を使える

ビルド(Build)段階

  • SDLCの中でコーディングエージェントの影響が最も大きい段階
  • デモではN+1クエリの非効率修正と回帰テスト追加、APIルートの認証漏れ監査、NextAuth v4からAuth.js v5へのマイグレーションなどを並列実行
  • Figmaデザインベースのコード生成結果: 10ファイルを変更し、320行のコードを作成、CSSの手作業は不要
  • Worktree機能により、ローカルプロジェクトのコピーを自動生成して並列作業間の衝突を防止し、別途リポジトリを複製する必要がない
  • agents.mdに指定したnpx tscnpm testなどの検証・ビルド・lintコマンドをCodexが自動実行し、チーム規約への準拠を確認
  • ビルドそのものはもはやボトルネックではなく、エンタープライズ環境ではコードがチーム規約に適合しているかの検証が核心
  • Command+Jでアプリ内から直接ターミナルを開いて利用可能
  • iOSアプリもXcodeを直接開かずにCodexアプリ内でxcode buildを実行可能

スラッシュコマンド(Slash Commands)

  • CLI、IDE拡張、Codexアプリのすべてでスラッシュコマンドをサポート: planモード、ファイルメンション、セッション状態確認、権限変更など
  • /experimentalコマンドで実験的機能をトグル可能
    • **マルチエージェント(sub-agents)**生成機能を含む
    • CLIは他のインターフェースよりやや先行して新機能を搭載
  • あるインターフェースで切り替えた設定は同一バックエンドを共有するため、すべてのインターフェースに反映

レビュー(Review)段階

  • /reviewコマンドで、ベースブランチとの差分またはローカルの未コミット変更に対するコードレビューを実行
  • CodexエージェントはP0/P1レベルのバグ特定に特化して訓練されており、ノイズの少ない高シグナルなフィードバックを提供
  • PRがCI/CDパイプラインに到達する前に、ローカルで早期に問題を発見できる
  • GitHub Cloudネイティブ統合: CodexがPRに対して事前(proactive)または事後(reactive)のコードレビューを自動実行
    • regexルールのレビューのように、人間が見落としやすいP1問題を捉えた事例を紹介
  • GitLab、Bitbucketなど他のSCMはCodex SDKを通じて直接連携を構築可能
  • diffパネルで直接コードレビューコメントを追加すると、次の会話のコンテキストへ自動反映

Skills — 再利用可能なワークフローパッケージ化

  • Skillは、Codexが実行する再利用可能なワークフロー手順をパッケージ化したオープン標準
    • 構造としては1つのフォルダで、必須ファイルはskill.md(メタデータ + エージェント指示)
    • 任意で実行スクリプト、ドキュメント、テンプレートを追加可能
  • MCPをskill内に埋め込んで、外部ツール連携も可能
  • デモ例: PRコメント処理、BuildKiteビルド失敗の自動修正、デッドコード検出など
  • Skill Creator(システムスキル): 会話中に「create a skill to find dead code paths」のように依頼すると、自動でskill.mdをスキャフォールド
  • Skill Installer(システムスキル): 生成したスキルをローカルのCodexスキルディレクトリへ即時インストール
  • 長い会話の後に繰り返されるワークフローをskillへ変換しておけば、次回は1回の呼び出しでワークフロー全体を実行可能
  • GitHub Issue Plan PRスキルの例: 1つのプロンプトでGitHub Issueトリアージ → 計画 → 編集 → ドキュメント化 → ドラフトPR作成まで、SDLC全段階を一括実行

ドキュメント化(Documentation)段階

  • Codexの最も過小評価されている活用領域の1つ
  • システムダイアグラム生成、機能実装時のドキュメント自動更新などを支援
  • Linear MCPと連携し、特定チケットの修正内容、回帰テスト結果、検証内容をLinearボードへ自動記録するデモを紹介

デプロイと保守(Deploy & Maintenance)段階

  • CodexアプリからCommit、Push、PR作成をボタンクリックで直接実行(Gitベース)
  • スタックトレースを貼り付けると、Codexがコードベース全体を推論して問題の原因を把握
  • Triage Pageスキル: インシデントIDを入力すると、詳細情報の収集、インシデント確認、メトリクス・ログ検査、パッチ適用までをワンストップで処理
    • ページャー対応を手動ログ解析からエージェント委任へ転換
  • PR Babysitterスキル: PRのCI/CDパイプライン進行を継続監視し、問題発生時は自動修正して最終的にマージまで自動完了
    • OpenAIの大規模モノレポ環境で実運用中
    • オープンソースのスキルリポジトリからダウンロード可能

Automations — スケジュールベースの自動実行

  • スキル活用に慣れた後は、Automations機能で特定スケジュールに作業を自動実行する設定が可能
  • Sentryスキル自動化: 毎週木曜日(または毎日)に特定リポジトリの問題を見つけて修正提案または自動修正
  • 「What is everyone up to?」自動化: 毎朝9時に、リポジトリにおけるチームメンバーの活動状況を要約出力
  • プロンプトを直接入力しなくても、Codexがバックグラウンドで継続的に作業を実行

Codexエージェントの動作原理

  • Codexエージェントはループベースで動作: ユーザーが明確な目標と初期方針を与える → エージェントが推論、ツール呼び出し、ファイル読み取り、リポジトリ検索、コード作成、コマンド実行を繰り返す
  • 各ツール結果は次のモデル呼び出しへフィードバックされ、段階的な理解の構築と進行につながる
  • **コンテキスト(context)**がエージェント性能を左右する核心変数であり、適切な量の入力で正しい方向を示すことが重要
  • OSレベルのサンドボックス化: ハーネスレベルの軽量制限ではなく、OSレベルでネットワーク・ファイルアクセスを制御
    • モデル進化により軽量保護を回避する可能性を見越した設計
    • すべてのシステム(Mac、Windows)でサンドボックスをサポートし、WindowsではWSLより安全性を高めたネイティブWindowsサンドボックスを実装
  • config TOMLファイルでapproval mode(承認タイミング)とsandbox mode(アクセス範囲)の詳細設定が可能
    • デフォルトは「on request」で、通常実行しつつ権限昇格が必要な場合に一時停止

コンパクション(Compaction) — 長時間スレッド管理

  • 会話がモデルのコンテキスト制限に近づくと、Codexが冒頭部分を圧縮するコンパクションを実行
  • コンパクションはサーバーサイドで生の思考チェーン(chain of thought)ベースに処理されるため、クライアントサイドよりも作業の実質的内容をよりよく保持
  • 実例: 25時間の連続作業中に13〜14回のコンパクションを実行しながら、コンテキスト維持に成功

効果的な委任のためのプロンプティングベストプラクティス

  • 最小限のプロンプトに、明確な目標、制約条件、「完了」の基準を含める
  • 検証条件をプロンプトに内蔵: 成功基準、実行するテスト・ビルドコマンドを明記
  • オープンエンドなプロンプトを活用: 性能改善アイデアやテストカバレッジ不足領域などをCodexに尋ね、思考パートナーとして活用

agents.md — エージェント行動指針ファイル

  • CursorのRules、Windsurfの設定などに似たオープンフォーマットで、OpenAI専用ではない
  • すべてのCodexセッションで自動ロードされ、一貫した結果の生成に寄与
  • 3段階の優先順位体系:
    • グローバル(~/.codex/agents.md): 個人のデフォルト設定(チーム非依存)
    • リポジトリルート(agents.md): リポジトリ全体の規約
    • サブディレクトリ(agents.md): マイクロサービス/サブフォルダごとの詳細指示
    • Codexはプロジェクトルートから現在ディレクトリまで**パスに沿ってagents.mdを連結(concatenate)**し、より具体的なファイルを優先
  • 推奨される記載内容: リポジトリ概要、実行コマンド、テスト期待値、主要モジュールの場所、コミット/PRガイドライン
  • /initコマンド(CLI)で最初のagents.mdを自動生成でき、コールドスタート問題を解消
  • 100行以下の簡潔さを保つことを推奨(OpenAI内部モノレポのagents.md基準)
  • 内容が長くなる場合は、タスク別Markdownファイル(planning.md、code-review.md、architecture.mdなど)へ分割し、agents.mdから参照
  • Codexにローカルセッションログ(保存パス提供あり)を分析させ、毎週agents.md改善案を自動提案させる自動化パターンを紹介
  • Codexに**会話の振り返り(retrospective)**を依頼し、gotchaセクションや参考事項をagents.mdへ自動反映する活用法

まとめ — Codex導入のための3つの重要な実践事項

  • agents.mdの作成とカスタム設定の構成
  • 実際の業務タスクをCodexに任せ、日常的に使うツール(MCP)と接続する
  • ビルド段階だけでなく、設計からデプロイ・保守まで開発ループ全体でCodexを動かし、継続的に反復する

3件のコメント

 
xguru 2026-03-19

OpenAIアカデミーもオープンしてからもうほぼ1年で、かなり良い講義がたくさん蓄積されています。
(ただ、自動生成の英語字幕しかないのは少し残念)

 
mindok 2026-03-20

日本語字幕があればよかったのですが、残念ですね……

 
j2sus91 2026-03-19

これを聞いた方いますか?
1時間を投資するだけの価値はありますか?

AIでサクッと済む時代だからこそ、時間が貴重でして(笑)