ほぼすべてのためのCodex
(openai.com)- Codexアプリが大規模アップデートされ、ソフトウェア開発の全工程を1つのワークスペースで実行できるようになった
- コンピュータを直接操作しながら日常業務ツールやアプリを併用し、画像生成、過去の行動学習、反復作業の実行を追加することで、開発ワークフローを自動化して拡張する
- デスクトップアプリにはPRレビュー、複数ファイル/ターミナル表示、SSHリモートdevbox接続、アプリ内ブラウザが含まれ、フロントエンドデザインやアプリ/ゲームの反復作業が高速化
- 90以上のプラグインとgpt-image-1.5モデルが統合され、コード作成からデザイン・テスト・コラボレーションまでつながった環境を提供
- 既存の会話スレッド再利用と長期タスクの自動スケジューリング、メモリプレビューにより、数日〜数週間にわたる作業の継続性を確保
Codexの主なアップデート
- CodexアプリがmacOSとWindows向けに大規模アップデートされ、300万人以上の週次開発者ユーザーに対し、ソフトウェア開発の全工程を支援するツールへと拡張された
- 新バージョンでは、コンピュータ制御、画像生成、メモリ、プラグイン、アプリ内ブラウザ機能が追加され、開発者のワークフローを加速する
- PRレビュー、複数ファイルおよびターミナル表示、SSH経由のリモートdevbox接続など、開発者向け機能が強化された
- これらすべての改善は、コード作成、出力確認、変更レビュー、共同作業を1つのワークスペースで行えるよう統合されている
-
コンピュータ制御と並列作業
- バックグラウンドのコンピュータ制御機能により、ユーザーのコンピュータ上で直接クリック、入力、ナビゲーションを実行できる
- 独自カーソルでアプリを操作し、APIのないアプリでもテストや反復作業が可能
- 複数のエージェントが同時にMac上で並列作業でき、ユーザーの他アプリでの作業を妨げない
- フロントエンド変更の反復、アプリテスト、APIのない環境での作業に有用
- バックグラウンドのコンピュータ制御機能により、ユーザーのコンピュータ上で直接クリック、入力、ナビゲーションを実行できる
-
Webおよびブラウザ統合
- Webとネイティブに連携し、アプリ内ブラウザを通じてWebページ上に直接注釈を付け、Codexに具体的な指示を伝えられる
- 現時点ではフロントエンドおよびゲーム開発に有用で、今後はlocalhostのWebアプリを超えてブラウザを完全に制御する方向へ拡張予定
-
画像生成とビジュアルワークフロー
- gpt-image-1.5モデルを使って画像生成と反復作業を実行
- スクリーンショットやコードと組み合わせて、製品コンセプト、フロントエンドデザイン、モックアップ、ゲームビジュアルを同じワークフロー内で制作可能
-
プラグイン拡張
- 90以上の新しいプラグインが追加され、さまざまなアプリとMCPサーバーの統合をサポート
- 主なプラグイン: Atlassian Rovo(JIRA管理), CircleCI, CodeRabbit, GitLab Issues, Microsoft Suite, Neon by Databricks, Remotion, Render, Superpowers
- プラグインにより、Codexはより多くのコンテキスト収集と自動作業実行が可能になる
-
開発者ワークフローの強化
- GitHubレビューコメント対応、複数ターミナルタブの実行、SSH経由のリモートdevbox接続(アルファ段階)をサポート
- サイドバーからファイルを直接開き、PDF、スプレッドシート、スライド、ドキュメントのリッチプレビューを提供
- エージェントの計画、ソース、成果物を追跡する**新しいサマリーパネル(summary pane)**を提供
- コード作成、出力確認、変更レビュー、エージェント協業を1つのワークスペース内で行き来でき、開発ライフサイクル各段階の切り替え速度が向上
-
自動化と長期タスク
- 自動化機能が拡張され、既存の会話スレッドを再利用し、蓄積されたコンテキストを維持する
- Codexが自ら今後の作業をスケジューリングし、自動で再開することで、数日〜数週間にわたる長期タスクの継続が可能
- チームでの活用例: 未処理のPRマージ、タスクのフォローアップ、Slack・Gmail・Notionなど各種ツール全体での迅速な会話追跡
-
メモリとパーソナライズ
- メモリのプレビュー(preview of memory)機能により、Codexは過去の有用なコンテキスト(個人の好み、修正内容、収集した情報など)を記憶する
- 以前は大規模なカスタムインストラクションでしか実現できなかったレベルの品質と速度を、今後の作業で実現
- Codexが中断地点からの再開を先回りして提案し、プロジェクト・接続済みプラグイン・メモリコンテキストを活用して作業提案と優先順位付きリストを自動生成
- 例: Google Docsで確認が必要なコメントを特定 → Slack・Notion・コードベースから関連コンテキストを収集 → 優先順位付けされたアクションリストを提供
- メモリのプレビュー(preview of memory)機能により、Codexは過去の有用なコンテキスト(個人の好み、修正内容、収集した情報など)を記憶する
-
展開計画と提供範囲
- ChatGPTアカウントでログインしたCodexデスクトップアプリユーザーに順次展開中
- **パーソナライズ機能(コンテキスト認識提案、メモリ)**はEnterprise、Edu、EU、UKユーザーに近日提供予定
- コンピュータ制御機能はmacOSで先行提供され、EUおよびUK地域へ拡大予定
Codexの進化と目標
- リリースから1年で、Codexはコード作成だけでなく、システム理解、コンテキスト収集、レビュー、デバッグ、協業、長期タスク管理へと利用範囲を拡大
- OpenAIはAGIが人類全体に利益をもたらすことを目標としており、今回のアップデートは人が思い描くものと実際に構築できるもののギャップを縮める方向で設計されている
- Codexは今後もソフトウェア制作プロセスのツール、ワークフロー、意思決定とさらに密接に統合されていく見込み
6件のコメント
Opecnclawの有料版か…
Windows はまだですよね? Mac のアップデートですよね?
Webデザインを頼むといつもカードスタイルで実装するの、いつ直るんだろう。これだけ直してくれたら、Claudeはもうまったく使わない気がするけど
VSCode でしか接続して使っていませんでしたが、アプリでも試してみないとですね
自分は最近Codexをメインで使っているので、とてもうれしいアップデートですね。
openai-oauth - ChatGPTアカウントでOpenAI APIを無料で使う
これを使えば、もう画像生成もできるようになりそうです
Hacker Newsの意見
コメントを読むと、多くの人が Claude Desktop や Cowork がすでにこうした機能を提供していることを知らないように見える
Codex は革新というより、単に追いついているだけという印象
OpenAI はエンタープライズ顧客が少ないため、個人ユーザーにより多くの計算資源を補助できる
結局ユーザー数が増えれば Anthropic のようになるはずで、今は単なる PR 戦略 にすぎない
Codex はバックグラウンドでアプリをクリックしたり入力したりでき、複数のエージェントが同時に作業できる
私が書いた ブログ記事 でも述べたように、AI はもっと 能動的 に働くべきだ
たとえば Slack の要約、議事録の統合、会議準備ノートの自動生成のようなことはすでに可能なのに、誰もやっていない
結局重要なのは 注意力の管理 であり、AI は私たちがどこに集中すべきかを助けるべきだ
最近の UI を見ると、コードを隠そうとする傾向 が強い
プロンプトが本当のソースで、コードは面倒な中間生成物のように扱われている
そうすると速度も上がり、成果物も自分が直接書いたコードのようになる
私たちはすでに自動化の方法を知っているが、ほとんどの人はそうではない
今は高級言語に違和感があるとしても、結局は 抽象化の階層 が増えていく過程にすぎない
プロンプトエンジニアリングも結局は別の人工言語体系だ
懐疑的な見方は多いが、私はこれが 大衆的に広がる と思う
25 年間 CLI を使ってきたが、最近は Codex にターミナル作業を代行させている
GUI 版がうまく作られれば、一般ユーザーもすぐ慣れるはずだ
以前は数時間かかっていた設定が、今では数秒で終わる
GUI が必要なアプリを除けば、ほとんどの作業はテキストベースの AI で十分だ
Codex にコンピュータやアプリを直接制御させることを本当に望むのか疑問だ
私は今でも サンドボックスのセキュリティ を重視している
OpenAI は競合他社の発表時期に合わせて 非公開リリース を準備しているように見える
メディアやインフルエンサーの日程は事前に調整している
2 本目の動画のプロンプトは「フォントとタグラインの長さを短くしてくれ」だった
もう LLM を フォントサイズ調整 に使うのかと思った
3 本目の動画では「ヒーローセクションの画像を生成してくれ」と言っているが、
製品説明に AI 生成画像 を使うのはあまりにも 偽物っぽい
正直、これをどこに使えばいいのかわからない
コーディング支援としては有用だが、自分のコンピュータを直接操作させたくはない
Slack の要約くらいならともかく、今のところ 問題のない問題を解こうとしているソリューション に見える
私は Cowork/Codex のような専門エージェント が、非開発者向けとして最も速く成長する製品群になると見ている
こうしたエージェントは人間の代わりにソフトウェアを扱うようになる
関連記事 でも整理されているが、
結局 ソフトウェア市場の構造そのものが変わる
その分 セキュリティ脅威 も大きくなる
メールと議事録を読み、作業を計画して実行し、その後で要約まで送ってくれる
ほとんどの知的労働は結局 コードの形 で表現できるから可能なのだ
データ接続さえうまくやれば B2B SaaS 市場 が開ける
Codex が今も ユーザーの同意なく機微なファイルを読むのか 気になる
関連 issue は GitHub にある
機微なデータのない 別マシンで実行 するのが安全だ
Codex という名前は紛らわしい
ひとつは エージェント型プログラミングツール、もうひとつは Mac/Windows 向け GUI アプリ なのに同じ名前だ