OpenAI、macOS向けCodexアプリを公開

(openai.com)

12 ポイント投稿者 GN⁺ 2026-02-03 | 9件のコメント | WhatsAppで共有

複数のAIエージェントを同時に管理し、並列作業と長期的な協業を支援するAI開発統合環境
各エージェントが独立したスレッドで実行され、プロジェクトごとのマルチタスク、コードレビュー、diffコメント、手動修正が可能
Skills機能により、コード作成だけでなく、情報収集、問題解決、画像生成、文書作成、クラウド配備など多様な作業へ拡張
Automations機能により、定めたスケジュールに従ってバックグラウンドで自動的に反復作業を実行可能
基本的にサンドボックスセキュリティが適用され、ネットワークアクセスなど上位権限が必要なコマンドはユーザー承認が必要
ChatGPT FreeおよびGoユーザーにも期間限定でCodexを提供、有料プランは利用上限が2倍に増加

Codexアプリ概要: エージェントのためのコマンドセンター

2025年4月のCodex公開以降、開発者によるエージェント活用の方法が根本的に変化
- モデルが複雑で長期的な作業を最初から最後まで処理できるようになった
- 開発者は今や複数のエージェントをプロジェクト全体で調整しながら作業を委任し、並列実行している
中核課題は「エージェントが何をできるか」から、**「人がどのようにエージェントを大規模に指揮・監督し、協業できるか」**へと移行
既存のIDEやターミナルベースのツールはこうした作業様式を支援するよう設計されておらず、新しいツールが必要
macOS向けCodexアプリは、複数のAIエージェントを同時に管理し、並列で作業を実行できる
長時間実行される作業を支援し、エージェント間の協業を通じてソフトウェアの設計・開発・配備・保守の全工程を管理

複数エージェントによる並列作業

Codexアプリはエージェントとのマルチタスクのための集中空間を提供
- エージェントはプロジェクトごとに構成された別個のスレッドで実行され、コンテキストを失うことなく作業間を切り替えられる
- スレッド内でエージェントの変更内容を確認し、diffにコメントを付けたり、エディタで直接修正したりできる
Worktreesを標準サポートし、複数のエージェントが同一リポジトリ上で競合なく作業
- 各エージェントはコードの隔離されたコピーで作業するため、ローカルのgit状態に影響を与えずにさまざまな経路を探索できる
- エージェント作業中の変更をローカルでチェックアウトしたり、ローカルのgit状態を変更せずに作業を継続したりできる
Codex CLIおよびIDE拡張からセッション履歴と設定を自動で取り込み、既存プロジェクトですぐ利用可能

Skills: コード生成を超える拡張

Codexはコードを書くエージェントから、コードを使ってコンピュータ上で作業を実行するエージェントへ進化中
Skillsにより、情報収集と統合、問題解決、文書作成など、コード生成を超える作業へ拡張可能
- 指示、リソース、スクリプトをバンドルとしてまとめ、Codexがツールに接続してワークフローを実行できる
- チームの好みに応じて作業を安定して完了できる
CodexアプリにはSkillsを作成・管理する専用インターフェースを搭載
- 特定のSkillsの利用を明示的に要求したり、作業内容に応じて自動使用するよう設定したりできる
Skills活用例: レーシングゲームの生成
- Codexに、多様なレーサー、8つのマップ、スペースバーで使用できるアイテムを含むレーシングゲームの制作を依頼
  - 画像生成スキル（GPT Imageベース）とWebゲーム開発スキルを活用
  - 単一の初期プロンプトで700万トークン超を自律的に処理してゲームを完成
  - デザイナー、ゲーム開発者、QAテスターの役割を担い、実際にゲームをプレイして検証
- ゲーム名: Voxel Velocity、Three.jsを使った3Dボクセルカートレーサー
  - シングルレースモード（常に3ラップ、人間1人 vs CPU7人、8つのトラックを即時利用可能）
  - アーケードドライビングモデル、ドリフトチャージシステム、ブーストティア（Tier 1 0.7秒、Tier 2 1.1秒、Tier 3 1.5秒）
  - 8キャラクター、8アイテム、CPU難易度プリセット、AIスプライン実装
提供される主なSkills
- Implement designs: Figmaからデザインコンテキスト、アセット、スクリーンショットを取り込み、1:1の視覚的一致を持つ本番用UIコードへ変換
- Manage projects: Linearでバグの分類、リリース追跡、チームのワークロード管理
- Deploy to the cloud: Cloudflare、Netlify、Render、Vercelなど主要クラウドホストへWebアプリを配備
- Generate images: GPT Imageベースの画像生成スキルで、Webサイト、UIモックアップ、製品ビジュアル、ゲームアセット向けの画像を生成・編集
- Build with OpenAI APIs: OpenAI APIで構築する際に最新ドキュメントを参照
- Create documents: PDF、スプレッドシート、docxファイルの読み取り、生成、編集（専門的な書式とレイアウトをサポート）
- アプリで新しいスキルを作成すると、アプリ、CLI、IDE拡張のどこからでも利用可能
- スキルをリポジトリにチェックインして、チーム全体で共有可能

Automations: 反復作業の自動化

Automations機能により、Codexが定義済みスケジュールに従ってバックグラウンドで自動作業を実行
- 指示と任意のスキルを組み合わせて設定
- 完了時の結果はレビュー待ちキューに保存され、必要に応じて作業を継続できる
OpenAI社内での活用例
- 日次のイシュー分類
- CI失敗の検出と要約
- 日次リリースブリーフの作成
- バグ確認

Personality: 作業スタイルのカスタマイズ

開発者ごとにエージェントとの作業スタイルの好みは異なる
- 簡潔で実行重視のパートナーを求める場合
- より会話的で共感的なやり取りを好む場合
Codexでは2種類のパーソナリティを選択可能: 簡潔で実用的なスタイル vs 会話的で共感的なスタイル
- 機能の変化なく、好みの方式に合わせられる
- アプリ、CLI、IDE拡張で**/personality**コマンドにより設定

セキュリティ: 標準適用かつ設定可能

Codexエージェントスタック全体に設計段階からセキュリティを統合
Codex CLIと同様に、ネイティブでオープンソース、設定可能なシステムレベルのサンドボックスを使用
デフォルト設定
- エージェントは作業中のフォルダまたはブランチ内ファイルの編集と、キャッシュされたWeb検索のみ許可
- ネットワークアクセスなど上位権限が必要なコマンド実行時はユーザー承認を要求
プロジェクトまたはチーム向けルールを構成し、特定コマンドを上位権限で自動実行するよう設定可能

利用可能性と価格

Codexアプリは本日よりmacOSで利用可能
ChatGPT Plus、Pro、Business、Enterprise、Eduの購読者は、ChatGPTログインでCLI、Web、IDE拡張、アプリからCodexを利用可能
利用量はChatGPT購読に含まれ、必要に応じて追加クレジット購入オプションを提供
期間限定でChatGPT FreeおよびGoユーザーにもCodexを提供
この期間中、すべての有料プランの既存Codexユーザーに対して利用上限を2倍に増加

今後の計画

2024年12月中旬のGPT-5.2-Codex公開以降、Codex全体の利用量が2倍に増加
過去1か月で100万人以上の開発者がCodexを利用
今後の計画
- Windowsアプリを公開予定
- モデル機能の最前線を拡張
- より高速な推論を提供
アプリ内の改善点
- 実際のフィードバックに基づき、複数エージェントのワークフローを継続的に改善
- 並列作業の管理と、エージェント間の切り替え時におけるコンテキスト維持のしやすさを向上
Automationsの拡張
- クラウドベースのトリガー対応を構築中
- コンピュータが開いていなくてもCodexがバックグラウンドで継続実行可能に

Codexの中核となる前提

すべてがコードで制御されるという単純な前提に基づく
エージェントがコードについて推論し生成する能力が高いほど、あらゆる種類の技術・知識作業でより有能になる
現在の中核課題: フロンティアモデルの能力と、人々が実際に簡単に使える度合いとの間のギャップ
Codexは、モデルの持つ知能全体を実作業へ容易に指揮・監督・適用できるようにすることで、このギャップを埋めるよう設計されている
最高のコーディングエージェントを作ることに注力しており、これはコード作成を超えて広範な知識労働のための強力なエージェントの基盤になると見込まれる

9件のコメント

xguru 2026-02-03

私も最近は Codex がメインですが、いいですね。Windows版も早く出てほしいです。

最初に起動すると、これまで Codex で作業していたプロジェクトを一気に読み込んで、左側にプロジェクト／スレッド単位でずらっと表示してくれるので、複数を同時に動かすのにちょうどいいです。

tested 2026-02-03

Claude Codeではなく、Codexがメインである理由はありますか？

xguru 2026-02-03

自分は長めのプラン文書を作って「これで進めて」と投げるやり方をすることが多いんですが、Codexのほうがこの手の使い方にはより合っていると感じました。
それと、確かにレートリミットにもあまり引っかかりません。安いアカウントで複数のプロジェクトを同時に回すことが多いのに、です。

tested 2026-02-03

おお、コメントありがとうございます。

OpenClaw の作者が Codex を使っているのもそうですし、
> MoltBot 제작자: “나는 읽지 않은 코드를 배포한다”

Codex も評判は悪くなさそうですが、Hacker News のコメントを見るとまたそうでもないような気もします……

unknowncyder 2026-02-03

本当に Windows/Linux もお願いします…
ChatGPTブラウザのAtlasも使ってみたかったのに、Windows版は coming soon としておいてずっと音沙汰がないですね

treestae 2026-02-03

今日使ってみたのですが、すごく良かったです。
VSCodeフォーク勢は、滅びる覚悟をしておいたほうがよさそうですね。
もちろん、開発者の仕事が減る可能性もありそうです。

m00nlygreat 2026-02-03

Windowsにはサンドボックス技術がないので、いろいろやるのは難しそうですね

cshj55 2026-02-03

WSLかWindows版をくれ…

GN⁺ 2026-02-03

Hacker Newsの意見

AI企業が何十億ドルも持っているのに、なぜいまだにネイティブアプリを作れないのか理解できない
大半は単なるチャットUI程度なのに、ElectronではOS API（例: Win32）を直接呼び出しにくく、深い統合ができない
Blender、Godot、Unity、UE5のような複雑なソフトウェアもすべてネイティブで動いているのに、こうした企業が言い訳ばかりしているのはもどかしい
- デスクトップ開発環境がひどい状態。Microsoftがあまりに多くの中途半端なフレームワークを出してきたせいで、何を使うべきかわからない状況になっている
  WindowsではElectronが事実上の標準で、Microsoft自身もよく使っている
  macOSはずっとましだが、チームは結局Mac専用に閉じるか、Electronでクロスプラットフォームを選ぶことになる
- 最近はビデオゲームのUIもHTML/JSベースを多く使っている
  UE5のUIもほとんどネイティブ感がなく、Electronより良いと言えるかも怪しい
  ElectronでもネイティブAPIの呼び出しは可能だ
  ほとんどのユーザーはアプリがネイティブかどうかを気にせず、Web開発者をデスクトップアプリ開発に再活用できる点が企業にとっては大きな利点だ
- むしろ逆に考えている。すべてをテキストインターフェースにすれば、モデルがツールを自然に学習できる
  TUIやGUIは不要な抽象化レイヤーで、自動化を難しくする
  重要なのは単純なコマンド呼び出しとログ記録だ。[headlessモードやセッションログ]がその方向に近い
- AIで作った成果物が結局入力欄が1つあるElectronアプリだというのが現実だ
- ネイティブアプリが提供できる機能の何がそんなに重要なのかわからない
  ほとんどの人はアプリがWeb技術で作られているかどうかを気にしない
  ElectronのおかげでLinuxへの移植も簡単になる。ネイティブにこだわっていたらこうしたことは不可能だっただろう
ここ2か月ほどCodexをかなり使ってきたが、かなり印象的だった
完璧ではないが、中堅エンジニア級の結果を安定して出してくる
ただしアプリが「Loading projects...」で止まってしまう
ドキュメントのリンクも壊れていたが、このリンクは今は動く
複数のVM環境をVS Code Remoteで使っているので、ポートオフセット設定を少し変える必要がありそうだ
- ChatGPT（$20/月）とClaude（$200/年）を併用しているが、Codexはまだ使用制限に当たったことがない
  Codexは問題解決中にループにはまることが多く、Claudeがそういう部分をうまく締めてくれる
  2つのモデルを交互に使うやり方はかなり効率的だ
- リンクの問題を知らせてくれてありがとう、という返答をもらった。読み込み速度も改善中とのこと
- Codexはバックエンドや論理的な作業には強いが、単純なフロントエンドUI作業ではよくミスをする
  それでも着実に改善されているので期待している
- 自分は引き続きCursorを使うつもりだ。OpenAIは新しいアプリを出すより、既存アプリのバグ修正に集中すべきだ
CodexはClaude Cowork系の競合製品のように見える
CoworkはClaude CodeをVMで呼び出し、CodexはCLIをOSサンドボックス内で実行する
技術スタックはElectron 40、React 19、TypeScript、Node.js、SQLite、Viteなどで構成されている
macOS向けにはSparkle、Squirrel、Sentryなどを使っている
- 名前とdiff/worktree中心の設計を見ると、かなり開発者志向が強い
- ブートキャンプレベルのスタックで少しがっかりした
- Sentry統合がネイティブなのかMCP経由なのか気になる
- gitとターミナルビューがあるのでCLIユーザーには大きな利点だ。skills機能にも期待している
Codexを使ってみたが、あまりに遅くて間抜けで腹が立つほどだった
指示に従わず、途中で止まったり、とんちんかんなコードを投げてきたりする
Nuxt 4+に関する最新データがなく、ずっとエラーを出していた
Undo機能もまともに動かず、フィードバックもない
Claude Codeは同じ作業を一発で処理したのに、Codexは時間がかかるうえにひどい出来だった
これを見ていると、昔Nokia N800を使っていたときのように、可能性はあるのに完成度が低すぎてOpenAIの方向性が心配になる
OpenAIのCodexは実質的にEmdash、Conductorのような製品を公式化した版だ
Anthropicも似たようなClaude Codeマルチエージェントアプリを出すのか気になる
- すでにClaude Code Desktopがある
- マルチエージェントのアプローチは過大評価されている気がする
  明確な契約（API定義など）があるなら、独立したセッションで並列作業したほうが効率的だ
- GUIでClaude Codeを使うとき、全体のClaude Code harnessを使っているのか、単にモデルだけ使っているのか気になる
- Emdashは初めて聞いたが、こういうツールが多すぎて宣伝が難しく、市場が騒がしい
  自分でも似たものを作りかけたことがある
- Claude CodeのWeb版が研究プレビューとして公開されている
エージェント機能にはあまり興味がない
Recursive Language Models論文の要点は、要求事項や設計、計画などを文脈ではなく不変オブジェクトとして管理することだ
自分は各段階（spec、analysis、planなど）を.mdファイルで管理し、承認ステップを置いたkanbanプロセスで運用している
こうするとUIがなくてもうまく回り、コード品質が保たれて、長期的には開発速度が10倍速くなる
Codexの中核機能は並列エージェント実行のようだが、自分はすでにClaude Codeで9か月そういう使い方をしている
.claude/commandsと.claude/agentsを使えば複数の作業を同時に走らせられる
CodexはClaudeが見落とす部分をうまく拾ってくれ、2つのモデルを相互補完的に使うと効率が高い
Codexは安価でほぼ無制限に近い利用量が長所で、Claudeは品質がより高い
自分は主にClaude Codeを使っているが、最も良いオーケストレーターはZencoder.aiのZenflowだった
plan.mdをベースにプロセスを組み立て、動的にステップやフックを追加できる
ワークフロー自動化を文書ベースで制御できるので便利だ
- ただ検索してみると、また別の「AIクレジットパッケージ販売アプリ」であることが多い
  すでに主要3モデルにお金を払っているので、こういうサービスは長続きしない気がする
- すでに500を超えるAI統合サービスが存在する
デモゲーム「Voxel Velocity」の下部に「Enter start」とあるが、実際にはEnterは選択を切り替えるだけだ
700万トークンを使ったと言うのに、こんなQAミスを見逃したのは驚きだ
- ゲーム自体は印象的だが、細かい部分で品質管理が不足している
  こういう微妙な問題はテストハーネスやQAエージェントでは拾いにくい
- 6万、80万、700万トークン版の間でゲーム機能の差がほとんどない
  トークンが増えても完成度が上がっただけで、プレイ内容は同じだ。あの追加トークンで何をしたのか気になる
Linuxユーザーなので、CodexがMac専用なのは残念だ
CLI版でも同じ機能をサポートする予定があるのか気になる
- OpenAIのRomainが直接返答していた。ElectronベースなのでWindowsとLinux対応もまもなく追加される予定とのこと
- 現時点ではMacでもIntelチップでは動作しない
- macOSは実験用には適している。ハードウェア構成が一定で、エッジケースのバグが少ないからだ
すべてローカルでしか動かないのが残念だ
内部ネットワーク内だけで動作する管理クラスタ機能があるといい
チームメンバーと作業進捗の共有もできれば理想的だ
- 自分はsshとtmuxで似たような使い方をしている
  こうした機能をツール側でサポートしてくれると、ずっと便利だと思う
OpenAIとCodexは初期の革新を牽引したが、今ではClaudeとGeminiのほうが先を行っている
最近のGPT-5.xの品質も落ちており、今回の発表でもMac専用リリースだけだったのが残念だ
記事に誤字も多く、実際に使われたプロンプトを公開していない点にも不満がある
それでも改善されるなら、また使ってみるつもりはある
- 動画ではコード生成の場面が5倍速以上で高速編集されていたのが目についた
  SonnetやGemini 3.0 Flashの速度に慣れているせいかもしれない
- 自分はむしろCodexのほうがClaude CodeやGeminiより複雑な作業の処理で安定していると感じる
  20ドルのChatGPTのほうが200ドルのClaudeより効率的だ
- macOS優先リリース方針はOpenAIが以前からそうだった