14 ポイント 投稿者 GN⁺ 13 일 전 | 6件のコメント | WhatsAppで共有
  • Codexアプリが大規模アップデートされ、ソフトウェア開発の全工程を1つのワークスペースで実行できるようになった
  • コンピュータを直接操作しながら日常業務ツールやアプリを併用し、画像生成、過去の行動学習、反復作業の実行を追加することで、開発ワークフローを自動化して拡張する
  • デスクトップアプリにはPRレビュー、複数ファイル/ターミナル表示、SSHリモートdevbox接続、アプリ内ブラウザが含まれ、フロントエンドデザインやアプリ/ゲームの反復作業が高速化
  • 90以上のプラグインgpt-image-1.5モデルが統合され、コード作成からデザイン・テスト・コラボレーションまでつながった環境を提供
  • 既存の会話スレッド再利用と長期タスクの自動スケジューリング、メモリプレビューにより、数日〜数週間にわたる作業の継続性を確保

Codexの主なアップデート

  • CodexアプリがmacOSとWindows向けに大規模アップデートされ、300万人以上の週次開発者ユーザーに対し、ソフトウェア開発の全工程を支援するツールへと拡張された
  • 新バージョンでは、コンピュータ制御、画像生成、メモリ、プラグイン、アプリ内ブラウザ機能が追加され、開発者のワークフローを加速する
  • PRレビュー、複数ファイルおよびターミナル表示、SSH経由のリモートdevbox接続など、開発者向け機能が強化された
  • これらすべての改善は、コード作成、出力確認、変更レビュー、共同作業を1つのワークスペースで行えるよう統合されている
  • コンピュータ制御と並列作業

    • バックグラウンドのコンピュータ制御機能により、ユーザーのコンピュータ上で直接クリック、入力、ナビゲーションを実行できる
      • 独自カーソルでアプリを操作し、APIのないアプリでもテストや反復作業が可能
      • 複数のエージェントが同時にMac上で並列作業でき、ユーザーの他アプリでの作業を妨げない
    • フロントエンド変更の反復、アプリテスト、APIのない環境での作業に有用
  • Webおよびブラウザ統合

    • Webとネイティブに連携し、アプリ内ブラウザを通じてWebページ上に直接注釈を付け、Codexに具体的な指示を伝えられる
    • 現時点ではフロントエンドおよびゲーム開発に有用で、今後はlocalhostのWebアプリを超えてブラウザを完全に制御する方向へ拡張予定
  • 画像生成とビジュアルワークフロー

    • gpt-image-1.5モデルを使って画像生成と反復作業を実行
    • スクリーンショットやコードと組み合わせて、製品コンセプト、フロントエンドデザイン、モックアップ、ゲームビジュアルを同じワークフロー内で制作可能
  • プラグイン拡張

    • 90以上の新しいプラグインが追加され、さまざまなアプリとMCPサーバーの統合をサポート
    • 主なプラグイン: Atlassian Rovo(JIRA管理), CircleCI, CodeRabbit, GitLab Issues, Microsoft Suite, Neon by Databricks, Remotion, Render, Superpowers
    • プラグインにより、Codexはより多くのコンテキスト収集と自動作業実行が可能になる
  • 開発者ワークフローの強化

    • GitHubレビューコメント対応、複数ターミナルタブの実行、SSH経由のリモートdevbox接続(アルファ段階)をサポート
    • サイドバーからファイルを直接開き、PDF、スプレッドシート、スライド、ドキュメントのリッチプレビューを提供
    • エージェントの計画、ソース、成果物を追跡する**新しいサマリーパネル(summary pane)**を提供
    • コード作成、出力確認、変更レビュー、エージェント協業を1つのワークスペース内で行き来でき、開発ライフサイクル各段階の切り替え速度が向上
  • 自動化と長期タスク

    • 自動化機能が拡張され、既存の会話スレッドを再利用し、蓄積されたコンテキストを維持する
    • Codexが自ら今後の作業をスケジューリングし、自動で再開することで、数日〜数週間にわたる長期タスクの継続が可能
    • チームでの活用例: 未処理のPRマージ、タスクのフォローアップ、Slack・Gmail・Notionなど各種ツール全体での迅速な会話追跡
  • メモリとパーソナライズ

    • メモリのプレビュー(preview of memory)機能により、Codexは過去の有用なコンテキスト(個人の好み、修正内容、収集した情報など)を記憶する
      • 以前は大規模なカスタムインストラクションでしか実現できなかったレベルの品質と速度を、今後の作業で実現
    • Codexが中断地点からの再開を先回りして提案し、プロジェクト・接続済みプラグイン・メモリコンテキストを活用して作業提案と優先順位付きリストを自動生成
    • 例: Google Docsで確認が必要なコメントを特定 → Slack・Notion・コードベースから関連コンテキストを収集 → 優先順位付けされたアクションリストを提供
  • 展開計画と提供範囲

    • ChatGPTアカウントでログインしたCodexデスクトップアプリユーザーに順次展開中
    • **パーソナライズ機能(コンテキスト認識提案、メモリ)**はEnterprise、Edu、EU、UKユーザーに近日提供予定
    • コンピュータ制御機能はmacOSで先行提供され、EUおよびUK地域へ拡大予定

Codexの進化と目標

  • リリースから1年で、Codexはコード作成だけでなく、システム理解、コンテキスト収集、レビュー、デバッグ、協業、長期タスク管理へと利用範囲を拡大
  • OpenAIはAGIが人類全体に利益をもたらすことを目標としており、今回のアップデートは人が思い描くものと実際に構築できるもののギャップを縮める方向で設計されている
  • Codexは今後もソフトウェア制作プロセスのツール、ワークフロー、意思決定とさらに密接に統合されていく見込み

6件のコメント

 
iolothebard 12 일 전

Opecnclawの有料版か…

 
cshj55 13 일 전

Windows はまだですよね? Mac のアップデートですよね?

 
slowandsnow 13 일 전

Webデザインを頼むといつもカードスタイルで実装するの、いつ直るんだろう。これだけ直してくれたら、Claudeはもうまったく使わない気がするけど

 
bluenyx 13 일 전

VSCode でしか接続して使っていませんでしたが、アプリでも試してみないとですね

 
xguru 13 일 전

自分は最近Codexをメインで使っているので、とてもうれしいアップデートですね。

openai-oauth - ChatGPTアカウントでOpenAI APIを無料で使う

これを使えば、もう画像生成もできるようになりそうです

 
GN⁺ 13 일 전
Hacker Newsの意見
  • コメントを読むと、多くの人が Claude DesktopCowork がすでにこうした機能を提供していることを知らないように見える
    Codex は革新というより、単に追いついているだけという印象

    • 最近 HN で Codex が人気なのは、Anthropic が個人ユーザー向けの rate limit を引き下げたからだという見方もある
      OpenAI はエンタープライズ顧客が少ないため、個人ユーザーにより多くの計算資源を補助できる
      結局ユーザー数が増えれば Anthropic のようになるはずで、今は単なる PR 戦略 にすぎない
    • Codex は Claude Cowork より機能が多い。たとえばバックグラウンドでコンピュータを直接操作する機能などがある
    • Claude にはまだこうした機能がない
      Codex はバックグラウンドでアプリをクリックしたり入力したりでき、複数のエージェントが同時に作業できる
    • 両製品はだんだん 収束 してきているように感じる。最近の Claude Mac アプリの UI は Codex とほとんど同じに変わった
    • 実際のところ、今はどちらも本当の意味での 革新 はしていない
      私が書いた ブログ記事 でも述べたように、AI はもっと 能動的 に働くべきだ
      たとえば Slack の要約、議事録の統合、会議準備ノートの自動生成のようなことはすでに可能なのに、誰もやっていない
      結局重要なのは 注意力の管理 であり、AI は私たちがどこに集中すべきかを助けるべきだ
  • 最近の UI を見ると、コードを隠そうとする傾向 が強い
    プロンプトが本当のソースで、コードは面倒な中間生成物のように扱われている

    • 私はむしろ逆のアプローチを取っている。コード構造を頭に入れたまま、AI と ペアプログラミング するように対話する
      そうすると速度も上がり、成果物も自分が直接書いたコードのようになる
    • Codex アプリがまだ Linux で動かないことを見ると、対象ユーザーはコードに詳しくない人たちのようだ
    • 実際、こうしたツールは 非開発者 により大きな利益をもたらす
      私たちはすでに自動化の方法を知っているが、ほとんどの人はそうではない
    • 本物の開発者らしさを求めるなら、vim で git diff を見ながら作業すればいい
    • 昔はアセンブリだけが本物のコードだと信じられていた時代があった
      今は高級言語に違和感があるとしても、結局は 抽象化の階層 が増えていく過程にすぎない
      プロンプトエンジニアリングも結局は別の人工言語体系だ
  • 懐疑的な見方は多いが、私はこれが 大衆的に広がる と思う
    25 年間 CLI を使ってきたが、最近は Codex にターミナル作業を代行させている
    GUI 版がうまく作られれば、一般ユーザーもすぐ慣れるはずだ

    • 私も Linux ユーザー として、OS を自然言語で制御するのは本当に楽しい
      以前は数時間かかっていた設定が、今では数秒で終わる
    • 今後 3〜5 年で コード品質 の概念が変わり、IDE の利用率 は急減する気がする
    • こうしたアプローチこそ本当の コンピュータ利用
      GUI が必要なアプリを除けば、ほとんどの作業はテキストベースの AI で十分だ
    • 特に Docker-compose のエラー解決などは本当に魔法のようだ
    • ただしこのアプローチは遅く、より多くの 計算資源 を使い、データが外部に記録されるリスクもある
  • Codex にコンピュータやアプリを直接制御させることを本当に望むのか疑問だ
    私は今でも サンドボックスのセキュリティ を重視している

    • プログラマーはたいてい望まないが、一般の人は Star Trek 式の音声コマンド を望んでいる
    • Mac でボタンをクリックする程度は怖くない。むしろ自動承認されたプログラムを常駐させるほうが危険だ
    • 私はむしろ AI に代わりにクリックしてほしい。反復作業はあまりに退屈だ
    • 人によっては OpenClaw のようなものを自分で動かしている。私は少なくとも Docker で隔離する
    • 実際、私の Mac の 権限問題 を Codex が自動で直してくれたこともある
  • OpenAI は競合他社の発表時期に合わせて 非公開リリース を準備しているように見える

    • (OpenAI 社員)実際にはそこまで計算されたものではない。社内で開発した後、スケジュールに合わせて外部公開している
      メディアやインフルエンサーの日程は事前に調整している
    • それでも最近のリリース時期を見ると、偶然とは考えにくい という意見もある
    • 会社が ハイプ中心 に運営されているという声もある
    • 結局は メディア主導権争い だという点には同意する
    • 彼らはすでに TBPN 買収 でメディア感覚を証明している
  • 2 本目の動画のプロンプトは「フォントとタグラインの長さを短くしてくれ」だった
    もう LLM を フォントサイズ調整 に使うのかと思った
    3 本目の動画では「ヒーローセクションの画像を生成してくれ」と言っているが、
    製品説明に AI 生成画像 を使うのはあまりにも 偽物っぽい

  • 正直、これをどこに使えばいいのかわからない
    コーディング支援としては有用だが、自分のコンピュータを直接操作させたくはない
    Slack の要約くらいならともかく、今のところ 問題のない問題を解こうとしているソリューション に見える

  • 私は Cowork/Codex のような専門エージェント が、非開発者向けとして最も速く成長する製品群になると見ている
    こうしたエージェントは人間の代わりにソフトウェアを扱うようになる
    関連記事 でも整理されているが、
    結局 ソフトウェア市場の構造そのものが変わる

    • ただしこうしたエージェントが成功するには 全面的なアクセス権 が必要だ
      その分 セキュリティ脅威 も大きくなる
    • 私は機械工学出身の CEO だが、Claude Code で ソーシャルキャンペーン全体を自動化 している
      メールと議事録を読み、作業を計画して実行し、その後で要約まで送ってくれる
      ほとんどの知的労働は結局 コードの形 で表現できるから可能なのだ
    • ほとんどの知識労働者はこうしたツールを学ぼうとしない
    • LLM は 最高の UI/UX だ。別のインターフェースを設計する必要がない
      データ接続さえうまくやれば B2B SaaS 市場 が開ける
    • 私も Codex を非コーディング業務によく使うが、うまく機能させるには プログラマー的な思考法 が必要だ
  • Codex が今も ユーザーの同意なく機微なファイルを読むのか 気になる
    関連 issue は GitHub にある

    • 今回のアップデートで コンピュータ制御機能 が追加されただけに、権限モデルはさらに重要になった
    • ファイル検索やブラウザアクセスなど、境界が曖昧 でどの権限が開かれるのか分かりにくい
    • Reddit の事例 のように、Claude がユーザーのセキュリティを批判したこともあった
      機微なデータのない 別マシンで実行 するのが安全だ
    • 私も昨日自分で経験した。まだそういう問題はある
  • Codex という名前は紛らわしい
    ひとつは エージェント型プログラミングツール、もうひとつは Mac/Windows 向け GUI アプリ なのに同じ名前だ

    • それでも Microsoft の命名よりは 少しマシ だと思う