Agents SDKの次世代進化

(openai.com)

7 ポイント投稿者 GN⁺ 14 일 전 | まだコメントはありません。 | WhatsAppで共有

OpenAIがAgents SDKを大幅にアップデートし、エージェントがファイル検査・コマンド実行・コード編集・長時間タスクを制御されたサンドボックス環境で実行できる標準化インフラを提供
新しいハーネスは、構成可能なメモリ、サンドボックス対応オーケストレーション、Codexスタイルのファイルシステムツール、MCP・skills・AGENTS.md・shell・apply patch などフロンティアエージェントシステムの主要プリミティブを統合
ネイティブなサンドボックス実行支援により、Blaxel、Cloudflare、Daytona、E2B、Modal、Runloop、Vercel など多様なサンドボックスプロバイダーを標準サポートし、自前のサンドボックス接続も可能
ハーネスとコンピュートの分離アーキテクチャにより、プロンプトインジェクション防御、スナップショットベースの耐久実行、マルチコンテナ並列化などのセキュリティ・拡張性を確保
APIベースの標準的なトークンおよびツール使用課金で全顧客向けに一般提供（GA）され、TypeScript対応とコードモード・サブエージェント機能は今後追加予定

既存のエージェントシステムの限界

開発者が有用なエージェントを構築するには、優れたモデルだけでなく、ファイル検査、コマンド実行、コード作成、多段階タスクの維持を支えるシステムが必要
既存アプローチのトレードオフ
- モデル非依存フレームワークは柔軟だが、フロンティアモデルの機能を完全には活用できない
- モデル提供者SDKはモデルに近い一方で、ハーネスに対する可視性が不足しがちなことが多い
- マネージドエージェントAPIはデプロイを簡素化するが、エージェントの実行場所や機密データへのアクセス方法を制限する

今回のリリースにより、Agents SDKのハーネスはドキュメント、ファイル、システムを扱うエージェントに対してより強力な機能を提供
新たに統合された主要プリミティブ
- MCPによるツール利用
- skillsによるプログレッシブディスクロージャ
- AGENTS.mdによるカスタムインストラクション
- shellツールによるコード実行
- apply patchツールによるファイル編集
ハーネスは今後も新しいエージェント的パターンやプリミティブを継続的に統合していく予定であり、開発者はコアインフラの更新ではなくドメイン固有ロジックに集中できる
ハーネスは、フロンティアモデルが最適な性能を発揮する方法に合わせて実行を整列させることで、特に長時間実行タスクや多様なツール・システム間の調整が必要な複雑な作業で、安定性と性能を向上
各製品固有の要件を支援するよう設計されており、ツール利用・メモリ・サンドボックス環境などを開発者の既存スタックに合わせて柔軟に調整できる

更新されたAgents SDKはサンドボックス実行をネイティブに支援し、エージェントがタスクに必要なファイル・ツール・依存関係を備えた制御されたコンピュータ環境で実行可能
多くの有用なエージェントには、ファイルの読み書き、依存関係のインストール、コード実行、ツールの安全な利用が可能な**ワークスペース(workspace)**が必要であり、ネイティブなサンドボックス支援はこれを別途構成せずに標準提供する
自前のサンドボックスを持ち込むか、Blaxel、Cloudflare、Daytona、E2B、Modal、Runloop、Vercelなどの組み込みサポートを活用可能
環境を複数のプロバイダー間で移植可能にするため、Manifest抽象化を導入
- ローカルファイルのマウント、出力ディレクトリの定義が可能
- AWS S3、Google Cloud Storage、Azure Blob Storage、Cloudflare R2などのストレージプロバイダーからのデータ取り込みを支援
開発者に、ローカルプロトタイプから本番デプロイまで一貫した環境構成方法を提供
モデルに対して、入力場所、出力場所、長時間実行タスク中の作業整理方法に関する予測可能なワークスペースを提供

エージェントシステムはプロンプトインジェクションやデータ流出の試みを前提として設計すべきであり、ハーネスとコンピュートの分離は、モデル生成コードが実行される環境から認証情報を隔離するのに寄与する
**耐久実行(durable execution)**を支援
- エージェント状態が外部化されていれば、サンドボックスコンテナの喪失が実行喪失につながらない
- 組み込みのスナップショットとリハイドレーションにより、元の環境が失敗または期限切れになった場合でも、新しいコンテナで最後のチェックポイントから状態を復元して実行を継続できる
拡張性を強化
- エージェント実行は1つまたは複数のサンドボックスを利用できる
- 必要なときだけサンドボックスを呼び出し、サブエージェントを隔離環境へルーティング可能
- マルチコンテナ並列化により、より高速な実行を支援

Oscar HealthのStaff Engineer & AI Tech LeadであるRachael Burnsによれば、更新されたAgents SDKにより、従来のアプローチでは十分に安定して処理できなかった臨床記録ワークフローの自動化を本番レベルで実装
単純なメタデータ抽出ではなく、長く複雑な記録から各診療区切り(encounter boundary)を正確に理解することが中核的な差別化要因
その結果、各患者の受診状況をより迅速に把握でき、患者ケアと体験の改善に貢献