HyperAgents: Meta AIの自己改善エージェントフレームワーク
(ai.meta.com)- 人間のエンジニアリングへの依存を減らすため、自らの学習と問題解決の過程を自律的に改善する自己参照型AIエージェントシステムであり、既存の再帰的自己改善方式が持つ固定的なメタメカニズムの限界を克服
- タスクエージェント(目標課題を遂行)とメタエージェント(自分自身とタスクエージェントを修正)を1つの編集可能なプログラムに統合する構造
- 既存の Darwin Gödel Machine(DGM)はコーディング領域でのみ自己改善が可能だったが、HyperAgents はコーディング・論文レビュー・ロボティクス・数学採点など多様なドメインへ拡張
- メタレベルの修正手続き自体も編集可能であり、改善メカニズムを改善するメタ認知的自己修正が中核的な差別化要素
- メタレベル改善がドメイン間で転移し、実行をまたいで蓄積される特性を実験的に確認し、汎用的な自己加速AIシステムの可能性を示す研究
従来の自己改善システムの限界
- 自己改善AIシステムは、人間のエンジニアリングへの依存を減らすため、学習および問題解決プロセスそのものを自動的に改善することを目的とする
- 従来の再帰的自己改善アプローチは、固定され手作業で作られたメタレベルのメカニズムに依存しているため、システムが改善できる速度には根本的な限界がある
Darwin Gödel Machine(DGM)とコーディング領域の制約
- DGM(Zhang et al., 2025b)は、コーディング領域でオープンエンドな自己改善が可能であることを実証したシステム
- 単一のコーディングエージェントから出発し、自己修正された変種を反復的に生成・評価しながら、将来の改善に向けた足がかりアーカイブを拡張していく方式
- 評価と自己修正の両方がコーディング作業であるため、コーディング能力の向上がそのまま自己改善能力の向上につながる
- しかし、このような**ドメイン整合(domain-specific alignment)**は、コーディング以外の領域では一般に成り立たないという限界がある
HyperAgents フレームワークの構造
- HyperAgents は自己参照型エージェント(self-referential agent)であり、2つの構成要素を単一の編集可能なプログラムに統合
- タスクエージェント(task agent): 目標課題を解く役割
- メタエージェント(meta agent): 自分自身とタスクエージェントを修正する役割
- 核心として、メタレベルの修正手続き自体が編集可能であり、**メタ認知的自己修正(metacognitive self-modification)**を実装
- 課題解決の行動だけでなく、将来の改善を生み出すメカニズムそのものも改善できる
DGM-Hyperagents(DGM-H)
- DGM を拡張して**DGM-Hyperagents(DGM-H)**として具体化
- 改善手続き自体が進化できるようにすることで、課題性能と自己修正能力の間にあるドメイン特化型整合の仮定を除去
- 理論的には、あらゆる計算可能な課題において自己加速的な進歩を支援できる可能性を確保
実験結果とドメイン範囲
- コーディング、論文レビュー、ロボティクスの報酬設計、オリンピックレベルの数学解答の採点など多様なドメインで実験を実施
- DGM-H は時間の経過とともに性能が継続的に向上
- 自己改善やオープンエンド探索のないベースライン、そして従来の DGM と比べても優れた性能を達成
メタレベル改善の転移と蓄積
- DGM-H は、新しいエージェントを生成するプロセスそのものを改善していることが確認された
- 例: 永続メモリ(persistent memory)、性能追跡(performance tracking) などのメタレベル改善を導出
- こうしたメタレベル改善は、**ドメイン間転移(transfer across domains)**が可能であり、**実行をまたいで蓄積(accumulate across runs)**される特性を持つ
安全性に関する考慮
- すべての実験は、サンドボックス化、人間の監督などの安全対策のもとで実施
- 自己改善システムの文脈において安全性が何を意味するのか、そして自己改善システムの広範な含意についての議論を含む
意義
- DGM-Hyperagents は、より良い解決策を単に探索するだけでなく、改善方法そのものを継続的に改善するオープンエンドなAIシステムの可能性を示している
まだコメントはありません。