RoboCat - 自己改善するロボットエージェント
(deepmind.com)- Google DeepMindが、ロボットアームを通じてさまざまな作業をこなしながら自ら学習するRoboCatを紹介。
- 実環境とシミュレーション環境の両方で動作できるマルチモーダルモデルGato(スペイン語で「猫」)をベースとしている。
- 自己改善のため、まず新しい作業について実データを収集。
- 実データを基にベースモデルをファインチューニングし、スピンオフエージェントを生成。
- 新しいエージェントが約1万回の練習を行い、学習データセットを作成。
- 実データと自己生成データをRoboCatの学習データセットに統合。
- 新バージョンのRoboCatを訓練。
- これにより、関節数が多い、またはグリッパーが多い新しいロボットアームにも数時間で適応可能。
- さらに、学習の好循環が生まれ、特定の作業で36%の成功率だった初期モデルが2倍以上向上して74%まで上昇。
3件のコメント
ついに人工知能が現実世界に出会い、体験する場が開かれるのですね
HN スレッドのコメントがとても面白いですね。
私もまったく同じようなことを考えていて、
ロボット猫を期待していたのは私だけですか? ちょっとがっかりです...と思いました...ロボットアームに猫のステッカーでも貼ってくれたらいいのに。
論文を要約すると、次のようになります。
RoboCatは、ロボット操作のための自己改善型エージェントです。これは、複数のシミュレーションと実機のロボットアームを用いたロボット作業の大規模かつ多様なデータセットで訓練されます。
RoboCatの主な目標は次のとおりです。
主な結果は次のとおりです。
要約すると、RoboCatは大規模かつ多様なデータセットで訓練されたロボット操作向けの自己改善型エージェントであり、ファインチューニングと自己改善を通じて、新しいタスクやロボットに対して最小限のデータで汎化できることを示しています。大規模で異種なロボット経験を活用する能力は、ロボット学習を変革しうる潜在力を持っています。