- Toyota Research Institute(TRI)は、Diffusion Policyに基づく生成AIアプローチを用いて、ロボットに新しいスキルを教えるブレークスルーを発表しました。
- この新しいアプローチはロボットの有用性を大幅に高め、対話型AIを革新したLarge Language Models(LLMs)に類似する「Large Behavior Models(LBMs)」をロボット向けに構築する方向へ一歩前進しました。
- この新しい学習手法は効率的で高性能な行動を生成するため、ロボットが人々をより効果的に支援できるようになります。
- 従来のロボット学習手法は遅く、一貫性がなく、非効率的で、その多くは非常に限定された環境で行われる狭い範囲の作業にとどまっていました。
- TRIはこの新しいアプローチを使って、液体を注ぐ、道具を使う、変形可能な物体を操作するといった60種類以上の難易度が高く器用さを要するスキルをロボットに教えました。
- TRIは今年末までに数百種類の新しいスキルを、2024年末までに1,000種類を教えることを目標としています。
- TRIのロボットは現在、多様で豊かな方法で世界と相互作用できるようになっており、これは将来的にロボットが日常的な状況や予測不能で絶えず変化する環境で人々を支援できるようになることを意味します。
- TRIのロボット行動モデルは、教師の触覚的な実演と目標に関する言語的な説明を組み合わせ、AIベースのDiffusion Policyを用いて実演されたスキルを学習します。
- TRIはColumbia UniversityのSong教授のグループとの協業を通じてDiffusion Policyを開発しました。これは行動学習に対する強力な生成AIアプローチです。
- TRIのロボットプラットフォームは、触覚フィードバックと触覚センシングを可能にする、器用な双腕操作タスク向けにカスタム構築されています。
- TRIはDrakeを使用しています。これはロボット設計のためのモデルベース設計であり、最先端のツールボックスとシミュレーションプラットフォームを提供し、シミュレーションと現実環境の両方での開発をさらに拡大・加速できます。
- 安全性はTRIのロボット開発の取り組みの中核であり、システムにはロボットが自分自身や周囲の環境と衝突しないことなどの安全保証を順守するよう設計された強力な保護機構が含まれています。
- TRIの今回のブレークスルーに関する、より技術的な情報はTRIのMediumブログで確認でき、10月4日にLinkedIn Live Q&Aセッションで議論される予定です。
1件のコメント
Hacker Newsの意見