Physical Intelligenceの初の汎用ポリシーAI、洗濯対応を実現
(physicalintelligence.company)-
フィジカル・インテリジェンス(π)π0: 私たちの最初の汎用ポリシー
-
私たちはAI革命の時代に生きており、AIはチェスの対局に勝つことや新薬を発見することのような「簡単な」問題は解決できる一方で、シャツをたたんだりテーブルを片付けたりするような物理世界の課題はいまだに難しい問題である。これを解決するには、AIシステムにフィジカル・インテリジェンスを持たせる必要がある。
-
過去8か月の間に、私たちは汎用ロボット基盤モデルであるπ0を開発してきた。これは、ユーザーがロボットに望む作業を行うよう依頼できる人工知能を開発するための最初の一歩である。π0は画像、テキスト、行動をまたぎ、ロボットの経験を通じてフィジカル・インテリジェンスを獲得する。
-
汎用ロボットポリシーの可能性
-
現在のロボットは狭い範囲の専門性しか持たず、複雑な環境で行動することはできない。AIは、ロボットがユーザーの指示を学び、それに従えるようにすることで、新たな行動をプログラムすることを単純化できる。そのためには大量のデータが必要となる。
-
汎用ロボットポリシーを訓練できれば、多様なスキルを実行し、さまざまなロボットを制御できるモデルを作ることができる。これは少量のデータで新しい作業に特化させることも可能である。
-
クロス実装トレーニング混合
-
π0は、インターネット規模のビジョン・言語事前学習、オープンソースのロボット操作データセット、8種類の異なるロボットによる精密作業データセットを用いて訓練された。さまざまな作業を実行でき、ゼロショットプロンプトやファインチューニングによって実現可能である。
-
インターネット規模の意味理解の継承
-
π0は、インターネット規模で事前学習されたビジョン・言語モデル(VLM)から、意味知識と視覚理解を継承している。VLMは、ウェブ上のテキストと画像をモデル化するよう訓練されている。
-
精密な操作のための事後学習
-
複雑で精密な作業は、モデルをファインチューニングすることで特化できる。たとえば、洗濯物をたたむ作業は非常に難しい作業である。
-
π0の評価と比較
-
π0は、他のロボット基盤モデルと比較して、すべての作業で優れた性能を示した。π0-smallと比べてもより良い性能を示している。
-
今後の方向性
-
Physical Intelligenceの目標は、あらゆるロボットを制御できる基盤モデルを開発することである。これまでの実験は、さまざまなロボットを制御し、これまで成功していなかった作業を実行できることを示している。しかし、汎用ロボットポリシーはまだ初期段階にあり、今後さらに多くの進展が必要である。
1件のコメント
Hacker Newsの意見
人間の満足のために家事ロボットが必要であるという指摘
ロボットの実用性に対する懐疑的な見方
ヨーロッパの都市における空間制約の問題
実験室自動化ツールとしてのロボットの可能性
調理ロボットの潜在力
ロボットの単純さとコストの問題
洗濯の変化
ロボットの速度の問題