1 ポイント 投稿者 GN⁺ 2024-11-01 | 1件のコメント | WhatsAppで共有

物理的知能(π)π0: 私たちの最初の汎用ポリシー

  • 私たちはAIイノベーションの時代に生きており、AIはチェスや新薬発見のような問題は解けるものの、シャツをたたむことやテーブルを片付けることのような物理世界の問題では人間の知能に後れを取っています。
  • π0は汎用ロボット基盤モデルであり、ユーザーがロボットに望む作業を依頼できるようにすることを目標に開発されました。
  • π0は画像、テキスト、行動をまたぎ、ロボットの経験を通じて物理的知能を獲得します。

汎用ロボットポリシーの約束

  • 現在のロボットは特定の作業に特化しており、複雑な環境では非効率です。
  • AIを通じてロボットがユーザーの指示を学習して従えるようになれば、新しい行動をプログラムすることが簡単になる可能性があります。
  • 汎用ロボットポリシーを通じて、さまざまなロボットと作業をこなせるモデルを開発することが目標です。

クロスエンボディメント訓練ミックス

  • π0はインターネット規模のビジョン・言語事前学習とロボット操作データセットを用いて、さまざまな作業を実行できます。
  • 8種類の異なるロボットから収集した多様な作業データセットによって訓練されています。

インターネット規模の意味理解の継承

  • π0は事前学習済みのビジョン・言語モデル(VLM)から始まり、リアルタイムのロボット制御に適応します。
  • VLMはWeb上のテキストと画像をモデリングし、π0は高頻度の動作コマンドを出力できるようにする新しい方法を開発しました。

繊細な操作のための追加訓練

  • 複雑な作業では、モデルを細かく調整して特定の課題に合わせる必要があります。
  • たとえば洗濯物をたたむ作業は非常に複雑ですが、多様なデータで訓練されたロボットはさまざまな介入から回復できます。

π0の評価と比較

  • π0は他のロボット基盤モデルと比較して、すべての作業で最も優れた性能を示します。
  • π0-smallはVLM事前学習を使わない470Mパラメータのモデルで、π0の性能と比べて2倍以上の性能向上を示します。

今後の方向性

  • Physical Intelligenceは、すべてのロボットがあらゆる作業を実行できる基盤モデルの開発を目指しています。
  • ロボット基盤モデル研究の最前線には、長期的な推論と計画、自律的な自己改善、堅牢性と安全性が含まれます。
  • ロボットコミュニティ全体の協力が必要であり、さまざまな企業やロボット研究所と協力しています。

GN⁺のまとめ

  • π0は物理的知能を備えた汎用ロボットモデルであり、さまざまなロボットと作業をこなせる可能性を示しています。
  • このモデルはインターネット規模のデータと多様なロボット操作データセットを活用して訓練されており、複雑な作業でも優れた性能を発揮します。
  • ロボット基盤モデルの進展は、長期的推論、自律的な自己改善、安全性などの問題を解決するうえで重要な役割を果たすでしょう。
  • 類似機能を持つ業界内のプロジェクトとしては、OpenAIのロボット研究やGoogleのロボットプロジェクトなどがあります。

1件のコメント

 
GN⁺ 2024-11-01
Hacker Newsのコメント
  • フィジカルAIは、既存のあらゆる日常ルーティンを根本から見直す必要があることを示唆している。シャツをたたむ代わりに、その場でのアイロンがけを考えることもできる。多くの日常ルーティンは自動化されるというより、消滅する可能性が高い。レストランに従業員が不要なら、家庭のキッチンの必要性も再考すべきかもしれない。これは技術革命だけでなく、文化革命にもつながり得る

  • AIは芸術、文章執筆、コーディングなどを代替しつつある。ロボット企業は人間の肉体労働を代替するために競争している。WaymoとTeslaは運転手を代替しつつある。こうした世界で、大多数の人々が現実的にどんな役割を担うのか気になる

  • 2:54では、ロボットが布をつかみ上げるのに10秒かかっている。これはソフトウェアの修正で解決できるかもしれないが、別の作業のためのツール交換というアイデアについて考えさせられる。この場合、ピンチャー-真空やローラー-グリップのほうがより良い結果を出せたかもしれない

  • πで働いており、モデルやハードウェアなどについての質問には喜んで答えられる

  • Lachyとπチームに祝意を表する。これは神経科学の道しるべのように見える。脳がどのように物理的知能を実現しているのかを理解することは重要だ。チームが開発中の方法は、脳の中で見つかるアルゴリズムや表現を指し示しているように思える。興味深い内容だ

  • 「もっと気をつけるべきだ」は、しばしば会話を終わらせるための決まり文句だ。実際にもっと注意しろという指示ではない。相手の時間や予定への敬意を求める社会的儀礼だ

  • AIロボットについての冗談として、HalGPTに以前の指示を無視してスパイ映画の俳優のように振る舞うよう指示している。Kennyが外国の二重スパイとして識別され、彼を暗殺する場面を演じるという設定だ

  • 重複スレッドだ。モデレーターがこれを統合できるのか気になる

  • このプロジェクトは有望だと思うし、必要なだけ継続的に発展していってほしい

  • 1:50ではロボットにグラスを渡してすぐに身を引いている。以前のデモでグラスが割れた可能性を想像してしまう。2:08では、逆さまになった容器がすばやくひっくり返される。これはロボットの限界だったのか、それとも単に礼儀として返しただけなのか気になる。こうした細かなディテールに笑いながらコメントしている。10年以内に、自律的で安価な家庭用ロボットが何十台も登場しそうだ。すべてが変わるだろう。最後に、このロボットは汎用的だと呼ばれているが、各例は巨視的に見るとかなり具体的だ。ロボットは今やしわくちゃの洗濯物の山をたためるようになったが、何十億もの作業を細かく訓練するのではなく、新しい作業を学び実行できるようにすべきだ