iRobot創業者: AIとロボティクスの誇大なハイプにだまされないでください
(crazystupidtech.com)- iRobotの創業者であり、MITのロボティクス教授出身の Rodney Brooks が、現在のAIとロボティクス分野における誇大広告について 現実的な視点 を示す
- ヒューマノイドロボット への期待は誇張されており、人間型ロボットが人間のあらゆる能力を再現できるという前提は 誤った約束 を生み出す
- 自動運転車やロボットなど 現実環境の複雑さ を扱うには、派手なデモ よりはるかに長い時間が必要であり、コンピュータ・インターネット革命のように AI革命も数十年 を要する見通し
- Brooksは現在、倉庫自動化向けのスマートカートを開発中で、人間を置き換えるのではなく 人間の作業を補助 する実用的なロボティクスを追求
- AGI(汎用人工知能)は300年後 にようやく可能になるかもしれず、現在のコンピューティングパラダイムでは人間の知能を完全に実装するのは難しい可能性があると強調
Brooksの経歴と哲学
- Rodney BrooksはMITのロボティクス教授であり、MITコンピュータ科学・人工知能研究所の元所長
- iRobot(Roombaのメーカー)、Rethink Robotics、現在のRobust.AIまで3社を創業
- オーストラリア出身で、幼少期は労働者階級の家庭で育ったが、数学の才能 により早くから「教授」というあだ名を付けられた
- 1961年に出版された電気やコンピュータに関する本を読み、回路やコンピュータを作ろうと試みながら ロボットへの情熱 を育んだ
- 彼の会社は常に 人間が主導権を保つ よう設計されており、ロボットは人間を助ける役割に集中している
現在のプロジェクト: Robust.AIとスマートカート
- Robust.AIは物流倉庫向けのスマートカート Carta を開発中
- 倉庫作業員は1日に平均3万歩(約24km)を歩き、身体的負担が大きい
- Cartaはカメラで位置を把握し、作業者が必要な物品の場所を見つけられるよう支援し、歩行距離を大幅に削減 する
- 作業者がピッキングを終えると、カートが自動で積載場所まで移動し、400フィートの歩行を代替 する
- カートは、人がハンドルを握ると即座に人間が制御権を持つよう設計されている
- スーパーマンのように小さな力でカートを動かせる 力増幅機能 を提供
- はしごの近くには安全のため近づかず、通路が塞がれていれば中央システムに報告する
- 単純だが信頼できる知能 に焦点を当てる
- 1980〜90年代の技術をエミュレートした従来のハンドヘルドスキャン端末と比べて 認知的負担を軽減
- DHL(最大顧客)やAmazonなど、手作業中心の倉庫にロボットを導入することが目標
- この市場は 4兆ドル規模 で、今後数十年続く見込みだが、派手ではないため投資を集めにくい
ロボティクスの現実と限界
技術進歩とロングテール問題
- 現在は処理能力、センサー、モーターなどのハードウェアが大きく進歩
- 電動スクーター用のハブモーターを使うことで、10年前より安価かつ優れた性能を実現
- Nvidia GPUはもともとグラフィックス処理用だったが、ニューラルネットワーク計算に適している ことが偶然見いだされた
- GPUはSLAM(Simultaneous Localization and Mapping)などのビジョン計算にも有用
- しかし人々は 自然環境におけるロングテール(long tail) の問題を過小評価している
- 1979年に自動運転車の講演を初めて聞き、1990年にはドイツでアウトバーン走行の成功例があった
- 2007〜2008年のDARPA自動運転車以後、「まもなく至る所で見られるようになる」という予測があったが、実際にはほぼ20年かかった
- 現在でも 小さな地理的範囲でしか 運用されていない理由は、起こり得るあらゆる状況のロングテールにある
派手なデモ vs 現実環境
- 派手なデモ は実際の環境に対処できない
- Waymoでさえ依然として 人間の介入が必要
- Teslaのタクシーシステムには懐疑的で、Elon Muskが安全運転手と遠隔ドライバーを雇うと明かしていると指摘
- 技術が完成形を見つけるまでには長い時間が必要
- PCはMS-DOSから現在の形になるまで、スマートフォンもNokiaやPalmから現在に至るまで数十年を要した
- 自動運転も 普及まで長い時間 が必要
SLAMの歴史と教訓
- 1985年にSLAM論文が発表された当時、Brooksは自分の生涯で現在のWaymoレベルのものが登場するとは予想していなかった
- 初期のアイデアだった ループクロージング(loop closing) は重要だったが、実装は不完全だった
- 1年後に別の研究者が改良論文を発表
- 1990年代を通じて毎年数百本のSLAM論文が出され、段階的な改良が続いた
- コンピュータビジョンによるSLAM が実現可能になったのはここ5年ほどのことである(それ以前はLIDARベース)
- 教訓: あらゆるものは予想以上にはるかに多くのエンジニアリングを必要とし、技術は他の技術が成熟するのを待たなければならない
ヒューマノイドロボットの誇大広告
- 人間型ロボットは できることについての約束 を生み出す
- Roombaは床を掃除する小さな円盤であり、窓掃除までしてくれるという期待は抱かせない
- しかし 人間型というだけで、人間にできるすべてのことができるという約束 を内包してしまう
- これがヒューマノイドの魅力だが、実際には 驚くような約束を売っている にすぎない
- ロボットハンドの問題
- 多くの人がロボットハンドに熱狂し、中国企業も 器用さがあると錯覚している
- しかし人間が手で行うことを再現する方法はなく、5本指の形が最適だと考えるべきでもない
- 5本指の構造は、海から陸に上がった最初期の生物の 進化上の偶然 にすぎない
- 未来の器用なツールは、イソギンチャクのように多数の触手 を持つ形かもしれない
- 人間の複製が最適または費用対効果の高い解ではない
- ロボットとAIを正しく考える方法は、外見だけで判断しないこと
- 現在の技術では難しいことが数多くあり、誇大広告はそれを無視している
AIと教育に関する見解
生成AIと問いの重要性
- 生成AIは 答え中心から問い中心の価値体系への転換 を意味する
- 正しい問いを立てる能力が、平凡さと卓越性を分ける
- 哲学、芸術、ロボティクス、AIで問いを立てられる人は特別である
- 生成AIは 長く維持されてきた観念に挑戦 している
- John Searleの中国語の部屋論法: コンピュータは人間の意識を持てない
- ChatGPTに中国語入力を与えると中国語で返答するのを見て、「中国語の部屋が現れた」と評価
- 言語理解の意味そのものへの挑戦である
- 生成AIは 情報と相互作用する方法のエンコーディング である
- 15年前に説明されていたら「そんなものは動くはずがない」と言っただろう
- 実際に動いていること自体が驚き
教育システムの再考
- ドイツの制度のように 職業訓練と知的探究を区別 すべき
- 観光経営の学士号は職業訓練であり、知的探究ではない
- ドイツは長年、職業訓練とエリート大学を分けてきた
- 歴史教育の問題点
- 「こういうことが起きた、ああいうことが起きた」という単純暗記になっている
- なぜ起きたのか、どんな知的アイデアが導いたのか を教えていない
- MITでも、学生は実際に何かを作ってみて初めて「だからあの授業であれを教えていたのか」と気づく
- ジャーナリズムが最高の教育
- マイクロコントローラ、組み込みOS、ネットワーク、スイッチ、コンピューティングなどを学ぶ
- 実在の人々と現実世界に対する技術の影響 も学べる
- 大学はこうしたつながりを提供できていない
AGIと計算パラダイムへの懐疑
ニュートンの錬金術の比喩
- Isaac Newtonは 微積分の発明、重力法則、光学研究 など天才的な業績を残した
- しかし人生の半分以上を 錬金術(鉛を金に変えること) に費やした
- 当時は誰もが化学の問題だと思っていたが、実際には 原子核物理学 の問題だった
- Newtonは誤った基本モデルを持っていた
- Elon Muskがロケットを軌道に乗せようとするとき、Pythonスクリプトだけでは不可能
- 燃料効率の高い燃焼、質量、液体の流れ、高温 などの物理的問題を解決する必要がある
- 計算だけで物体を物理的に動かすことはできない
計算は正しいパラダイムなのか?
- 1945〜1965年の間に4つの分野が登場
- 神経科学、AI、人工生命、無生物発生論
- それらはすべて 計算を主要な比喩 として採用した
- だが、計算は本当に私たちの脳で起きていることなのか?
- AGIは300年後になって初めて可能 かもしれない
- 私たちが間違った種類の「材料」を扱っているからだ
- Newtonの錬金術のように失敗が運命づけられている可能性もある
人間知能の限界
- 人間知能の無限の力を前提にすること の問題
- シャチ(Orca)は非常に賢く、残酷で、問題解決能力もある
- 浅瀬でアザラシを捕らえるために体を90度傾け、背びれを隠す
- しかしシャチが製錬所を作って金属を溶かすとは誰も思わない
- 人間にもシャチのような 自然な限界 があるかもしれない
- 私たちは無限に賢く、あらゆる問題を技術で解決できると考えがちだ
- だが人間にも到達できない限界があるかもしれない
製造業の未来と技術変化
中国の製造業とサプライチェーン
- Brooksは1990年代後半から中国で製造を開始
- 最近Foxconnと契約し、大規模なロボット生産を予定
- 大規模生産を望むなら中国/台湾は不可欠
- 中国製造業の強みは サプライチェーン にある
- 中国の製造企業はマレーシア、ベトナムなどにもサプライチェーンを構築し、多角化している
- 今後50年後には ナイジェリアが技術革新の中心 になるだろう
- 人口に占める比重が世界的に大きく、解決すべき問題も多い
- 中国が巨大な人口と課題解決の必要性によって経済大国になったのと同じ論理
3Dプリンティングと製造業革命
- 3Dプリンティングが製造業を主導 する可能性
- まだそうではないが、機械部品への利用は始まっている
- ニュージーランドのElectronはロケットモーターを3Dプリンティングで製造している(高付加価値製品だから可能)
- 3Dプリンティングが一般化すれば、サプライチェーンは原材料中心 へと変化する
- 中国製造業の強みである部品供給網の力学が完全に崩れる
- 最終的にはあらゆる項目が3Dプリンティングされるようになる
- 発展途上国では情報技術や決済システムが米国より速く普及したように、3Dプリンティングも 発展途上国でより速く拡大 するだろう
製造業雇用の矛盾
- Brown Universityの卒業式スピーチでの問い
- 「自分の子どもが工場で働くことを望む親はいますか?」 → 誰も手を挙げなかった
- 「下水処理会社で働いてほしい人は?」 → いなかった
- 製造業の雇用喪失を嘆くのは 偽善的 である
- 「私たちのためではなく、貧しい人たちのためのものだ」という発想
- BYDの新工場の例
- サンフランシスコ市ほどの広さの工場に4万人しか雇っていない
- 残りはすべてBYD製のロボット
- これが 大規模製造業の未来 である
- 政治家が語る「製造業の雇用」は、ロボット革命や3Dプリンティングを考えれば 25年後には大きく変わっている だろう
その他の技術進歩
- AIを材料開発に応用
- 材料特性を予測 できるため、一つひとつ作って試験する必要がない
- 材料の変化、3Dプリンティング、ロボティクス以外にもさまざまな技術が組み合わさる
- 正確にどうなるかは分からないが、確実に違う世界になる
AIハイプサイクルと現実主義
AI史の繰り返し
- Brooksは自らを 現実主義者 と位置づける
- AI分野で数多くのハイプサイクルを経験してきた
- 以前は一般には知られていなかったが、AI実務家の間では 激しい論争と悲鳴 が飛び交っていた
- ニューラルネットワークは現在優勢だが、過去にも4〜5回優勢になっては崩れた
- 別のものが取って代わり、また戻ってくる
- エージェントベースAIの例
- 突然、誰もがエージェントベースAIを打ち出し始めた
- 6か月前には存在しなかったもの → マーケティングが現実を先行 している
- 最初のエージェントAI論文は1959年にOliver Selfridgeが発表
- SOARなど複数のエージェントベースシステムがあり、戻ってくるたびに改良されてきた
投資と浪費
- 莫大な資金が流れ込んでおり、何らかの影響は与える
- だが、その多くは浪費されるだろう
- 明るい面: ネットワークの過剰構築の例
- ネットワークは過剰構築されたが、Googleは安価にネットワークを構築して検索を提供できた
- データセンターも過剰構築 されるだろう
- 生成AIモデル訓練ブーム崩壊後、データセンターをどう使うか考える必要がある
- ビットコイン採掘ではないにせよ、賢い人たちが 新しい用途 を見つけるだろう
- 今は無名で貧しい環境で研究している誰かが、次のブームを起こすかもしれない
量子コンピューティングの役割
- 今後10年間、有効な量子コンピュータは 物理システムのシミュレーション に使われるだろう
- 古典計算をはるかに上回る汎用性能を持つのは、まだ遠い未来
- 昔の冗談: 「量子コンピュータがいつ登場するかは分からないが、核融合で駆動される 気がする」
- 今では核融合のアプローチも多様化しつつある
- 当面、量子コンピュータは物理システムのシミュレーションに集中する
結論: 現実的な楽観主義
- 外見だけで判断してはならない
- 現在の技術には 非常に難しいことが数多くある
- ロボティクスとAIの誇大広告は、私たちがまだよく分かっていないことを無視している
- 人間の複製が最適または費用対効果の高い解ではない
- ロボットとAIに満ちた世界でも、人間はうまくやっていけるという信念
- 技術の進歩には予想よりはるかに長い時間がかかるが、最終的には私たちの生活を改善する方向へ進化していく
1件のコメント
Hacker Newsの意見
とても印象的な引用が1つあった。ロボットの物理的な外見そのものが「このロボットにできること」を約束してしまうという話。たとえばRoombaは小さな円盤型なので、床を掃除すると期待され、窓掃除までするとは期待されない。一方でヒューマノイドロボットは「人間にできることは何でもできる」という約束をしてしまう。だから人々にとても魅力的に映る――とてつもない約束を売っているわけだ
これは言語モデルについても同じように感じる。言語的な外観が、そのまま「このモデルにできること」を示唆している。Clippyは小さな漫画風の紙クリップだから、すごい小説を書くとは思わないが、限定的な助けはしてくれそうだと期待する。ところが人間の言葉で会話すると、「人間にできることは何でもできる」と感じてしまい、それを巨大な約束として受け取ってしまう
すべての企業がヒューマノイドロボットを目指す理由は、私たちがすでにその「フォームファクタ」を中心に世界を構築しており、進化的にもそれに適応してきたからだ。完全に汎用的なデザインだ。OpenAIがLLMを追求した理由もこれと似ている。最初は無理な期待がつきまとうだろうが、投資という観点では依然としてそのフォームファクタを試す価値はあると思う。実現可能性さえあるなら
「Brooksはナイジェリアが人口規模だけで経済と技術の中心地になると信じている」というくだりには笑ってしまった。人口が多いだけで経済大国になれるという素朴な前提自体がおかしいと思う。中国共産党にはさまざまな理由で批判的ではあるが、この40年間で成し遂げた効果的かつ効率的なガバナンスは簡単に再現できるものではない。優れた統治こそが本当に希少な資産だ。人口は多いが効果的な統治がないインドのように、ナイジェリアが中国並みにうまく統治される可能性はゼロに近い
インドは人口は多いが良い統治がない、という見方には同意できない。インド人として、独立当時から今までの変化を見ると、本当に驚くべき成果を上げてきた
中国はナイジェリアに莫大な投資をしており、最大の債権国も中国だ。だからナイジェリア政府が中国共産党とまったく異なるとも限らない
インドの1人当たりGDP成長の推移
ナイジェリアについての意見には同意するが、インドについては違う。インド政府にも非常に有能な人材がいると聞いている。そしてアフリカにもケニアのように急成長している国はある
Brooksが数年前に自分で投稿した内容とほとんど同じだ。最近HNでも扱われていた。すでに automated guided cart を販売している会社は多い。<br>最初はヒューマノイドロボットなんてばかげていると思っていたが、価格を見て考えが変わった。Unitree G1は22,000ドルで、トヨタ Corolla より安い。Boston Dynamicsのように高価だと思っていたハードウェアが、もうここまで安くなっている。まだ生産量の少ない初期製品ではあるが、価格はさらに下がるだろうし、ヒューマノイドロボットが自動車より安くなる日が来るだろう。<br>個別の作業には必要以上の自由度を与えているが、大量生産によるコスト削減や部品交換の利点のほうがはるかに大きくなるはずだ。まだ manipulation の問題は残っているが、これだけ合理的な価格と標準化されたハードウェアなら、より多くの人が挑戦できるだろう。以前のHNでの議論
Unitree G1は22,000ドルに見えても、実際に大量購入しようとすると、ハードウェア、ツール、開発キットをすべて含めて1台あたり8万〜10万ドルかかると聞いた。それに、Brooksが最近投稿した内容ではある
どんな価格帯でも manipulation の問題はまだ誰も解決できていない。大量生産しても解決する話ではない
この価格帯を見ると、アメリカのロボット企業(たとえばTesla)がどうやってここまで低い製造コストと競争できるのか疑問だ
この人は本当に印象的だ。たぶんBoston出身だからか、ロボット分野でスタートアップを2回も成功させた人なのに、アイデアが「セクシー」でないせいで投資を受けにくいというのが現実だ。投資家は確実性を求めるが、2回大きく成功した人なら3回目も成功する可能性は高いと思う
VCを経験した立場からすると、表向きの言葉は信じない。あなたの意見が正しいと思う。投資家は投資したがっているが、本人が求める条件(たとえば100万ドルに対して評価額200万ドル、持分50%)が高すぎるのだ。その経歴なら、投資家は誰でもこのディールを取りたがるはずだ。本人も3回目のスタートアップならこれくらいは当然だと思っているのだろうし、投資家にとっては重い
私の知人にも本当に寡黙な創業者がいるが、この20年で似た会社を3回、ほぼ同じコンセプトで立ち上げている(最初の2回は売却)。前例があるなら将来の成功可能性があるということに、資本市場は大きな信頼を置く
VCは派手な名声よりも新しいストーリー(あるいは「ハイプ」)を求める。むしろ名声が不利に働くことさえある。彼らは隠れた原石、自分たちで発掘した人材に対するリターンを好む
iRobotは中国の競合に押され、Rethinkは品質が低くて早期に失敗し、Universalははるかに優れた協働ロボットを作った。新しく起業する意味はないと思う。Bostonだけでも倉庫自動化スタートアップはすでに10社以上ある
「成功」の定義が必要だ。iRobotはカテゴリーリーダーで新しい市場を開いたが、実際には黒字だった時期はほとんどないように見える。現在は中国製品に、半額で性能は2倍という形で押されている。それでも市場を作ったこと自体は認める。2社目については、「部品バラ売りレベル」の売却しか記録が見当たらない。今回のスタートアップも興味深くはあるが、すでに市場には競合が多すぎる。だから私には、この人は本当の意味で成功したことはなく、今はすでにレッドオーシャンで戦っているように見える
ヒューマノイドロボットが大規模に価値を持つために、必ずしもAGIが必要なわけではない。teleoperation(遠隔操作)は思った以上に過小評価されている。短期的には、世界のどこかにいる人が遠隔でこうしたロボットを操作し、配達などさまざまな作業をはるかに安くこなすようになるだろう
そういう方向性が本当に望ましいのか疑問だ
(teleoperationが)本当に効率を上げているのは、賃金を削減する部分だけではないのか?
「シンプルな人工知能――いま私たちが信頼できる形で実装できるもの。セクシーではないが、労働者の仕事をより簡単に、より効率的にする技術だ。」完璧な要約だと思う
MITで大規模な講義を担当した経験がある。今朝Uberに乗ったとき、自分がどの道路にいるのか運転手に聞いたら、まったく分かっていなかった。ただGPSに従っているだけだ。問題が起きても自分で解決しようとしない。私も袋小路(cul de sac)に住んでいるので、Uberは道を見つけにくい。音声で道案内しても、運転手たちは道路標識そのものを読まない。ただ点(目的地)だけを見て来て、不満を言う。実際の目的地は、進入可能な道路ベースでは反対側なのだ。ある運転手は同じ間違った方向を2回も回ったあげく、結局キャンセルした。タクシーも大したことはなかったが、それでも運転手には最低限の土地勘はあった
単純なロボットアームだけでも、建設や農業のように世界の大半の国で十分に産業化されていない分野では大きな助けになりうる。たとえばヨーロッパでは人口減少と高齢化で農業が放棄されつつある。レンガ積みそのものにヒューマノイドは必要ないが、安価な装置があれば住宅難の解決にも役立つだろう。<br>そして強力なIT・センサー・多少の動作までは可能でも、自然環境でのさまざまな要求条件があまりに多いため、「単一の汎用プラットフォーム」は不可能だ。人間ですら効率が悪いのに、なぜわざわざヒューマノイドが必要なのかと思う。大企業あるいはオペレーティングシステムに支えられた「モジュール型ロボットプラットフォーム」が必要だ
カート自体に備わった affordance によって、作業者は考えることが減る。現場を見ると、最新といってもいまだに人の手首に80〜90年代の文字ベースソフトが動く小さな画面と、スキャナガンを持たせているだけだ。実際にどの番号で、どの作業をするかを画面から読み取らなければならない。結局、文字を読解できる労働者は解雇され、ロボットに合わせた従順なユニットだけが必要になるのだろう
「約束だけなら投資は受けやすいが、実際の事業には成長の限界があるので難しい。知らなければ夢を膨らませ続けられるが、限界がはっきりするほど投資も実質的に難しくなる」 関連YouTube動画