21 ポイント 投稿者 GN⁺ 2025-02-24 | 2件のコメント | WhatsAppで共有
  • ここ数年、AGI(Artificial General Intelligence、汎用人工知能) をめぐる議論が急増している
  • AGIの正確な定義は曖昧で論争も多く、AGIタイムラインを設定することが一般的な議論の仕方になっている
    • 「長期タイムライン」: AGIは10〜20年後に到来するという見方
    • 「短期タイムライン」: AGIはまもなく登場するという主張
  • しかし、このような形でAIの発展を論じるのは非効率的である
    • AGIという終着点に向かうのではなく、AIの生産性が高まる過程として捉えるほうが適切である
    • AIはますます少ない人間の介入で多くの作業をこなせるように進歩している
      • 例: データラベリング、コード作成、数学の問題解決、自動運転、自動飛行など
    • しかし、AIが永続的に人間の介入なしで動作する地点に到達するかどうかは不確実である
    • 私たちはAIが与えられた入力に対してどれだけの価値を生み出せるかを測定すべきである
  • AIの発展は、人間が投入した労力に対してAIが生み出す経済的価値の増加として見ることができる
  • 重要な問い:
    • AIは無限に進歩して、人間の介入なしで経済的価値を創出できるのか?
    • それとも、ある水準で技術的限界に達するのか?
  • もしAIが完全に人間の介入なしで経済的価値を創出できるなら、それはかなり危険な結果かもしれない

私たちはすでにこの現象を見たことがある(自動運転車)

  • AI業界では言語モデルブーム以前、2017年ごろに自動運転車ブームがあった
    • 当時、多くの企業が**完全自動運転(Full Self-Driving, FSD)**の車を1年以内に投入すると宣言し、数十億ドルの投資を呼び込んだ
    • 何百万マイルも走行され、多くの企業が設立されたが、その一部は最終的に倒産した
  • いまなお完全なFSDは実現していない
    • テスラはいまだ完全自動運転を実現できておらず、Waymoは特定の事前マッピングされた地域でのみ部分的に動作可能である
    • 依然として断続的な人間の介入が必要である
      > 2016年、テスラCEOイーロン・マスク(Elon Musk)の予測:
      > 「今年中にテスラがロサンゼルスからニューヨークまで完全自動運転するだろう。」
      > → しかし2024年現在でも実現していない(テスラは依然として「Full Self-Driving」サブスクリプションオプションを販売中)
  • いまでは自動運転が完全に可能かどうかを論じるのではなく、**「介入1回あたりの走行距離(miles-per-intervention)」**を測定するほうが、より現実的なアプローチになっている
    • つまり、1回の人間の介入なしに車がどれだけ遠くまで走行できるかを測る方式である
  • 最新の報告によれば、テスラは平均13マイルごとに1回の人間の介入が必要である
    • より大きなAIモデル、より高速な推論、より多くのデータ、改善されたエンジニアリングが導入されれば、この数値は伸びる可能性が高い
    • しかし、現在の技術でこの数値が無限大まで伸びるかどうかは不確実である
  • つまり、自動運転モデルが無限に進歩して人間の介入が完全に不要になるのか、それともある水準で限界に達するのかは、まだ分かっていない

Yann Lecunが間違っていた理由(部分的に)

  • MetaのチーフAIサイエンティストであるYann Lecunは以前、言語モデルは人間レベルの知能に到達できないと主張していた
  • その理由は、言語モデルがトークン単位で出力を生成するため、各トークンごとに誤りが発生する確率があり、その誤りが蓄積すれば最終的に性能が低下する、という論理だった
  • 彼はこの誤りの蓄積問題を言語モデルの致命的な限界と見なし、これを解決するには現在の自己回帰(autoregressive)方式を捨てなければならないと主張していた
  • しかし現実は違っていた
    • 最新のAIシステム(OpenAI o1/o3、DeepSeek R1など)は、この仮説を真っ向から否定している
    • それらは依然として自己回帰方式だが、むしろ長い出力を生成するほど性能が向上する
    • DeepSeek R1の研究では、モデルが長く考えるほど正答率が上がるパターンが見られる
      > DeepSeek R1レポートのグラフを見ると、モデルがより長い出力を生成するほど性能が向上している → Yann Lecunの仮説と真っ向から衝突する
  • モデルが自ら誤りを修正する方法
    • 従来の論理は、誤りがトークン単位で蓄積するしかないという前提に基づいていた
    • しかし最新の研究では、モデルが自律的に誤りを修正できるメカニズムを備えている
    • たとえば、特定のパターンのトークンを生成すると、途中で確率的により良い答えを見つけていく傾向が観察される
      > DeepSeek R1の例: モデルがある時点で「より良い答え」を見つけていく過程 → Yann Lecunが不可能だと主張していたこと
  • 現在、一部の研究者はこうした**自己修正(self-correction)**メカニズムを分析し、どうすればより効果的に誘導できるかを研究している
  • ただし、この方式がコーディングや数学の問題のような特定タイプの課題にしか適用できないのかは、まだ不確実である

Yann Lecunが正しかった理由(部分的に)

  • Yann Lecunの仮説が完全に間違っていたわけではない
  • 最新研究は彼の「誤りの蓄積」仮説に反論しているが、言語モデルが無限に正確な出力を生成できないという点は依然として事実である
  • つまり、AIは永遠に独立して動作し続けることはできない
  • 完全自律エージェント(FAA)の限界
    • 多くの研究者が**長期間の作業を遂行できるAIエージェント(Agents)**を開発しようとしている
    • しかしこれは、完全自動運転(FSD)車を開発するのと似た問題を抱えている
    • つまり、現在の技術スタックでは完全自律型のAIシステムは不可能かもしれない
  • 人間の入力の重要性
    • 最も信頼できる情報は、人間が直接入力したプロンプトから生まれる
    • 一部のツール(例: 航空便検索、天気確認など)を通じてAIが追加データを得ることはできるが、ただ長い出力を生成すれば正答確率が無限に上がるわけではない
    • 人間の介入なしにAIが無限に有用な出力を生成する可能性は低い

AI研究でAGI議論を避けるべき理由

  • 言語モデルの進捗をAGIタイムラインで測るのは誤った方法である
  • より良い問いは「AIは人間の介入なしで、どれだけ長く効果的に作業できるのか?」であるべきだ
  • 自動運転における「介入1回あたりの走行距離」のように、言語モデルでも「人間の介入なしでどれだけ長く正確な出力を生成できるか」を測るほうが、より実用的なアプローチである
  • 完全に人間の介入なしで動作するAI(FAA, Fully Autonomous Agent)を待つよりも、現在の**「有用なAI作業量の増加」という連続的な発展過程**を認識することが重要である
  • 完全なAGIでなくても、現在の技術がもたらす経済的価値は十分に大きい
  • したがって、AGIにいつ到達するかを論じるより、AIの実質的な生産性を改善するほうが望ましい方向である

2件のコメント

 
princox 2025-02-27

「AIは永遠に独立して動作することはできない」

この部分が印象的ですね。

 
GN⁺ 2025-02-24
Hacker Newsの意見
  • サティア・ナデラがAGIについて言及

    • Microsoftの収益より重要なのは、AGIに対する過剰な期待を抑えること
    • 先進国の経済成長率はわずか2%で、インフレを考慮するとほぼ0%
    • 2025年には経済成長における課題があるだろう
    • 産業革命のような成長を実現しなければならない
    • 勝者になるのはテック企業ではなく、AGIを活用する産業だろう
    • 生産性が向上し、経済が急速に成長するとき、産業も発展するだろう
    • AGIの成果を自画自賛することに意味はなく、世界経済が10%成長することが真の基準
  • 人々に仕事を提供する方法を見つけることが重要

    • AGIからASIへのマーケティング上の変化は罠
    • 「ギグ」エコノミーへの批判にもかかわらず、多くの人がUberやDoorDashを通じてより良い生活をしている
    • UberとDoorDashは日常生活に価値をもたらしている
    • 配達員にチップを渡し、彼らが最低賃金より多く稼げるようにしている
    • 誰もが独学でソフトウェアエンジニアや起業家になれるわけではない
    • 人々に仕事を提供することが重要
  • LLMの「推論」への懐疑が強まる

    • DeepSeekとGrokの結果を通じて、LLMの限界が見えてきた
    • モデルが非効率的、または誤った経路にはまり込むことがある
    • たとえば、Grok 3は特定のカード名を繰り返し確認するのに10分を費やした
    • モデルが自己強化された非生産的行動に陥ることがある
  • 自動運転車についての議論

    • Teslaはまだ完全自動運転を実現できておらず、Waymoは特定地域でのみ可能
    • 一部のAIシステムは、より長い出力を生成することで改善する
    • しかし、長い出力がモデルをより良くするわけではない
    • LeCunの主張は、言語モデルにおける誤差蓄積の問題を指摘している
  • AGIとヒューマノイドロボットへの過剰な期待

    • AGIよりも経済的利益に焦点を当てるべき
    • AGIは人間の99.99%を上回ることが目標
  • AGIに対する人々の期待

    • 人々が望んでいるのはAGIそのものではなく別のもの
    • AGIが自律性を持てば、制御できなくなる
    • 人々が求めているのは、技術的には優秀だが指示に従う専門家
  • 言語拡散モデルの成功

    • 誤差蓄積の問題を解決するためにリマスキング戦略を使用している
    • 複数のトークンを同時に予測することに成功している
  • AIの経済的価値に関する問い

    • AIが人間の生産性を高めるとき、その経済的価値は誰に渡るのか
    • 人間の雇用が減るなら、経済的価値の分配に関する計画が必要
  • AIと人間の夢の比較

    • AIが現実モデルに基づいてシナリオを生成・拡張する方式は、夢に似ている可能性がある
    • LLMにリアルタイム入力を追加して「目覚めさせる」ことができるのか気になる