Leela Chess Zeroの限界
- Leela Chess Zeroは自己対局を通じて数十億回の学習を重ね、世界チャンピオンになった
- しかしStockfishには完敗した
- より大きなネットワークを学習させてもStockfishには勝てなかった
- StockfishはLeelaよりはるかに小さいモデルを使っていたが、より優れた探索能力で勝利した
Stockfishの勝利についてのさらなる考察
- Leelaは探索が得意ではなく、世界チャンピオンの座を明け渡した
- LLMに探索能力を追加することは目前に迫っているが、あまり注目されていない
- GPT-4のようなFoundationモデルには探索能力がない
- 探索を可能にするにはより大きなモデルが必要だという前提が支配的だが、反例が存在する
- DeepMindの研究によれば、チェスアルゴリズムでは探索行動が自然に出現する
- 効率的な探索アルゴリズムがあるのに、非効率な先行探索が大規模モデルの中で偶然出現するのを待つ必要はない
- 今日のモデルは探索を可能にするのに十分大きく、むしろ不必要なほど大きい可能性すらある
探索は対象領域への計算資源の割り当てを可能にする
- 製薬会社がAIを使って新薬を研究しようとしていると仮定する
- AI探索が可能な世界では、次の2つの選択肢がある
- 2030年まで待ち、OpenAIが4桁大きいモデルをリリースするのを待つ
- 今日すぐに4桁多い推論計算資源を使う
- 製薬会社は2番目の選択肢を好むだろう
- 探索によって、2030年のASIレベルの能力を今すぐ活用できる
探索ベースのAI発展シナリオ
- 既存モデルで探索が機能することが発見される
- 政府や大規模研究所が、AI研究や海外情報収集に探索を直ちに適用できると認識する
- 推論計算資源が限られているため、政府や大規模研究所での利用は安全保障やAI研究に限定される
- 探索主導のAI発展によって、より効率的な探索アルゴリズムとモデルアーキテクチャが発見される
- 探索はより多くの学習データを必要としないため、「データの壁」の問題を解消する
- 知能爆発は2030年ではなく、来年から始まる
AI自身の研究への探索適用可能性
- AIが自分自身を研究できるほど十分に発展すれば、急激な発展ダイナミクスが予想される
- 製薬会社がGPT-8を待たずに新薬を研究できるように、AI研究所もより大きなモデルを待たずにAIを研究できるようになる
- 人間のAI研究者を置き換えるには、さらに多くの制約解除が必要かもしれない
- しかし、GPT-8レベルの知能を持つ単純なチャットボットでも、AI発展の加速には十分だと予想される
1件のコメント
Hacker Newsの意見
Hacker Newsコメント要約