DeepMindのAI、国際数学オリンピックの問題を銀メダル級で解く
(deepmind.google)- Google DeepMindのAlphaProofとAlphaGeometry 2が国際数学オリンピックの問題を解決
- AlphaProof: 強化学習ベースの数学的推論システム
- AlphaGeometry 2: 改良された幾何学問題解決システム
- 2つのシステムは今年の国際数学オリンピック(IMO)で6問中4問を解き、銀メダル級の成績を達成
複雑な数学問題の解決におけるAIの成果
-
IMOの紹介
- 1959年から毎年開催されている、最も古く権威ある青少年数学大会
- 大会の問題は代数学、組合せ論、幾何学、数論などから出題
- Fields Medal受賞者の多くがIMO出身
-
AIシステムのIMOへの挑戦
- AlphaProofとAlphaGeometry 2が今年のIMOの問題を解決
- 問題は公式大会ルールに従って採点
- AlphaProofは代数学の問題2問と数論の問題1問を解決
- AlphaGeometry 2は幾何学の問題1問を解決
- 2つの組合せ論の問題は解けなかった
- 合計42点中28点を獲得し、銀メダル級の成績を達成
AlphaProof: 形式的推論アプローチ
-
AlphaProofの動作原理
- 数学的命題を形式言語Leanで証明
- 事前学習済み言語モデルとAlphaZero強化学習アルゴリズムを組み合わせ
- 自然言語の問題を形式的命題に翻訳し、さまざまな難易度の問題を解決
- 問題を与えると、AlphaProofは解法候補を生成して証明または反証
- 証明された結果はAlphaProofの言語モデルを強化し、より難しい問題を解く能力を向上
-
訓練プロセス
- 数百万の問題を証明または反証しながら訓練
- 大会期間中も訓練ループを適用し、問題の変形を証明
さらに競争力を高めたAlphaGeometry 2
-
AlphaGeometry 2の改善点
- Geminiベースの言語モデルとニューラルシンボリックのハイブリッドシステム
- 以前のバージョンより10倍多い合成データで訓練
- 幾何学問題の解決速度と精度が向上
- 新しい問題を解く際に知識共有メカニズムを使用
-
IMO 2024での成果
- 過去25年間のIMO幾何学問題の83%を解決
- 今年の大会では問題4を19秒で解決
数学的推論の新たなフロンティア
-
自然言語推論システムの実験
- Geminiベースの自然言語推論システムを実験
- 形式言語に翻訳せずに問題解決が可能
- 他のAIシステムとの組み合わせの可能性を探求
-
今後の展望
- 数学者がAIツールと協力して新たな仮説を探究し、問題解決アプローチを試し、証明プロセスを短縮できる可能性
- GeminiのようなAIシステムが数学および一般的な推論能力を向上
GN⁺のまとめ
- AlphaProofとAlphaGeometry 2は、数学的推論におけるAIの可能性を示している
- 国際数学オリンピックで銀メダル級の成績を達成し、AIの数学問題解決能力を実証
- 数学者がAIと協力して新しい問題解決アプローチを探求できる可能性を開いた
- 類似機能を持つプロジェクトとして、OpenAIのGPT-3のような自然言語処理モデルがある
3件のコメント
形式数学ライブラリの開発に貢献する数学者が増えるほど、高性能な数学AIを作りやすくなるでしょう。自分で Lean 証明支援系の言語で形式化した数学理論を、Lean の数学ライブラリ Mathlib に移している韓国人は、私の知る限り現在3人います。
私は昨年、Mathlib を Lean 3 から Lean 4 へ移行する作業に少し参加し、今年は Lean 4 batteries ライブラリの未解決定理の一つを証明しました。
Hacker News の意見
1つ目の意見
2つ目の意見
3つ目の意見
4つ目の意見
5つ目の意見
6つ目の意見
7つ目の意見
8つ目の意見
9つ目の意見
10個目の意見
その最良の議論はここで見ることができます。https://leanprover.zulipchat.com/#narrow/stream/219941-Machine-Learnin…