チェスのグランドマスター級をアルゴリズムなしで
- このリポジトリは「チェスのグランドマスター級をアルゴリズムなしで」という論文の実装を提供する
- 近年の機械学習の成功は、主に大規模な注意機構ベースのアーキテクチャと前例のない規模のデータセットによるもの
- この論文は、チェスにおける大規模学習の影響を調査する
- 従来のチェスエンジンとは異なり、複雑なヒューリスティクスや明示的な探索に依存しない
- 2億7000万個のパラメータを持つTransformerモデルを、1000万件のチェス対局データセットで教師あり学習する
- Stockfish 16エンジンのアクション値を使って各盤面に注釈を付け、約150億件のデータポイントを生成する
- 最大のモデルは人間相手のLichess blitzでElo 2895を記録し、明示的な探索アルゴリズムなしでも難しいチェスパズルを解く
- AlphaZeroの方策ネットワークおよび価値ネットワーク(探索なし)とGPT-3.5-turbo-instructを上回る
- モデルとデータセット規模の体系的な調査により、十分な規模でのみ強力なチェス性能が現れることを示す
- 結果を検証するため、設計選択とハイパーパラメータに関する広範な実験を実施する
GN⁺の要約
- このプロジェクトは、チェスにおいて従来の探索アルゴリズムなしでも高い性能を達成できることを示す重要な研究
- 大規模データセットとTransformerモデルを活用し、チェスエンジンの新たな可能性を探る
- AlphaZeroのような既存の強力なチェスエンジンと比較して、より優れた性能を示す
- チェスに関心のある人にとって興味深く有用な情報を提供し、機械学習の新たな応用可能性を示す
- 類似した機能を持つプロジェクトとして、AlphaZeroとLeela Chess Zeroがある
1件のコメント
Hacker Newsの意見
ユーザーが望むレベルのチェスの対戦相手を見つけるのは難しい。ほとんどのエンジンは探索の深さを減らして難易度を下げるが、これは効果的ではない
あるユーザーはチェスに関連する知識蒸留について発表を行い、複雑な非線形の探索機能を、チェスのような標準入力に対して準線形のTransformerモデルへ蒸留する方法を説明した
チェスのニューラルネットワークに関心がある人向けに、PyTorchを使ったわかりやすいコードと、現在最高性能のチェス用ニューラルネットワークに類似したアーキテクチャを提供するGitHubリポジトリが勧められている
LC0ネットワークとDeepMindのTransformerネットワークを比較したブログ記事がある
「Grandmaster-Level Chess Without Search」論文は、大規模な注意ベースのアーキテクチャとデータセットの重要性を強調しており、270MパラメータのTransformerモデルを使ってチェスを学習している
大規模な合成データセットは従来の探索を用いて生成されており、これはTransformerモデルに探索木をエンコードするのと同じだとされる
Matthew SadlerはLeela Zeroを直感的に指すよう設定しており、これは探索なしでも効果的に訓練対局を行う
チェスを解くと巨大な木が生成され、それを最適化するためのアプローチが2つある
FEN文字列を固定長文字列に変換して盤面状態をエンコードし、UCI表記法を使って行動を保存する