DeepMind、AlphaGoとAlphaZeroの中核をオープンソースで公開
(twitter.com/DrJimFan)Mctx(MCTS-in-JAX)という名前のRepo内にある- Monte Carlo Tree Search(MCTS)アルゴリズムをJAXネイティブで実装した非常に高速なライブラリ
- ターン制ゲームで「選択→拡張→シミュレーション→方策木ノード更新」の方式で最善手を選ぶ探索アルゴリズム
- AlphaGoの最も複雑なコンポーネントであり、これを効率的にすることが非常に重要
- AlphaGoだけでなく、AlphaZero(Go、Chess、Shogi)やMuZero(AlphaZero + Atariゲーム)などにも使われている
1件のコメント
このツイート自体はHNで見たものですが、https://news.ycombinator.com/item?id=34801636
実際、このRepoは公開されてから約1年は経っていて、これがAlphaGo全体ではないのにタイトルで釣っているのではないかと批判するコメントもあるようです。
もともとAlphaGoの実装はtensorflow/TPUで、これはそれをJAXで再実装したものにすぎないとも言われています。