ARC-AGIとは何か?
- ARC-AGIは2019年に導入された人工知能ベンチマークで、最小限の例から抽象的な規則を推論し一般化するシステムの能力をテストするために設計された。
- データセットはIQテストに似たパズルで構成され、各パズルは基本規則を示す複数の例示画像と、その規則を適用すべきテスト画像を提供する。
- ARC-AGIを解くことは、人工知能の発展を妨げている現在の課題を浮き彫りにすることを目的としている。
私たちの解決アプローチ
- 可逆な情報圧縮がARC-AGIパズルを解くための効果的なフレームワークになり得ると提案する。
- パズルをより効率的に圧縮できることは、より正確な解との相関がある。
- CompressARCはニューラルネットワークをデコーダとして使用し、エンコーディングアルゴリズムは別のネットワークではなく、デコーダのパラメータと入力分布を最適化することで最も圧縮されたパズル表現を得る。
ネットワーク学習の観察: 箱の色塗り
- 人間の解法: 入力が箱に分かれており、出力でも箱が維持されたまま色が塗られることを認識する。
- CompressARCの解法: 学習段階ごとに、ネットワークがパズルの規則を徐々に理解して適用していく。
私たちの解決アプローチの導出方法
- 可逆な情報圧縮とは、できるだけ少ないビットで情報を表現しつつ、その情報をビット表現から再構成できるようにすることである。
- ARC-AGIデータセットを最もうまく圧縮するシステムが、どの答えを復号するのかを突き止めたい。
ニューラルネットワークの助け
- プログラム空間を探索する代わりに、プログラムを選んで入力空間の多様性に委ねる。
- ニューラルネットワークの順伝播を実行するプログラムを書き、入力空間を通じて探索する。
アーキテクチャ
- ARC-AGIパズルをデコードするためのニューラルネットワークアーキテクチャを設計する。
- 最も重要な特徴は、対称規則に従う等価性である。
結果
- CompressARCは訓練セットで34.75%、評価セットで20%の成績を記録した。
解けるパズルと解けないパズル
- CompressARCは特定の能力を使って、可能な限り多くのことを見つけ出そうとする。
- 例えば、パターンを短い距離には拡張できるが、長い距離には拡張できない。
箱の色塗り: ケーススタディ
- 訓練中、再構成誤差は非常に速く減少し、平均的にも低く保たれる。
- CompressARCがどのようにパズルを解くのかを理解するために、zに保存された表現を分析する。
私たちの作業を改善する方法
- CompressARCのリリース時点で試した、あるいは試さなかったさまざまなアイデアがあった。
- パズル間での重み共有による共同圧縮など、いくつかのアイデアは今でも有効だと考えている。
まだコメントはありません。