- GZIPを使って、10行未満のコードでMNISTデータセットにおいて78%の精度を達成した記事
- 著者は、最先端の結果を達成することではなく、圧縮をユニークでモデル不要の分類ツールとして使う可能性を示すことがこの投稿の新規性だと強調
- 提示されたコードは、GZIPとNCD(Normalized Compression Distance)を類似度指標として用い、分類にはk-NN(k-Nearest Neighbors)を使用
- GZIPは個々のデータポイントの複雑さ、あるいは情報量を測るツールとして使われ、NCDは2つのデータポイントがどれほど似ているかを正規化した尺度を提供
- アルゴリズムは、すべての訓練サンプルとのNCDを計算し、それをソートして、最小の距離を持つk個を選択する。このk=5の最近傍のうち多数派のクラスが、テストサンプルのラベルとして予測される
- 著者は、このアプローチは計算コストが高く、精度測定のためにテスト画像の一部しか使われていないことを認めている
- 著者は、より理解しやすいように、アルゴリズムのより難読化されていないバージョンも提供
- 著者は、2019年にAndreas Kirschが取った類似のアプローチに言及しており、こちらは約35%の精度を達成していた
- 著者は、データ圧縮によるテキスト生成に関する投稿を読み、さらにパラメータ不要のテキスト分類に関する論文を読んだことをきっかけに、圧縮を画像分類の仕組みとして使うようになった
- 著者は以前、エッジコンピュータビジョン向けの画像圧縮に取り組んでおり、この技術をMNISTデータセットへ適用することに関心を持っていた
1件のコメント
Hacker Newsの意見