DwarFS - 高い圧縮率の読み取り専用ファイルシステム
(github.com)-
重複データに対して高い圧縮率を達成することを目標
-
SquashFS(Linuxディストリビューションで広く使われている読み取り専用ファイルシステム)より圧縮性能に優れ、ファイルシステムの構築速度は4倍高速
-
ファイルアクセス速度が速く、CPU使用量も少ない
-
類似性ハッシュ関数を使用したファイルクラスタリング
-
展開後のファイルシステムサイズを縮小するためのブロック単位セグメント分析。圧縮されたファイルシステムの利用時にはメモリが節約され、キャッシュにより多くのデータを保存できるようになり、潜在的により高いキャッシュヒット率を示す
-
ファイルシステム生成ツールとFUSEドライバの両方に高度なマルチスレッド実装
-
カスタムフィルタリングおよびソート機能のためのLuaサポート
1件のコメント
開発者によると、何千ものPerlインストール環境のせいで容量をかなり食っていたため始めたとのことですが…(なぜそれが必要なのかは私もよく…)
重複ファイルの多いDockerイメージ / npmリポジトリ用途に使うのにちょうどよさそうなファイルシステムですね