ファイルシステムのアップグレードでSSDコストを数百万ドル削減した話
(heap.io)<p>- Heapは分析用のマルチペタバイト級Postgresを運用中<br />
- 急速な成長に伴いノード使用率が80%を超え、収集パイプラインで性能問題が発生 <br />
- 問題の原因は、SSDは使用率が100%に近づくと性能が低下する傾向があること<br />
- CoW(Copy-on-Write)であるZFSを使っているため、問題が悪化 <br />
→ ブロックが更新されるたびに新しいコピーを作成 <br />
- もちろん、CoWにはさまざまな利点がある<br />
→ ファイルシステムレベルの圧縮が他のファイルシステムより容易で、4〜5倍圧縮して容量を節約 <br />
→ より高い耐久性があるため、Postgresの`full_page_writes`を無効化でき、その結果として性能も向上し全体のI/Oも減少 <br />
→ 一貫性を保証するポイントインタイムスナップショット - ページは実際には変更不可能なため、スナップショット中でも古いページを維持<br />
- しかしZFSのようなCoWファイルシステムは、容量が埋まるにつれて性能が低下する<br />
→ ページを更新するたびにブロックアロケータが空きブロックを探す必要があるため、使用率が高くなると性能低下が深刻になる <br />
→ 以前にアンリンクされたブロックを削除し、既存のブロック群と混在させなければならない <br />
→ より高い圧縮率を得るためにブロックサイズを64kbと大きく設定していたため、さらに悪化していた <br />
→ こうした理由から、ZFSの使用率は80%を超えないようにするのが望ましい <br />
<br />
- ZFS 2.xへアップグレードし、`lz4`圧縮からZstandard圧縮へ変更することを試行 <br />
→ `lz4`は非常に高速で、約4.4倍の圧縮率を示す <br />
→ Zstandardは約5.5倍の圧縮率を示し、20%改善 <br />
→ ただし多くのベンチマークでは、Zstandardは`lz4`より速度が遅いとされている<br />
→ そこで実環境で厳密なテストを行うことにした <br />
→ テスト結果ではクエリ性能は変わらず、ストレージ使用量は約20%減少し、書き込みクエリ時間は半減 <br />
<br />
- HeapのDBクラスターは5つのノードに分かれており、それぞれ別のASGに属している <br />
→ ノードの入れ替えは、ASGから切り離すだけでよく、ASGが新しいノードを作成し、最終バックアップからリストアしてウォームスタンバイモードに入る <br />
→ 新しい設定のAMIを作成し、各ノードを1台ずつ進めた <br />
→ 全体の使用量は約21%減少し、書き込み時間は50%減少、クエリ性能には大きな違いはなかった </p>
1件のコメント