- この記事では、S3 上に直接構築された Kafka プロトコル互換のデータストリーミングプラットフォーム WarpStream を紹介しています。
- WarpStream は単一のステートレスな Go バイナリとして提供され、ローカルディスク管理、ブローカーの再均衡、ZooKeeper 運用の必要をなくします。
- このプラットフォームはデータを直接 S3 にストリーミングすることで、インフラコストを大幅に削減し、クラウド上では Kafka より 5〜10 倍安価です。
- この記事は、Kafka が現代的なワークロードに適しているかを批判的に捉え、高額なインター AZ 帯域コストと運用オーバーヘッドを強調しています。
- WarpStream のアーキテクチャは Kafka とは異なります。ブローカーの代わりに、ステートレスな「エージェント」があり、任意のトピックの「リーダー」として動作したり、任意のコンシューマーグループのオフセットをコミットしたり、クラスターのコーディネーターとして機能したりできます。
- WarpStream ではすべてのストレージが S3 のようなオブジェクトストレージにオフロードされるため、容易なスケールと高速な障害復旧が可能です。
- WarpStream はデータとメタデータを分離し、すべての「仮想クラスター」のメタデータをカスタムのメタデータデータベースに保存します。
- このプラットフォームは、ほとんどの Kafka ワークロードの総コストを 5〜10 倍大きく削減しますが、プロデュース要求に対する P99 は約 400ms、プロデューサーからコンシューマーまでの遅延は約 1 秒と、より高いレイテンシがあります。
- WarpStream は現在デベロッパープレビュー段階にあり、まだ本番利用の準備はできていません。
- WarpStream の開発者たちは、Kafka の開発者 UX に問題があると考えており、特にパーティションという低レベル抽象化を課題として挙げています。彼らは今後の WarpStream のアップデートでこれを解決する計画です。
- この記事は、読者に WarpStream を試し、フィードバックを提供してほしいと呼びかけて締めくくられています.
1件のコメント
Hacker Newsの意見