Skyfall、LinkedInのeBPFエージェント
(engineering.linkedin.com)- LinkedInのインフラは、複数のデータセンターにまたがる数十万台のサーバーで構成されている
- インフラが大規模化するにつれて、Observability はインフラ障害や異常の潜在的な原因を正確に突き止めるうえで、より重要になっている
- eBPFを使うことで、オーバーヘッドを最小限に抑えながら、必要な情報を直接抽出できる
- LinkedInはeBPFエージェントをSkyfallと名付け、ほぼすべてのサーバーで実行している
Skyfall
kprobesとkretprobesでTCP/UDPプロトコル関連の情報を収集tcp_set_state,tcp_v4_connect,tcp_v6_connect,inet_csk_acceptip4_datagram_connect,ip6_datagram_connect
- 収集したデータをInFlow(独自のフロー収集/可視化プラットフォーム)へUDPで送信
- InFlowからKafkaへ送り、HDFSに保存し、Samzaを通じてGraph Data Storeに保存
1件のコメント
eBPFについては、以前 GeekNews ポッドキャストで私が説明したことがあります。
→ https://www.youtube.com/watch?v=aCw0YwEHpCU&t=1892s