10 ポイント 投稿者 xguru 2022-10-14 | 1件のコメント | WhatsAppで共有
  • LinkedInのインフラは、複数のデータセンターにまたがる数十万台のサーバーで構成されている
  • インフラが大規模化するにつれて、Observability はインフラ障害や異常の潜在的な原因を正確に突き止めるうえで、より重要になっている
  • eBPFを使うことで、オーバーヘッドを最小限に抑えながら、必要な情報を直接抽出できる
  • LinkedInはeBPFエージェントをSkyfallと名付け、ほぼすべてのサーバーで実行している

Skyfall

  • kprobeskretprobes でTCP/UDPプロトコル関連の情報を収集
    • tcp_set_state, tcp_v4_connect, tcp_v6_connect, inet_csk_accept
    • ip4_datagram_connect, ip6_datagram_connect
  • 収集したデータをInFlow(独自のフロー収集/可視化プラットフォーム)へUDPで送信
  • InFlowからKafkaへ送り、HDFSに保存し、Samzaを通じてGraph Data Storeに保存