8 ポイント 投稿者 GN⁺ 2025-04-20 | 1件のコメント | WhatsAppで共有
  • 一部のAI企業が、データ収集のために「ボットネット化したP2PプロキシSDK」をアプリに組み込み、ユーザーが気づかないうちに自社のWebクローリング基盤へ取り込んでいる
  • このSDKは、ユーザーの**ネットワーク帯域の一部(120〜150kbps)を無断で「販売」**し、開発者に収益(1人あたり18セント)を提供しつつ、クローリングやメールサーバーへのブルートフォースなどの異常な行為を実行する
  • このボットネットは、数万件の住宅用/モバイルIPを使って検知を回避し、IPごとに1日1回だけ攻撃を試みることで、fail2banなどのセキュリティシステムをすり抜ける
  • 代表例としてInfatica SDKなどがあり、これを含むアプリの開発者は事実上ユーザーをボットネットに感染させていることになる
  • 「住宅用プロキシ(residential proxy)」市場がAIクローリング需要で急成長しており、これは実質的に無認可のクローリング基盤である
  • このようなボットネット構造は新種のステルス型サイバー攻撃であり、アプリ開発者がこの生態系に加担している
  • 筆者はWebクローリングそのものを「Webの基盤を攻撃する行為」と位置づけ、開発者とプラットフォーム企業の責任を求め、あらゆるクローリングを遮断すべきだと主張している

ステルス・ボットネット、その正体: ボットネット Part 1

個人メールサーバーを狙うボットネットの攻撃

  • 筆者のメールサーバーが継続的にSMTPブルートフォース攻撃を受けている
  • 攻撃の目的: アカウントを奪取してスパムメール送信を試みること
  • ほとんどは失敗しているが、試行そのものが継続的で執拗である

ボットネットの正体: SDKによる端末感染

  • アプリ開発者にSDK組み込みの見返りとして金銭を支払う
    • 例: ユーザー1人あたり月18セント
  • このSDKは、ユーザーのトラフィックの一部(120〜150kbps)を貸し出す
  • 「P2Pプロキシ」または「residential proxy」として装っているが、実際にはユーザーの端末をボットネットのノードとして利用している

攻撃の手法: 検知回避型の分散攻撃

  • 1日にIPごとに1回だけログイン試行 → fail2ban、UFWなどの自動検知を回避
  • しかし数万件のIPを保有しており、攻撃を継続的かつ分散的に実行する
  • 筆者はこの方式が標準的なセキュリティツールを無力化すると指摘している

ASNベース遮断の非効率性

  • IPが特定の通信事業者(ASN)に集中しているのかを分析
    • 結果: ASNあたり平均4件未満の攻撃IP → ASN全体を遮断しても効果はない
  • 現在は毎日のログ分析 → 新しいIPの遮断コマンドをメール送信 → 手動遮断という方式を維持している

対応方法と哲学

  • 自動化も可能だが、自分で確認して対応することでパターンを把握し、監視意識を保っている
  • 攻撃元IP数: 現在約5万件以上を遮断中
  • ほとんどはIPv4であり、IPv6による攻撃はまだまれな状況

ボットネット生態系の現実

  • SDKを含める → 収益分配」という合法に見える流通構造
  • 実際にはユーザートラフィックを同意なく利用し、スパム、攻撃、クローリングなどに使っている
  • この種のボットネットは一般的なアンチウイルスやセキュリティシステムでは検知されない

結論

  • アプリ開発者がこのようなSDKを組み込めば、事実上ボットネット構築に加担することになる
  • 一般ユーザーはこのようなSDKの有無を知ることができず、自動的にボットネットへ参加させられる
  • 筆者はこうした問題意識からWeb生態系の崩壊を警告している

「これを『正常なSDK』だと主張する企業を、私はまったく信用しない。これはボットネットだ。」
— Jan Wildeboer, 2025年2月


# Webは壊れてしまった: ボットネット Part 2

Webクローラー急増の背景

  • 最近、AIモデル学習のための大規模データ収集需要が増加
  • AI企業がひそかにWeb上のあらゆるコンテンツをかき集め、トラフィック過負荷を引き起こしている
  • 一般のWebマスターやサーバー運用者はクローラーに悩まされているが、誰がそのクローラーを運用しているのかわからないことが多い

ボットネットの新しい形: SDKによるユーザー感染

  • 一部企業はアプリ開発者に**「SDK組み込みの対価」として金銭を提供**
  • そのSDKを含むアプリをインストールした一般ユーザーは、気づかないうちに自分たちのトラフィックをAIクローラー向けに使われてしまう
  • こうしたSDKはiOS、Android、MacOS、Windowsアプリに組み込める

代表例: Infatica

  • Webサイト: https://infatica.io
  • 開発者向け説明ページでは「ユーザーのネットワークを通じてクローリング可能」と宣伝している
  • 数百万件のローテーション型(住宅用/モバイル)IPを提供すると主張

なぜこれが問題なのか?

  • Infaticaのような企業は、自社の顧客(クローリング目的のAI企業など)がどのようなコマンドを実行しているか監視していると主張するが、実質的には責任回避の構造になっている
  • Trend Microの2023年レポートでも類似事例が確認されている
  • 一部では無料ソフトウェアにSDKをひそかに埋め込んで配布し、ユーザー同意なしにインストールさせている

被害: 個人ユーザーと小規模サーバーの双方

  • アプリ開発者: 金銭的誘惑でSDKを含める → 事実上マルウェア配布者になる
  • ユーザー: 自分の端末とネットワークがWebクローリングやDDoSに使われる
  • サーバー運用者: 知らないうちに過剰なリクエストを受ける対象になる
    • 例: 筆者のForgejoインスタンスもボットトラフィック過多により非公開へ移行

「住宅用プロキシ」という包装

  • ユーザー端末を拠点として活用するプロキシを**「residential IP」**と呼ぶ
  • プロキシサービスのレビューサイト例:
    https://proxyway.com/reviews
  • 表向きは「合法的なインフラ」のように見えるが、実態は無断拡散・プロキシ化の構造である

結論: Webクローリングはもはや乱用レベル

  • 筆者はあらゆる形態のWebクローリングを悪意ある行為とみなすべきだと主張
  • WebクローラーがWebの土台を攻撃していると見ている
  • AIがこの構造の中核的な原動力であり、これが「合法的」だという主張に強く反発している

提言と問題意識

  • SDKを含めたアプリ開発者は責任を負うべき
  • Apple、Google、Microsoftなどプラットフォーム運営各社がこの市場を規制すべき
  • 一般ユーザーがこれを識別したり遮断したりするのはほぼ不可能
  • Web運用者はクローラーを技術的に防ごうとしているが限界がある

「AIのおかげで、Webはもはや信頼できる空間ではなくなりつつある。ありがとう、AI。」
– Jan Wildeboer, 2025年4月

1件のコメント

 
GN⁺ 2025-04-20
Hacker Newsの意見
  • アプリ開発者が収益のために3rd party SDKを組み込むことも問題の一部であり、ユーザーにマルウェアを提供した責任を負うべきだと思う

    • 多くのSDKがこのような問題を抱えているのではないかと疑っている
    • 個人的には依存関係への中毒を避け、自分で開発することを好む
    • 悪意ある行為者は現代の開発者の依存関係中毒を利用して罠を仕掛けている
  • iOS、Android、MacOS、Windowsでは、アプリ開発者にライブラリを組み込ませてユーザーのネットワーク帯域幅を販売する市場が存在する

    • CloudflareやGoogleがCAPTCHAを要求する理由とも関係している
    • Play Protect、MS Defender、Appleのアンチウイルスがこうしたマルウェアを検知しないのが理解できない
    • SDKライブラリがユーザーのデバイスをボットネットの一部にするのは、トロイの木馬の明白な例だ
  • Webの問題は、データを読み取り可能な状態で維持するために、特定のシステム管理者がサーバーを維持しなければならないことだ

    • コンテンツアドレスモデルを使えば、一意性制約をなくせる
    • AIスクレイパー同士でデータを共有し、元のソースに負荷をかけずに済む
  • ネットワーク共有ソフトウェアは望ましくないアプリケーションに分類されるべきだ

    • ユーザーがインストールしたかったものと一緒に導入され、リソースを乱用する
    • Wiresharkを使って怪しい活動を確認したい
    • このような挙動をするアプリの公開リポジトリが必要だ
  • マルウェアを含むアプリは直ちに隔離すべきだ

    • 直接的な被害を与えなくてもマルウェアだ
  • Webスクレイピングは悪用と見なされるべきであり、Webサーバーはこれをブロックすべきだ

    • YouTubeのようなプラットフォームはこれに同意する可能性が高い
  • こうしたライブラリを使うソフトウェアの一覧をまとめた人がいるのか気になる

    • 避けるべきアプリが分かるとありがたい
  • 住宅用IPプロキシには、IPアドレスが頻繁に変わるという弱点がある

    • 同じプロキシプロバイダーから来るIPは簡単に検知できる
    • オープンソースの不正防止プラットフォームを開発中で、住宅用プロキシから来る偽ユーザーの検知がユースケースの1つだ
  • 現時点では明確な証拠はないが、このような挙動は簡単に検知できる

    • iOSにはアプリの接続を確認できる機能がある
    • Androidにはそのような機能はないが、pcapdroidのようなサードパーティ製ファイアウォールを使える
    • MacOSでは Little Snitch、Windowsでは Fort Firewall を使える
    • こうしたアプリを使う人は多くないが、デバイスをボットネットとして使うアプリを報告する可能性は高い
  • Piholeなどに追加できるc&cサーバーの一覧があるのか気になる