- App StoreとGoogle Playで見つかった2,000本以上のアプリで、ユーザーの同意なしに位置情報を収集していた形跡が確認された
- この記事の筆者は、こうした位置情報を実際に購入して自分自身を追跡できるかを試してみた
- 結論として、IPアドレスや位置情報があちこちで漏れ、広告プロトコル(例:OpenRTB)を通じて膨大なユーザー情報がやり取りされていることを確認した
- ただし実際にデータを購入するには数万〜数十万ドル規模の費用が必要で、特に欧州ユーザーのデータは高額だった
- それでも、どこででも購入可能であることを改めて確認した
出発点
- 実験用のiPhone 11を工場出荷状態に戻し、新しいApple IDで設定した
- ネットワークトラフィックを分析するため、Charles ProxyとSSL証明書を導入し、HTTPSリクエストを復号した
- 例として「Stack」というシンプルなゲームを選んで起動すると、非常に短い間隔で広告用・分析用のリクエストが多数発生した
大量のリクエスト
- アプリを起動して1分もしないうちに、膨大な数のネットワークリクエストを確認した
- 各リクエストには、位置情報、IPアドレス、広告識別子、デバイスの詳細情報など、さまざまなデータが含まれていた
- 1つずつ確認した結果、ユーザーが同意していなくても機微な情報が複数の場所へ送信されている実態が明らかになった
Unity [ads]
- Unity Ads SDKがアプリに組み込まれている場合、位置情報やIPアドレスなど複数の情報をUnityのサーバーへ送信する
ifv(ID For Vendor)という識別子に加え、Wi-Fi接続時の位置情報(経度・緯度)やタイムスタンプなどが収集される
- UnityがMoloco AdsなどのDSP事業者と連携することで、広告入札の過程でこうした情報が第三者にまで渡る
なぜFacebookが出てくるのか?
- MetaやFacebook関連のアプリをまったくインストールしていなくても、アプリ内広告の通信過程でFacebookにIPアドレスとタイムスタンプが送信される
- Facebookが別経路から同じIPを使うアカウントを把握している場合、ユーザーのMetaサービス利用履歴と結び付けられる可能性が高い
- これはユーザーに事前に適切に通知されておらず、実質的に同意手続きも存在しない
なぜ画面の明るさが必要なのか?
- Unity Adsは、画面の明るさ、バッテリー状態、メモリ容量、ヘッドセット接続の有無など、デバイス状態の情報を要求する
- こうした情報は、パーソナライズド広告や動的価格提示などに悪用される懸念がある
- Uberがバッテリー状態を基準に料金を調整しているという噂のように、技術的には可能性が開かれている
IDについて知る
ifv(ID for Vendor)は、アプリ開発会社単位で付与される識別子である
advertisingTrackingId(IDFA)は、複数のアプリにまたがって同一ユーザーを追跡できるようにする識別子である
- 追跡拒否を設定するとIDFAは
0000...の形で発行されるが、IPやその他さまざまなIDは依然として送信されるため、事実上の迂回追跡が可能になる
追跡許可の有無による違い
- 広告追跡を「許可」にしても「拒否」にしても、位置情報、IP、ブラウザ情報などは引き続き送信される
- ただIDFAが見えなくなるだけで、他の識別要素が十分に多いため、同一ユーザーを判別できる余地は大きい
- Facebookのようなプラットフォームは、IPを通じてユーザーを間接的に識別する能力を持つ
データはどう流れるのか?
- アプリ → Unity [ads] → Molocoads → 広告主(Bwinなど)の順でデータが渡される
- UnityのようなSSP(Supply-Side Platform)がアプリ内SDKでデータを収集し、DSP(Demand-Side Platform)であるMolocoadsがそれを基に広告入札を行う
- データ仲介の過程では、広告主以外にも多数のブローカーが位置情報や端末情報などを取得できる
データブローカー
- DataradeやDatabricksなどの市場では、MAID(広告ID)ベースのユーザー位置情報が取引されている
- Redmobのような企業は、リアルタイム位置データ(5秒以内に更新)を販売していることもある
- AGR Marketing Solutionsなどは、MAIDと実際のPII(個人識別情報)を照合し、氏名、住所、電話番号などを渡すデータも販売している
自分自身を直接追跡する
- アプリをインストールし、日常的に位置情報が収集されるようにする
- IP+位置情報+広告IDのデータを広告会社やブローカーが確保する
- その後、MAID <> PIIデータセットを購入し、自分のIDFAまたはIPを基に実際の身元情報を結び付ける
- 結果として、ユーザー自身が自分の位置データを購入・組み合わせて追跡できる
まとめ
- 世界の広告エコシステムで行われているデータ取引は、各段階を個別に見ると合法に見えても、全体としては深刻なプライバシー侵害の要素となる
- こうした問題は、最近のGravy Analyticsなどの大規模流出事件によって再び注目を集めた
- 広告追跡を拒否に設定しても、完全な保護は保証されない
- ユーザーがアプリ利用時に情報がどこへ、どのように流れていくのか把握しにくいという限界は明白である
1件のコメント
Hacker Newsの意見
プライバシーの問題で、連絡先情報は簡単に売買され得る。TikTokのようなアプリで連絡先を共有すると、名前、電話番号、メールアドレスなどが流出する可能性がある。カスタマーサービスに問題があるとき、経営陣の連絡先を購入して直接連絡する方法を使ったことがある。ただし、CashAppのアカウントが停止されるなどの副作用があり得る
プライバシー関連の記事は、技術的な詳細が不足していたり誇張されていたりすることが多い。Mozillaの自動車プライバシーポリシー調査はあるが、実際の技術的詳細は不足している。たとえば、車が会話を録音しているのか、データがどこに保存されるのか、第三者に送信されるのかといった疑問がある。こうした詳細がなければ、記事は不信感をあおるだけになり得る
Biltという会社で家賃を支払っているが、Walgreensで買い物をするたびに購入レシートがメールで届く。機微な項目は除外されてほしい。データがWalgreensから家賃関連の会社にどう渡っているのか気になるが、現金や認証小切手を使うほうがよいのかもしれない
IT業界の人たちが広告、個人情報の販売、追跡産業を築き上げながら、同時に最も強く不満を述べているのは興味深い
画面の明るさ、メモリ容量、現在の音量、ヘッドホンを着けているかどうかといった情報が、ユーザーを再識別するために使われ得る
LTEがより正確な位置情報を提供するという主張は誤りだ。アプリは位置情報の権限がなければcellid情報を取得できない。無料アプリが正確な位置を収集していると主張していても、実際には正確ではない
広告取引所がIDFAなしでもアプリ横断トラッキングを行う方法を見つけるのではないかという懸念がある。理論上は禁止されているが、これを強制するのは難しい
Redditアプリは私のスマートフォンで権限を持っていないのに、位置ベースでコミュニティを勧めてくる。旅行中に訪れたどの都市でも推薦された
ウェブサイトで代替できるモバイルアプリの利用は避けることを勧める