- OpenAI は、8億人以上が利用する ChatGPTの個人会話データ保護 を最優先課題としている
- ニューヨーク・タイムズ(The New York Times) は、裁判所に 2,000万件の個人的なChatGPT会話記録の提出 を求めており、これはユーザーのプライバシーを侵害する行為だと指摘されている
- OpenAIは過去にも 14億件の会話記録要求 を拒否しており、今回も法的手続きを通じて ユーザーデータ保護を継続して推進 している
- 同社は クライアント側暗号化 などの強化されたセキュリティ機能を開発中で、機密データへのアクセスを最小化する自動化システム を構築している
- 今回の件は、AI時代の個人情報保護基準 をめぐる重要な分岐点と評価されている
ニューヨーク・タイムズのデータ要求とOpenAIの立場
- ニューヨーク・タイムズは、OpenAIに対する訴訟の過程で 2,000万件のChatGPTユーザー会話記録の提出 を要求している
- その理由として、「ユーザーがChatGPTを利用してニューヨーク・タイムズの有料課金壁(paywall)を回避したかどうかを確認するため」だと主張している
- OpenAIは、この要求が 長年維持されてきたプライバシー保護原則とセキュリティ慣行に違反する と述べている
- 同社は、「この訴訟とは無関係な数千万人の個人的な会話が含まれる」として、裁判所に当該要求の棄却を求めている
過去の類似要求と対応
- ニューヨーク・タイムズは過去にも ユーザーの会話削除機能の制限 を試みたが、OpenAIがこれを阻止し、削除権限を復元 した
- 続いて 14億件の会話記録提出要求 があったが、OpenAIはこれを拒否した
- OpenAIは、「ユーザーの個人的な会話は本人のものであり、オンラインコンテンツアクセスをめぐる争いの犠牲になってはならない」と明言している
OpenAIのセキュリティおよびプライバシー強化措置
- OpenAIは 世界で最も攻撃を受ける組織の一つ であり、組織犯罪や国家支援によるハッキングの試み からデータを守るため、大規模な投資を進めている
- 今後のロードマップには クライアント側暗号化(client-side encryption) 機能が含まれており、これにより OpenAIでさえユーザーメッセージにアクセスできなくする計画 だ
- 自動化された安全性検知システム を構築し、生命への脅威・他者への被害・サイバーセキュリティ上のリスクなど、深刻な悪用事例のみを限定的に人間の審査チームへ送る よう設計している
データ要求に関する詳細事項(FAQ要約)
- 要求されたデータ範囲: 2022年12月〜2024年11月の間の 無作為に抽出された2,000万件の消費者向けChatGPT会話
- 影響対象外: ChatGPT Enterprise、ChatGPT Edu、ChatGPT Business(旧Team)、API顧客は対象外
- 個人情報保護措置: すべての会話は 個人識別情報(PII) および パスワードなどの機微情報の除去手続き を経る
- データアクセス権限: OpenAIの 法務・セキュリティチームの一部メンバー と、ニューヨーク・タイムズ側の外部弁護士および技術顧問団 のみアクセス可能
- 保管方式: 法的義務履行のための 別個のセキュアなシステム内に隔離保存 され、通常のアクセスは不可
法的・国際的な考慮事項
- OpenAIは GDPRなどの国際的なプライバシー法規の遵守 のために必要な措置を講じているが、ニューヨーク・タイムズの要求は 自社のプライバシー基準に適合しない と明言している
- 同社は 法的手続きを通じて要求を引き続き争っており、あらゆる段階で ユーザープライバシー保護を最優先に維持 するとしている
- OpenAIは今後、裁判所の判断およびデータ処理の変化について透明性のあるアップデート提供 を約束している
今後の計画とビジョン
- OpenAIは、AIが個人の生活に深く統合されるほど、セキュリティとプライバシー保護の水準は強化されるべきだ と強調している
- ユーザーの最も私的なAIとの会話が安全かつ非公開に保たれる未来 を目指している
- 短期的には セキュリティ強化と短期的な緩和措置 を迅速に公開する予定だ
- 長期的には、信頼できるAI環境の構築 に向けた技術的・法的保護体制の確立を進めている
1件のコメント
Hacker Newsの意見
原告として当然できる要求ではあるが、この訴訟は著作権問題だけに限られない可能性もある
むしろ問題は、OpenAIがなぜこれほど多くの非公開の会話データを収集・保存しているのかという点だ
NYTの要求は法的手続きの中でのみ使われ、機密情報はマスキングされた状態で提出され、訴訟が終われば廃棄される
一方でOpenAIは商業的利益のためにデータを無期限に保存している
そもそもどんなビジネスモデルのためにこうしたデータを蓄積しているのかも不明瞭だ。無差別なデータ収集行為だと思う
関連文書: 裁判所命令 1, 裁判所命令 2
Ars Technicaの記事を参照している
ユーザーが削除ボタンを押しても、裁判所命令のためにデータを維持しなければならないのが問題だ
結局、著作権侵害が根本原因だと思う。NYTが争うのは正しい
関連判決の要約
オープン文化に貢献せずに注目だけ集めるのは偽善的だと思う
AGIの約束は嘘で、人々を不安にさせただけだと怒っている
だが、人々が私的に交わした会話がNYTの弁護士たちの手に渡るのは居心地が悪い
NYTは明確な被害を立証できていないため、「漁り目的の証拠探索(fishing expedition)」 をしているように見える
海賊版書店の販売記録を要求するのと同じだとたとえている
ユーザーは法的にプライバシー権を主張しにくいとも述べている
核心はAI学習が著作権侵害に当たるのか、そしてフェアユースに当たるのかという点だ
OpenAIが訴訟過程で不誠実に対応した点も指摘している
NYT訴状PDF
著作権を無視できる側が競争優位を持つことになるだろう
みんなそれを読んでいなかっただけだ
ESPN vs YouTube、そして今回はOpenAI vs NYT
どちらもあまり応援したくない。ただ、OpenAIが本当にNYTの文章をそのまま出力していないのなら、検証を恐れる理由はないと思う
中立な第三者による検証を提案する — 第三者がNYT記事とChatGPTログを比較し、当事者双方は元データを直接見ない方式だ
結局はそれぞれが専門家を立て、法廷で信頼性勝負をするしかない
それでも今回の件が、人々に個人情報の過剰共有の危険性を気づかせるきっかけになればと思う
実際には利用規約に従ってOpenAIがデータを所有し活用している
NYTの意図を歪めるようなコミュニケーションも信用しにくい
自業自得だと思う
OpenAIにはそうした責任感がまったくない
それなら、なぜ今プライバシーを盾にしているのか疑問だ
そういう主張はたいてい防御的態度のサインだ
今さらプライバシーを心配するのは矛盾している
技術的には可能に見えるが、おそらく内部分析のために平文保存を選んでいるのだろう
社員がアクセスできるなら、NYTの弁護士が見るよりも不快だ
裁判所命令で捜査官が手紙を閲覧するのと大差ないと思う