1 ポイント 投稿者 GN⁺ 2025-11-13 | 1件のコメント | WhatsAppで共有
  • OpenAI は、8億人以上が利用する ChatGPTの個人会話データ保護 を最優先課題としている
  • ニューヨーク・タイムズ(The New York Times) は、裁判所に 2,000万件の個人的なChatGPT会話記録の提出 を求めており、これはユーザーのプライバシーを侵害する行為だと指摘されている
  • OpenAIは過去にも 14億件の会話記録要求 を拒否しており、今回も法的手続きを通じて ユーザーデータ保護を継続して推進 している
  • 同社は クライアント側暗号化 などの強化されたセキュリティ機能を開発中で、機密データへのアクセスを最小化する自動化システム を構築している
  • 今回の件は、AI時代の個人情報保護基準 をめぐる重要な分岐点と評価されている

ニューヨーク・タイムズのデータ要求とOpenAIの立場

  • ニューヨーク・タイムズは、OpenAIに対する訴訟の過程で 2,000万件のChatGPTユーザー会話記録の提出 を要求している
    • その理由として、「ユーザーがChatGPTを利用してニューヨーク・タイムズの有料課金壁(paywall)を回避したかどうかを確認するため」だと主張している
  • OpenAIは、この要求が 長年維持されてきたプライバシー保護原則とセキュリティ慣行に違反する と述べている
  • 同社は、「この訴訟とは無関係な数千万人の個人的な会話が含まれる」として、裁判所に当該要求の棄却を求めている

過去の類似要求と対応

  • ニューヨーク・タイムズは過去にも ユーザーの会話削除機能の制限 を試みたが、OpenAIがこれを阻止し、削除権限を復元 した
  • 続いて 14億件の会話記録提出要求 があったが、OpenAIはこれを拒否した
  • OpenAIは、「ユーザーの個人的な会話は本人のものであり、オンラインコンテンツアクセスをめぐる争いの犠牲になってはならない」と明言している

OpenAIのセキュリティおよびプライバシー強化措置

  • OpenAIは 世界で最も攻撃を受ける組織の一つ であり、組織犯罪や国家支援によるハッキングの試み からデータを守るため、大規模な投資を進めている
  • 今後のロードマップには クライアント側暗号化(client-side encryption) 機能が含まれており、これにより OpenAIでさえユーザーメッセージにアクセスできなくする計画
  • 自動化された安全性検知システム を構築し、生命への脅威・他者への被害・サイバーセキュリティ上のリスクなど、深刻な悪用事例のみを限定的に人間の審査チームへ送る よう設計している

データ要求に関する詳細事項(FAQ要約)

  • 要求されたデータ範囲: 2022年12月〜2024年11月の間の 無作為に抽出された2,000万件の消費者向けChatGPT会話
  • 影響対象外: ChatGPT Enterprise、ChatGPT Edu、ChatGPT Business(旧Team)、API顧客は対象外
  • 個人情報保護措置: すべての会話は 個人識別情報(PII) および パスワードなどの機微情報の除去手続き を経る
  • データアクセス権限: OpenAIの 法務・セキュリティチームの一部メンバー と、ニューヨーク・タイムズ側の外部弁護士および技術顧問団 のみアクセス可能
  • 保管方式: 法的義務履行のための 別個のセキュアなシステム内に隔離保存 され、通常のアクセスは不可

法的・国際的な考慮事項

  • OpenAIは GDPRなどの国際的なプライバシー法規の遵守 のために必要な措置を講じているが、ニューヨーク・タイムズの要求は 自社のプライバシー基準に適合しない と明言している
  • 同社は 法的手続きを通じて要求を引き続き争っており、あらゆる段階で ユーザープライバシー保護を最優先に維持 するとしている
  • OpenAIは今後、裁判所の判断およびデータ処理の変化について透明性のあるアップデート提供 を約束している

今後の計画とビジョン

  • OpenAIは、AIが個人の生活に深く統合されるほど、セキュリティとプライバシー保護の水準は強化されるべきだ と強調している
  • ユーザーの最も私的なAIとの会話が安全かつ非公開に保たれる未来 を目指している
  • 短期的には セキュリティ強化と短期的な緩和措置 を迅速に公開する予定だ
  • 長期的には、信頼できるAI環境の構築 に向けた技術的・法的保護体制の確立を進めている

1件のコメント

 
GN⁺ 2025-11-13
Hacker Newsの意見
  • ニューヨーク・タイムズがOpenAIに2,000万件のChatGPT会話記録の提出を求めたという話を聞いた
    原告として当然できる要求ではあるが、この訴訟は著作権問題だけに限られない可能性もある
    むしろ問題は、OpenAIがなぜこれほど多くの非公開の会話データを収集・保存しているのかという点だ
    NYTの要求は法的手続きの中でのみ使われ、機密情報はマスキングされた状態で提出され、訴訟が終われば廃棄される
    一方でOpenAIは商業的利益のためにデータを無期限に保存している
    そもそもどんなビジネスモデルのためにこうしたデータを蓄積しているのかも不明瞭だ。無差別なデータ収集行為だと思う
    • 実際に裁判所が命じたのはデータを「収集」しろということではなく、すでに保存中のデータを保全(preserve) しろということだ
      関連文書: 裁判所命令 1, 裁判所命令 2
    • しかし別の人は、これは実際にはデータ収集を強制する裁判所命令だと主張している
      Ars Technicaの記事を参照している
    • OpenAIが会話を保存する理由は明確だ。ChatGPTインターフェースで会話履歴機能を提供しているからだ
      ユーザーが削除ボタンを押しても、裁判所命令のためにデータを維持しなければならないのが問題だ
    • Google Photosが写真を保存するように、ChatGPTも会話記録を保存する必要がある。製品の中核機能だ
    • ChatGPTを使ったことがあれば、左側パネルに会話履歴が表示されるのを知っているはずだ
  • OpenAIがNYTのデータを無断で使用していなければ、こんなことにはならなかったはずだ
    結局、著作権侵害が根本原因だと思う。NYTが争うのは正しい
    • しかし別の人は、すでに2人の判事がAI学習はフェアユース(fair use) だと判断したと反論している
      関連判決の要約
    • データは公共財として扱うべきだという意見もある。特定企業がデータ所有権を主張するのが問題だと見る
    • NYTはインターネットを閉鎖的なペイウォール(paywall) で汚染する存在だと批判している
      オープン文化に貢献せずに注目だけ集めるのは偽善的だと思う
    • Sam AltmanとOpenAI経営陣が恐怖・不確実性・疑念(FUD) をまき散らして投資だけ呼び込んだと批判している
      AGIの約束は嘘で、人々を不安にさせただけだと怒っている
  • 私はOpenAIが「善玉」だとは思わない
    だが、人々が私的に交わした会話がNYTの弁護士たちの手に渡るのは居心地が悪い
    NYTは明確な被害を立証できていないため、「漁り目的の証拠探索(fishing expedition)」 をしているように見える
    • しかし別の人は、NYTは実際にコンテンツ盗用の証拠を提示しており、それを確認するにはログ全体が必要だと説明している
      海賊版書店の販売記録を要求するのと同じだとたとえている
      ユーザーは法的にプライバシー権を主張しにくいとも述べている
    • また別の人は、NYTは法定損害賠償(statutorily defined damages) を請求しているため、実際の損害立証は必要ないと説明している
      核心はAI学習が著作権侵害に当たるのか、そしてフェアユースに当たるのかという点だ
      OpenAIが訴訟過程で不誠実に対応した点も指摘している
    • 「NYTが被害を立証していない」という主張は間違いだと反論し、実際の訴状(complaint) を読めと言っている
      NYT訴状PDF
    • ある人は、この争いは結局中国とオープンソースモデルに有利に働くと見ている
      著作権を無視できる側が競争優位を持つことになるだろう
    • 実際、ほとんどのサービス利用規約には裁判所命令があればログを提出できると明記されている
      みんなそれを読んでいなかっただけだ
  • 最近は企業が顧客に公開書簡を書いて世論戦を仕掛けるのが流行っているようだ
    ESPN vs YouTube、そして今回はOpenAI vs NYT
    どちらもあまり応援したくない。ただ、OpenAIが本当にNYTの文章をそのまま出力していないのなら、検証を恐れる理由はないと思う
    中立な第三者による検証を提案する — 第三者がNYT記事とChatGPTログを比較し、当事者双方は元データを直接見ない方式だ
    • しかし現実には、完全に中立な機関を見つけるのは不可能だ
      結局はそれぞれが専門家を立て、法廷で信頼性勝負をするしかない
    • ある人は、両組織とも権威主義的リーダーシップの下にあるのだから、ただ争わせておけばいいという皮肉な反応を見せている
  • OpenAIは非営利から出発したが、今では完全に変質したPR戦(スピン) を繰り広げていると見る
  • Googleがプライバシーを語る時のように、OpenAIの主張にもまったく誠実さを感じない
    それでも今回の件が、人々に個人情報の過剰共有の危険性を気づかせるきっかけになればと思う
    • 「あなたのデータはあなたのもの」という文句はプロパガンダのようだ
      実際には利用規約に従ってOpenAIがデータを所有し活用している
      NYTの意図を歪めるようなコミュニケーションも信用しにくい
    • OpenAIが世界中のデータを無差別にかき集めた結果、こうした事態が起きたのだ
      自業自得だと思う
    • 皮肉なことにGoogleは過去に位置履歴(Local Timeline) の問題を認識し、ローカル保存方式へ切り替えたことがある
      OpenAIにはそうした責任感がまったくない
    • ある人は、いっそOpenAIが破産した方が世界のためになるとまで言っている
  • OpenAIが法廷で「私たちはユーザーデータに関心がない」と主張するのが理解できない
    それなら、なぜ今プライバシーを盾にしているのか疑問だ
  • 「この訴訟には根拠がない」と言い出した時点で信頼が落ちる
    そういう主張はたいてい防御的態度のサインだ
  • 皮肉にもOpenAIは最初から個人情報をかき集めてモデルを訓練してきた会社だ
    今さらプライバシーを心配するのは矛盾している
  • OpenAIが会話を保存する際に暗号化(encryption) を適用しない理由が気になる
    技術的には可能に見えるが、おそらく内部分析のために平文保存を選んでいるのだろう
    社員がアクセスできるなら、NYTの弁護士が見るよりも不快だ
    裁判所命令で捜査官が手紙を閲覧するのと大差ないと思う
    • ただ実際には、各リクエストごとに会話全体を再びモデルに入れるのではなく、K-Vキャッシュシステムを使って効率的に継続する構造なのだろう
    • しかも暗号化しても、鍵をOpenAIが握っているなら裁判所命令は回避できない