- 裁判所命令により、OpenAIは削除済みの会話を含むすべてのChatGPTユーザーログを保管しなければならず、OpenAIはこの措置が深刻なプライバシー侵害だと反論している
- OpenAIは、この命令が著作権訴訟で証拠保全を求めた報道各社の主張に基づき、十分な根拠なく即時に下されたものだと主張している
- OpenAIは、この命令によって数億人のユーザーの個人情報や企業の機密データまで保管することになり、グローバルなプライバシー規制違反のリスクとエンジニアリング負荷を警告している
- 命令の施行後、ユーザーが削除した会話や一時的な会話なども強制的に永久保存されることになり、これに対する強い不安と懸念がSNSなどで広がっている
- OpenAIは、ユーザーのデータ管理権限とプライバシー保護のために命令の撤回を改めて求め、法的闘争を続ける考えを明らかにした
「極めて個人的な」データ保管命令に対するOpenAIの反発
裁判所命令の背景と主な争点
- OpenAIは、数百万のChatGPTユーザーのプライバシー保護のため裁判所に異議を申し立て、すべてのユーザーログ(削除済み会話およびAPI会話を含む)の保存命令に強く反発している
- この命令は、著作権侵害訴訟の過程で報道各社側がOpenAIは証拠を破棄していると主張したことを受けて下され、OpenAIは、十分な事実確認や疎明なしに拙速に決定されたと指摘している
- 訴訟の原告側は、ChatGPTで有料ニュース記事への迂回アクセスを行った場合、ユーザーが痕跡を消すために会話を削除するだろうと主張したが、実際にその主張を裏付ける証拠は提示されていない
- 裁判所はこうした推定に基づき、OpenAIに今後すべての会話ログ(削除分を含む)を別途保管するよう命じたが、OpenAIはこの措置がユーザーのデータ管理権の侵害とグローバルなプライバシー法違反のリスクを高めると警告している
OpenAIの主張と法的対応
- OpenAIは、今回の異例なほど広範な保全命令がユーザーのプライバシー権を侵害しており、ユーザーは自分のデータをいつどのように保存するかを自ら選べるべきだと強調している
- 裁判所命令が出る前まで、OpenAIでは、ユーザーが自分で会話を削除したり一時的な会話機能を使ったりした場合、その会話はシステムから30日以内に完全削除される仕組みだった
- しかし今回の命令により、あらゆる削除要求や一時的な会話までも強制保存しなければならない状況となり、数億人のユーザーの個人情報や企業のAPIデータ(機密情報を含む)が長期保管されることになった
- OpenAIは、プライバシー上の懸念に加え、命令履行のためにエンジニアリングリソースと莫大なコストが発生すると指摘し、報道各社側の推測的な利益よりもOpenAIとユーザーの被害のほうがはるかに大きいと主張している
- OpenAIは裁判所に口頭審理を求め、命令の撤回(即時取り消し)を要求している
ユーザーと業界の反応
- 命令の施行が知られると、多くのユーザーや企業顧客がソーシャルメディア(LinkedIn、Xなど)で不安を表明した
- 一部の専門家は、この命令が「すべてのOpenAI企業顧客に対する重大な契約違反」になり得るとし、APIを通じて機密データを扱う企業はさらに大きなセキュリティリスクにさらされると警告している
- SNS上では、「OpenAIを通じたAIサービスはすべてプライバシー脅威にさらされた」「代替サービス(Mistral AI、Google Geminiなど)への移行を勧める」といった意見が広がっている
- あるセキュリティ専門家は、「このような命令は容認できないセキュリティリスクだ」と評価した
- 「ワン判事は、NYTの著作権論理がOpenAIの全ユーザーのプライバシーより優先すると考えている――正気ではない」という批判も出ている
OpenAIの方針と今後の見通し
- OpenAIは従来、ユーザーデータ保管ポリシーを厳格に守り、アカウント削除時には30日以内に全会話履歴を削除してきた
- 裁判所命令により、従来のデータ管理・削除プロセスは一瞬で無力化され、ユーザーは自分のデータが安全に削除されるという信頼を持ちにくい状況となっている
- OpenAIは法的闘争を継続する方針で、命令の不当性と実際の被害を積極的に訴えていく計画だ
1件のコメント
Hacker Newsの意見
GPTモデルをAPIとして使う場合でも同じリスクがある点に注目している
これは遠からずすべてのAI企業が直面する問題だと思う
誰もがモデルを自前でホスティングする環境に変わらない限り、SaaSのようなビジネスモデルでは収益性を考えるとユーザーのプライバシー保護がそれほど重視されないのが現実だ
正直、大半の人はインターネット上にプライバシーなどないという事実にすでに慣れてしまっている
ただし、クローズドソースコードやセキュリティ関連データを信頼ベースで預ける企業や個人は相当な打撃を受けざるを得ない
でも、そういう部分はそもそもどの業者にも外注すべきではないという立場だ
すでに定着している企業は、今回の問題を受けて既存契約、規定、リスク許容範囲を見直す必要がある
ChatGPTベースのサービスを提供するラッパー系スタートアップも、プライバシーポリシーを再点検し、ユーザーがプライバシーを放棄している事実を明確に示しておく必要がある
私が導入したすべてのGPT統合は、私のデータで学習しないという契約上の義務があるためAzureサービス経由だった
私の理解では、Azureサービス、つまりMicrosoftには今回の判決は適用されないはずだ
もしあなたが独占的なコードを扱っていたなら、クラウドLLMはそもそも使うべきではなかったということであり、今回の件でその事実がさらに明確になった気がする
どうしてビジネスへの打撃になるのかという問いに対して、これは法的リスクに備えてデータを保管する措置であり、学習目的で使うためのものではないと強調している
他社との契約でも、データを学習に使わないという条件を契約上に明記できると思う
より詳しい背景記事はこちらで確認できる
このリンクが実際の情報源だ
この記事へのリンクに更新したほうがよさそうだ
記事の下に付いているコメント欄が本当におかしな雰囲気なので紹介している
著作権擁護派を反AI陣営として描いて風刺している感じだ
個人的にはOpenAIの他人のコンテンツに対する傍若無人な態度はあまり好きではないが、一方で著作権者の要求も強すぎるものには共感しにくい
生成AIと学習の問題は、現行の知的財産権法にある時代遅れの要素を鮮明に浮かび上がらせていると思う
今後は変化が必要だが、その変化が大企業や富裕層にだけ有利に進んではならず、普通の人々の助けになるべきだと思う
LLMによる著作権侵害には概ね批判的な立場だが、今回の判決の論理展開の仕方はやや奇妙に感じる
裁判官が、仮にあるユーザーがChatGPTを通じて有料壁を回避してNew York Timesのコンテンツを取り出し、その後に事件を知って自分が出力した記録をすべて削除してほしいと求めたら、判決の趣旨を回避することにならないかと指摘している
実際、このような判決が出たと聞けば、ユーザーはその期間中は慎重になるのではないかという疑問がある
OpenAIが今や、ユーザーが会話履歴を削除したりTemporary Chat機能で一時的な会話をしても、法的命令のためにログを残さなければならない状況は、普通のWebブラウザーの履歴と何が違うのかという批判だ
Safariがユーザーの消した履歴まで必ず保存しなければならないなど、なぜOpenAIだけが特別に強制されるのか不思議だ
よりよい記事リンクがスレッドに示されている
Ars Technicaの元記事へのリンクだ
単なるMastodonの投稿ではなく、実際の情報が入った記事を参照すべきだと付け加えている
最近Hacker Newsでは、LLMの利点や欠点を論じる個人的なコラムがいくつも上がっているが、プライバシー問題にはまったく触れない傾向がある
私がLLMを活用したり、ソースコードをプロンプト欄に貼り付けたりしない主な理由はプライバシーだ
うちの会社ではNDAやITARのような政府規制のため、コードがサーバーの外に出た時点で即座に規定違反になる
今回の件は、プライバシーがLLMのアキレス腱であることを示している
LLMがオンプレミスの形で定着するまでは、この問題から自由にはなれない
とても簡単に直接LLMを構築できる
OpenAIがデータをサーバーに保存せざるを得ない状況は、訴訟中の企業の法務チームがDiscovery(文書提出命令)の手続きでユーザーとChatGPTの会話履歴を見られる状況につながる
たとえばNYTの弁護士が法廷で当事者のプライベートな会話を証拠資料として読み上げることがあり得る
むしろ会話ログを匿名化して保管することが解決策になり得るという意見だ
OpenAIが技術的に匿名化処理を行うこともできるはずで、この点が最適な解決策に見える
こうしたデータは、Spectra TFinity ExaScaleライブラリのようなテープストレージベースのソリューション、あるいはAWS Glacierのような深層アーカイブシステムにバックアップできる
データ復旧に数時間から数日かかるこのような構成なら、裁判所命令も守れ、コストも安く抑えられ、
大規模な情報漏えいが起きた場合でも長い時間と労力をかけなければ盗めないため、検知と防御に有利だ
これで米国内のすべてのクラウドベースAIとのチャットやAPIコールは、すべて法的検索の対象になり得ることを前提に疑うべきだ
もしそれが許容できないリスクなら、ローカルLLMへの移行を真剣に検討すべきだ
Timesのようなメディアが、どうしてユーザーデータを見る権利を持てるのか疑問だ
結局この判決によって、新聞社側がユーザーデータをのぞき見できる状況になっている
この裁判所命令は、1つ以上の法域でプライバシー法違反となる可能性があり、OpenAIが既存顧客と結んだ契約に違反する可能性もある
既存契約は、裁判所が命令を出すことには何の影響も及ぼせないという説明だ
法的命令が最優先だ
今回の命令自体が、新たなプライバシー法違反を追加で生み出すわけではない
そもそもデータを保管し、第三者に提供すること自体が違反だった
この命令は実際には5月13日付までさかのぼって適用されている
OpenAIがこれまでユーザーに別途メールなどでこの事実を知らせていない理由が、事業上の悪影響を恐れてのことのように感じられる
しかし、ユーザーの信頼を明らかに裏切る行動に思える
ChatGPT APIを通じて機微データをやり取りしていた企業は、入力・出力データが保存されないという説明を信じていたはずだが、
実際にはOpenAIが設定を変えるだけでデータを残せる状況だった
別途通知が送られたのか、それとも皆が報道で初めてこの事実を知ったのか気になる
元記事のリンクはトラフィック過多(HN hug of death)でアクセスできなかったが、Wayback Machineで読むことには成功した
Mastodonの個人インスタンスなので、訪問者が急増すると過負荷になるのも理解できる