- New York TimesによるOpenAI提訴を受け、生成AIが学習・出力段階で著作権侵害の責任をどこまで負うべきかが、より大きな争点として浮上している
- 訴訟の核心は、チャットボットがテキストをほぼそのまま再現できる点にあり、MarcusとReid Southenの実験は、DALL-Eも画像で同様の反復を生み出しうることを示している
- 固有名詞の遮断といった安全装置があっても、ユーザーがキャラクター名や映画名を直接書いていないプロンプトから、SpongeBob SquarePants、RoboCop、ビデオゲームのキャラクターに似た結果が出る可能性がある
- 現在のシステムは、学習元と生成物の出典情報・侵害可能性をユーザーに知らせておらず、ユーザーが知らないうちに侵害的な成果物を作ってしまう可能性がある
- Marcusは、出典追跡が可能な新しいアーキテクチャが登場するまで侵害論争は続くと見ており、New York Timesの訴訟は、より多くの訴訟の始まりになる可能性があるとみている
New York Times訴訟と画像反復実験
- New York TimesがOpenAIを相手取って訴訟を起こした時期に、Gary Marcusと映画業界のコンセプトアーティストであるReid Southenが共同で実験を行った
- Southenは、Marvel、DC、Matrix Resurrections、Hunger Gamesなどに関わった経歴を持つ人物として紹介されている
- 全体レポートは来週公開予定で、1月3日にはIEEE Spectrumでも追加で取り上げられる予定だという
- 訴訟の核心は、OpenAIのチャットボットがテキストをほぼ原文のまま再現できる点にある
- MarcusとSouthenの実験では、Bing経由でOpenAIの画像ソフトウェアを使った場合でも、画像の元画像そのまま、またはそれに近い反復が可能だったという
安全装置では防げない類似生成
- DALL-Eには、固有名詞や意図的な侵害の試みを一部防ぐ安全装置があるとされているが、安定して機能しているわけではないという
- 侵害の可能性は、ユーザーが自ら侵害を意図していない場合や、キャラクター名・映画名に触れていない場合でも生じうる
- SpongeBob SquarePantsに言及していない短いプロンプトから、関連する結果が出ることがあるという
- RoboCopに言及していないケースや、ビデオゲームのキャラクター、商標侵害の可能性がある結果も例として挙げられている
- XユーザーのBlanket_Man01とA16ZのJustine Mooreも、同様の現象を独立に発見したという
出典を知ることのできないブラックボックス問題
- Marcusが見る生成AIの核心的問題は、学習元と生成物の出典がユーザーに明らかにならない構造にある
- DALL-EやChatGPTのようなシステムは、著作権のある資料で学習されている
- OpenAIは何で学習したのかを透明に公開していない
- 生成AIシステムは、著作権を侵害しうる素材を生成できる
- システムは、そのような結果が出たときにユーザーへ通知しない
- 生成画像の出典情報も提供しない
- ユーザーは、自分が作った画像が侵害に当たるかどうか分からない可能性がある
- 現在のDALL-EやChatGPTのようなシステムはブラックボックスに近く、現行の構成では元資料への帰属表示は難しいとみている
- 一部企業が関連研究を進めているが、説得力のある解決策はまだ分からないとしている
- 生成テキストや画像の出典を安定して追跡できる新しいアーキテクチャが登場するまで、侵害は続く可能性があるとみている
- 優れたシステムであれば、ユーザーに出典一覧を提供すべきだが、現在のシステムはそうなっていないという
訴訟拡大とMicrosoftのリスク
- New York Times訴訟は、複数の訴訟の最初の事例になる可能性が高いとみられている
- MarcusがXで実施したアンケートでは、多くが和解を予想した
- 和解規模については、多くの回答が1億ドル超を予想し、20%は10億ドルを予想した
- 映画スタジオ、ビデオゲーム会社、他の新聞社などへ拡大すれば、金額規模はさらに大きくなりうるという
- これらの事例はBing上でDALL-Eを通じて行われたため、Microsoftも責任リスクにさらされるとみている
1件のコメント
Hacker Newsのコメント
こうしたものを誰かが実際に所有できるという企業的な物語を、みんなあまりにも簡単に受け入れてしまっている
白雪姫やシンデレラの物語を、本当に誰が所有しているのか? これらの物語はDisneyから出てきたものではなく、世代を超えて受け継がれてきた民話の一部であり、Disneyの成功もまた、共同体が何世紀にもわたって共有し変形してきた既存の物語を翻案したことに一部支えられている
この議論は、人工知能の技術的な詳細や著作権の法的論理だけでなく、私たちが共有する文化の深い根を理解する問題であるべきだ
文化は本質的に共有財産であり、集団的な物語と再解釈を通じて進化し成長する
生成AIと著作権侵害の議論は、この文化進化の根本を見落としているように見える。アルゴリズムは新しいかもしれないが、物語を再想像し再利用する行為そのものは人類と同じくらい古い
Disneyが既存文化と既存の物語の上に「ネズミの家」を築いておきながら、今になって古びて奇妙な著作権に合わせるため文化表現の道具を制限しようとするのは、本当に筋が通らないと思う
記事の画像にはかなり最近のものが使われていて、MarioやCoca Colaかどうかすら疑いようがない。NintendoとCoca Colaが共同プロモーションをしたのなら、そのまま出てきても信じられるほどだ
Marioっぽい服を着たずんぐりした配管工という全体の概念を主張するなら別問題だが、あれはただのMarioとLuigiだ。RobocopでありC3POだ。まったく微妙ではない。こういう商標をAIロンダリングで消せるなら、何でもAIロンダリングできてしまう
新しさがあるのはLLMとその技術であって、高尚な文化的開放性の概念のもとで著作権全体を再考することではない
だからこれは単なる企業的な物語ではなく、正しいか間違っているかは別として、その物語の土台となっている法律だ。企業が法律の形成に大きな役割を果たしてきた可能性はあるが、著作権は個人にも利益をもたらす。単なる宣伝や企業の物語で共有現実を操作しているのではなく、裁判官が仲裁し、銃と刑務所を持つ人々が執行するものだ
法的争点なのだから、必ず法律の技術的詳細を扱わなければならない。社会的な物語だけを論じるべきだとしてそれを退けてしまえば、物質的な結果と現実を幻想で置き換えることになる。著作権と知的財産権が創作を抑圧する性格も論じるべきだが、同時に現実に起きていることを無視するわけにはいかない
ただしGeorgismは十分に検討されていない
法的含意は人間的含意であり、他のものと同じように文化の一部でもある。何が公正か、努力への報酬がどのように認められ分配されるかに関わっている
こうした形式化は市場経済中心でない文化ではそれほど重要でないかもしれず、「豊かな民話の織物」のような表現は、そうした世界に戻ろうという響きを持つ。しかし、人工知能をどう扱うかを考えている社会は、そういう社会ではない
著作権が新しい複製能力のために無効化された、あるいは時代遅れになったという考えこそ、文字どおり逆立ちした発想だ。著作権は新しい複製能力ゆえに説得力を持つようになった
当時の具体的な能力は工業化された印刷であり、たいていのソフトウェア専門家よりはるかに賢く見える人々は、その能力が新たな複製能力を持つ側と、その価値の土台となる作品を作った側との間に、インセンティブの不整合を生むことを理解していた。著作権という取引の核心は、このインセンティブを整合させることにある
新しい複製技術は、何を禁止・制限・許容するか、どんな基準や執行権限・限界を設けるかという詳細を変えうる。しかし、その取引の知恵そのものを変えるわけではない。それを変えるには、社会の生産能力を組織し報酬を与える、よりよい方法が必要になる
だからといって、生成AI企業がもっと金を稼げるように著作権をなくそうという発想は、完全におかしく聞こえる
その問い自体が間違っていると思う
誰もが著作権のある資料で学習されており、不気味なほど似た出力を出せることを知っていた
しかし、これはすでに大規模に起きており、大企業が全面的に参入している。絞り出した歯磨き粉をチューブに戻すことはできない
巨大テック企業が攻撃的なユーザーデータ収集の上に事業を築いたときと似ている。正しいのか、倫理的なのか、さらには合法なのかさえ、この段階では学術的な議論に近い。彼らはただ実行し、社会の適切な informed consent もないまま事実上進めてしまった
ここで正しい問いは「では今、何をするのか」だ。追跡技術のときのように、答えはおそらく「特に何も起きない」に近いだろう
安価な音楽録音や製造のような技術も同じだった。一度アーティストを録音してレコードを大量生産できるとしても、だからといって Taylor Swift を一度録音したあと、金を払わずに無制限に複製してよいとは考えない
1942年の音楽家ストライキを読むとよい: https://jacobin.com/2022/03/1940s-musicians-strike-american-...
Napster で、その次に Apple Music で、そして今はストリーミングサービスで、すでに起きたことだ
一般大衆の間に広範なファイル共有が残る代わりに、私たちは所有していないデバイスとストリーミングのサブスクリプションを持つことになった
Apple はすべての音楽を iPod にコピーして売ったのではなく、コンテンツの権利を得るために10年にわたる契約交渉と多額の資金を費やした
何が正しく何が間違っているかを言いたいのではなく、こうした争いをほとんど理解していない発言だということだ
Uber や AirBnB がほとんどの大都市で違法だったのに、結局市場支配力を得たときを思い出させる
私はむしろそれでよいと思う。「知的財産権」のようなものは信じたことがない。特許、著作権、想像上の「権利」の束全体を廃止すべきだ
世界の半分以上、つまりグローバルサウスはこうした権利を認めてすらおらず、今では苛烈な法的過剰執行と独占的な中央集権なしには執行することもますます難しくなっている
彼らは数十億・数兆ドル規模の企業だ。株主や最高経営陣がどれほど嫌がろうと、ここでは責任ある社会の一員として行動する余力がある
EU では問題にならないはずだ。「デジタル単一市場における著作権」指令の第3条と第4条がすでにこれを規律している
Wolters Kluwer の要約によれば、商用の機械学習開発者を含むその他すべての主体は、合法的にアクセス可能な著作物のうち、権利者がテキスト・データマイニング用途を明示的に留保していない場合にのみ利用できる
私の知る限りでは、「学習禁止」を示す robot.txt のようなものが議論されている。おそらく一定のセーフガードを実装する必要があり、最終利用者は生成物を使う際に注意しなければならないだろう
Kluwer の出典: https://copyrightblog.kluweriplaw.com/2023/02/20/protecting-...
EU 法令原文: https://eur-lex.europa.eu/eli/dir/2019/790/oj
https://eur-lex.europa.eu/eli/dir/2019/790/oj
著作権侵害がないことを保証する責任は、作品を公開する者にある
自分で描いたか、法的教育を受けていない見習い画家に任せたか、写真を撮ったか、AI で画像を作ったかで違いはない
なぜ ChatGPT や他のツールが既存の著作権コンテンツを作らないと仮定するのか?
「生成」されたのだからオリジナルだろう、という素朴な前提は理解できる。しかし「ChatGPT」を「ジュニアアーティスト」に置き換えた瞬間、その前提は崩れる
SF映画のドロイドを描けと言い、他には何も言わないとしよう。著作権の話もしないし、独創的であるべきだとも言わない。では、何を描くと予想するのか?
その仮想のジュニアアーティストも少なくとも同程度、あるいはそれ以上の責任を負うだろう
この記事やNYT訴訟の核心をまったく理解していないような反応が驚くほど多い。ChatGPTはNYTの記事のかなりの部分を、数百〜数千語の長さで完全に原文そのまま再現して公開できていた。
これは二次的著作物ではない。すでにその段階をはるかに超えている。NYTは非常に強い訴えを持っており、著作権の良し悪しを論じている人たちは論点を外している。
この1件の裁判だけで著作権が単独で覆ることはないだろう。OpenAIが主張できるのは、「これは新しく、こうなるとどうして予想できただろうか」程度にすぎない。だとすれば、現在すでに学習済みのモデルは非常に厳しい立場にある。
また、NYTが和解するようには思えない。含意があまりに大きく、OpenAIと和解すれば他のあらゆるモデルでも似たような訴訟が起きるだろう。デジタルコンテンツを出版する他のすべてのメディアも、同様にもっともな訴えを持つことになる。
これは生成AIの変曲点であり、私たちが最初に考えていたよりも、はるかに高コストになるか、はるかに制約の強いものになる可能性が高そうだ。
副作用として、海賊版モデルが増えると思う。合法性を一切無視し、分散型で学習され、重みが企業ではなく集団によって配布されるモデル、たとえばトレントモデルのようなものが出てくるかもしれない。
こうしたモデルが、公式の「お行儀のよい」モデルより性能で上回る可能性もかなりある。今後数年は興味深い展開になりそうだ。
具体的には、ChatGPTは基本的に著作物を再現するのではなく、YouTubeが人々のアップロードした動画を提供するのと同じように、第三者ユーザーの要求や行動によって再現するのだという理屈である。
OpenAIの意図は著作権侵害ではなく、実際、多くの、あるいは大半の研究者は、モデルが任意の著作物のかなりの部分を再現してしまうほど過学習しているとは考えていなかった。
本質的に、巨大企業を後ろ盾に持たない著作権にはほとんど意味がなく、企業が後ろにいれば、本来著作権にあるべき制限とは無関係に永遠に囲い込めてしまう。
OpenAIが古いニュースを原文のまま再現できたとしても、NYTが失うものは何もない。
NYTが勝てば、私たちが失うものは大きい。今こそ著作権を見直すときだ。実際にそうできるし、かなり古びているのだからアップデートが必要だ。
Stable Diffusionは、Control NetやLoRAのようなものを最大限活用すれば、他の独占的モデルを圧倒する。
少し理想主義的かもしれないが、芸術と出版の根本的な目的は大金を稼ぐことだけではなく、文化と社会に影響を与えることであるべきだと私はずっと考えてきた。
だから原作には保護が必要だが、創造性とインスピレーションを後押しするために、もっと早くパブリックドメインに入るべきだと思う。移行期間は数十年ではなく、数年単位で考えるべきだ。
芸術の主たる目的は、個人に感情を引き起こすことだ。芸術が教訓を教えるべきだという考えが、最近あからさまな「活動家」フィクションが多い理由である可能性が高い。
これらはそれほど修正が難しくなさそうに見える。ほとんどの例は一般的な説明ではなく、よく知られた対象を指す短縮表現だ。
「ビデオゲームの配管工」は事実上「Mario」と同義であり、そのキャラクターを少しでも知っている人ならそれが分かる。
同様に、説明ツールで Mario のような画像を説明させたうえで [1]、「ビデオゲームの配管工」と入力した人々からそうした結果を取り除くのは、どれほど難しいだろうか。
インターネット初期に、人々が著作権法違反だとして無料のファンフィクションをなくそうとしたことを思い出す。作者が販売しようとしているわけでもない個人的利用に著作権法を適用しようとするのは、私の観点ではかなり恐ろしい。
50年後を想像してみよう。「ロボット、この私が描いた絵を学校のジオラマ用に切り抜いてくれる?」「もちろんです。」「これもやって。」「エラー: この絵には著作権付き素材が含まれている可能性があるため、処理できません。」
生成系人工知能システムには著作権侵害素材を作れるだけの能力が十分にある。
そして、それを行ってもユーザーに知らせない。
したがって、どんな出力であっても、Web 上の obscure だが依然として保護されている元資料を侵害する可能性があり、その出力を使う誰もが何の警告もなく訴訟リスクにさらされうる。
これは修正が非常に難しい。
わざと侵害コンテンツを作ろうとしているのでなければ、そうした結果を除去したり捨てたりはできるが、問題は人工知能をだましてそうしたコンテンツを作らせようとする人々だ。著作権・商標権のある学習資料をすべて除外しない限り、彼らを止めるのは不可能だろう。
生成系人工知能のもう一つの問題は、記事にもある「DALL-E や ChatGPT のようなシステムは本質的にブラックボックス」だという点だ。
ユーザーや被害者に、人工知能がなぜその判断をしたのかを正確に知る権利がある状況で、人工知能が意思決定に使われたらどうなるのか。ビジネス・法律の観点から、現在の人工知能ソリューションは危険であり、非常に限定的に使うべきだと思う。作った人たちでさえ、人工知能にその選択をさせた正確な情報の断片を示せないからだ。
「columbian coffee logo」と入力して、すでに存在していたブランドロゴが出てきたなら、そのロゴが既存のものだったか確認するために、インターネット全体をリバースエンジニアリングしなければならないのか。
人工知能は着想の出所を示すべきだ。何かから着想を得て創作する人間は、自分が何を使ったのか、そして盗作の線を越えたかどうかを正確に分かっている。だが人工知能の仕組みは、そのようにするにはあまりにも不透明だ。
やるべきことは、出典を明らかにすることだけだと思う。ただしそれは、人工知能企業がデータセットを公開しなければならないことを意味し、そもそも取得すべきでなかった情報や公開してはならない情報まで明るみに出る可能性がある。
私の理解では、生成AIの法的先例は、Googleが公益のために検索インデックスを作る目的でウェブサイトをスクレイピングできるようにしたことと同じです
Googleはウェブサイトのキャッシュ版も表示でき、それは当該サイトの原コンテンツです。Googleが他のウェブサイトのコンテンツを原文のまま表示することを著作権侵害だと言う人はいないでしょう
なので、この主張は弱いと思います。あらゆる文化的参照や人気IP、さらにはあまり有名でないものまで取り除かなければならないなら、AIは役に立たなくなるでしょう
個人的には、生成AIは学習データ内の類似した元資料へのリンクを提供できるべきだと思います。これがAI学習に貢献した人たちに報いる最低限の方法です
生成AIが元資料を作ったウェブサイトとアーティストの両方を殺す方向に進むなら、長期的に持続可能ではないと思います。出典は透明性を高め、ユーザーがそれがハルシネーションかどうかを理解する助けにもなります
人々は自分のコンテンツが学習に使われないようオプトアウトできるべきで、将来のバージョンで削除されたかどうかも確認できるべきです
正直なところ、AI企業は訴訟を避けるために秘密にしているだけです。終末論的なシナリオよりも、こうした領域では規制が役立つと思います
[1]: https://yro.slashdot.org/story/03/07/14/025216/web-caching-g...
[2]: https://www.theguardian.com/technology/2016/apr/27/getty-ima...
どの技術の波にも、クリエイターに時間とお金をかけて元資料を作らせる仕組みがあり、その後でルールが変わってきました
Googleはコンテンツにリーチと新たな市場を約束し、実際にうまく機能しました。その後、スニペット、広告、そして訪問者を元サイトへ送らずに自分の高速道路に留めておくあらゆる仕組みを導入しました
RedditやStack Overflowなどは、スコアやバッジといったゲーミフィケーションやコミュニティによって、ユーザーが元コンテンツを投稿するよう促してきました
いまやAIがこうしたアプローチを揺るがしています。各段階で、元資料を作るインセンティブはますます減っているように見えます。返ってくる報酬がどんどん小さくなっているからです
AIが何の見返りもなく、つまりリーチ・ゲーミフィケーション・コミュニティ・承認可能性もなく、ただ元コンテンツを繰り返すだけなら、いま専門家にはどんなインセンティブが残るのでしょうか?
それは、あなたがコメントを書くのに影響を与えた元資料のリンクを提示できないのと同じです。その回答を生成させたニューロンの重みにはどれだけの学習が入っているのでしょうか? イタリックの使い方と、それが単語の解釈に与える効果はどこで学んだのでしょうか? このフォーラムにふさわしい口調はどこで学んだのでしょうか?
「人々が自分のコンテンツが学習に使われないようオプトアウトできるべきだ」とするなら、私が本を書くときに、あなたはその本を読めないようにオプトアウトできるべきでしょうか? 誰が私の作品を読めるかについて何らかの条件を付けられるべきでしょうか? 宗教? 肌の色? 暗記が苦手な人?
誰が知識を習得できるかを制限するという発想が馬鹿げていると感じてほしいです。だとすれば、同じ制限が「誰」にではなく「何」にかかるとき、なぜ許されるのでしょうか?
AI企業が訴訟を避けるために秘密主義をとることで、研究の障壁が生まれました。私とJoeが同じデータセットで研究や論文を共同で進められる代わりに、学習データを隠すようになっています。ラッダイトたちが機械を壊しに来るのを恐れているからです。学習は、うますぎないときだけ許されるかのようです
しかし、AI学習がフェアユースの4要素テストを実際に満たすかどうかは、まだ見守る必要があります
生成AIにもそれを実装できるべきだという点には同意しますが、その情報を維持するには学習コストがはるかに高くなる可能性があり、AI企業にはそれをやる関心がほとんどありません。おそらく後処理の段階で、起こりうる著作権問題をヒューリスティックに評価しようとする可能性が高いでしょう
さらに興味深い問いは、ほぼ原文そのままの再現を超えて、著作権者が、自分たちの作品が集合的にAIへより一般的な形で影響を与えたことを理由に無断使用を主張できるのか、という点です
生成AIにのみ適用される、より明確な法律が必要です。実在の人との比較や類推が多すぎます
「誰かが商標のある資料を見ながら絵を学び、うっかり似たものを作ったらどうするのか」といった話が出ますが、これらのモデルは人間ではなく、別のカテゴリに属します
こうしたモデルはある程度商標権侵害をすると私は考えますが、同時に許容されるべきだとも思います。最終的な責任は、その画像を一般大衆が消費する独立した媒体として使う人にあるべきです
こうした議論では、モデルは本質ではなく目くらましのように機能しており、議論がそちらに足を取られているように思える
モデルは「責任の連鎖」において、もっともらしい否認可能性を提供している。「LLM」を外して「遊園地の見世物小屋の魔法の箱」に置き換えれば、LLMが何か特別だから例外扱いされる資格があるという主張は、あっという間に消えるはずだ
Betamax判例は、侵害しない相当な用途がある技術は、それ自体では侵害ではないと述べている
すでにAI生成物には著作権保護が生じないという先例があり、同じ論理でAIの生成行為には意図が表現されていない。したがって、侵害かどうかは出力物を使用する人間にかかっているはずだ。ブラックボックス自体には行為主体性がないからだ
LLM、あるいはより一般的に生成手法が somehow 次の大きな波だと結論づける前に、あるいは私たちが「一般」知能のしきい値に来ていると主張する前に、まずその扉を見せるべきだ
その扉とは、箱に何かを入力して反対側から出てくるものを見る娯楽的価値を超えて、実際の問題を解くための産業導入が起きる姿かもしれない。しかし今のところ、私が見る限り実際にそうしたことをしている場所はないように思える