Microsoft、GitHub Copilotを通じたオープンソースの違法複製で提訴される
(bleepingcomputer.com)- 開発者であり弁護士でもあるマシュー・バタリックが、Microsoft、GitHub、OpenAIを提訴
- オープンソースライセンスに違反し、プログラマーの権利を侵害したと主張
- GPL、Apache、MITライセンスなどは著作者名の表示を求めているが、Copilotはこれを無視している
さらに、150文字を超えるコードスニペットがそのまま複製されることさえある - 一部のプログラマーはこれを「オープンソース・ロンダリング(laundering)」と指摘
- 訴訟を担当する法律事務所は「Microsoftはオープンソースライセンスやその他の法的要件の条件を無視し、他人の成果物から利益を得ているように見える」と述べた
- ライセンス違反とは別に、バタリックはこの機能がほかにもいくつかの規定に違反していると主張
- GitHubのTerms of ServiceとPrivacy Policies
- 著作権管理情報の削除を禁じるDMCA 1202
- California Consumer Privacy Act
3件のコメント
結局のところ、open source licenseごとに分けて学習データを利用し、Copilotのオプションで選択可能にする形で解決できそうですね? - ライセンス表記もそれに応じて正確に生成して。すでにそうなっているのでしょうか? 私はCopilotを使ったことがなくて…。
大きな問題ではありますが、解決方法も明確な気がします。
これって、人がコーディングするときにもよく問題になりますよね? たまに会社でXXX仕様について、open sourceの実装(たとえばLinux)のコードを読んでいない人を探すことがあります。(cleanroom実装のために) たまに仕事中にうっかりLinuxコードのリンクを渡すと何か言われることもありますよね - 「そのコード読んじゃだめ!」って。ときには自分がそのコードを読んだことがあったかどうか思い出せなくて困ることもあります。
こういう、人が経験する問題よりは、もっと明確に解決できそうです。
Copilot が発表されたときは..
最初は「うわー」となったのですが、数日後にこうしたライセンス関連の問題があって。
うっかり使っているうちに、意図せず会社の製品コード開発に GPL ライセンスのコードがまとまって入り込んだら大きな問題になり得る、という意見を見たのですが……現実になってしまいましたね。
そのままコピーされるのはちょっと……という感じですね……
だからこそ Explainable AI の分野が活発に議論されているのでしょうね……なぜこういう結果になったのかを説明できる AI。
Copilot でそれができるなら、結果に関与したオープンソースコードをコメントとして追加することで、かなりの部分で論争を避けられる気がするのですが……