5 ポイント 投稿者 GN⁺ 2024-07-10 | 1件のコメント | WhatsAppで共有
  • 2022年11月、開発者らがGitHub、Microsoft、OpenAIを相手取り集団訴訟を提起
  • CopilotがGitHubでホストされているオープンソースソフトウェアを無断で使用し、コードスニペットを提供していると主張
  • MicrosoftはGitHubの所有者であり、CopilotはOpenAIの生成系機械学習技術を用いて動作している
  • 訴訟の進行状況
    • 訴訟当初は22件の主張で始まったが、その大半は棄却
    • 最近の判決では、DMCA第1202条(b)に関する主張など3件の主張が棄却
    • 現在残っているのは、オープンソースライセンス違反と契約違反に関する2件の主張
  • 裁判所の判断
    • Copilotが提供するコードは元の著作物と十分に類似していないと判断
    • Copilotはコードスニペットを提供する際に著作権管理情報を削除していないと認定
    • DMCA第1202条(b)の主張は証拠不足により棄却
  • 双方の不満
    • 原告側は被告側が文書提出を遅らせていると主張
    • 被告側は原告側が過度な情報を要求していると反論
    • OpenAIはメール請求の手続きが適切に行われていないと主張
  • GitHubの立場
    • "AIがソフトウェア開発のあり方を革新すると確信しており、Copilotは関連法令を順守していると考えている"
    • "AIベースの開発者体験のために継続的に投資し、責任ある形で革新を進めていく"

GN⁺のまとめ

  • この記事はGitHub Copilotに関連する著作権訴訟の進行状況を扱っている
  • Copilotがオープンソースコードを無断使用したという主張の大半は棄却された
  • AI技術がソフトウェア開発に与える影響と、それに伴う法的問題を理解する助けになる
  • 類似機能を持つプロジェクトとしては、Tabnine、Kiteなどがある

1件のコメント

 
GN⁺ 2024-07-10
Hacker Newsの意見
  • GitHubのプログラミング支援ツールは、著作権侵害を避けるためにコードを変形しているという意見がある
  • 人間が著作権のあるコードを改変して新しいコードだと主張すれば、法的問題が生じるだろうという意見がある
  • 機械が同じことをした場合、何が違うのかという疑問が提起されている
  • Copilotが同一のコードを生成できるという主張はあるが、証拠不足のため訴訟は棄却された
  • 一部の開発者は、自分のコードがLLMの学習に使われることを望んでいない
    • 新しいライセンスが必要になるかもしれない
    • オープンソースへの貢献をやめる可能性もある
    • Microsoftがオープンソース開発からの大規模な離脱を引き起こすのではないかという懸念がある
    • 学習データを汚染するために、役に立たないコードを公開する可能性もある
  • Microsoft社員がSlackを使いながらTeamsを押し付けてくることへの不満がある
  • MSとOpenAIが勝てば、誰かが流出したソースコードを使ってLLMを学習させることまで合法化されかねないという懸念がある
  • 「強大なRedmondの力に立ち向かう数人の開発者」という表現への不満がある
    • 小さい側が常に正しいわけではないという意見がある
  • Copilotが同一のコードを生成できるという主張については、証拠不足が問題だという意見がある
    • 証拠としてスクリーンキャプチャ動画を使えたはずだという意見がある
  • Microsoftがあらゆるコードを利用しながら、自社のコードだけは除外したことは疑わしいという意見がある
  • モデルが本質的に重複を生成するよう訓練されているという問題を指摘している
    • それをAIと呼んでも著作権の問題は解決しないという意見がある
    • 法的に保有している情報で学習させるべきだという意見がある
  • AI学習を禁止するFOSSライセンスの修正版へ移行すべきかどうかという議論がある
    • non-ai-licensesを使えば、Copilotの学習データに含まれないようにできる
    • 次のプロジェクトでこうしたライセンスを使う予定だ