13 ポイント 投稿者 laeyoung 2021-08-02 | 12件のコメント | WhatsAppで共有
  • Copilotは、GPT-3をベースに作られたCodexをサービス化したもの

  • GitHubにある5,400万個のリポジトリから抽出した159GBのデータセットで学習を実施

  • 164個のベンチマークデータセットを作成し、Codexはそのうち28.8%を解決

  • LeetCodeの問題のようなアルゴリズム問題が得意

    -> GitHubにはアルゴリズム問題の解答を載せたリポジトリが多く、それを学習したためだと考えられる

    広告

GeekNewsにCopilot関連の投稿がいくつか上がっていました。

今回、会社の方がCopilot関連の記事を書くことになったのですが、Copilot Previewアカウントを持っているのが私だけだったので、私のコンピュータで少し手伝いました。

広告

テストしてみて驚いたのは、コーディング問題を3つ入れてみたところ、すぐに通る答えが出てきたことです。

そのうち1つはBaekjoonにあった問題を翻訳機にかけて入力したのに、正解が出ました。

オンラインコーディングテストで不正目的に使う人もいそうだな、という気が…

私がVSCodeに入れて1か月使ってみた結論は、

  • なんとなく分かる程度の言語や環境で開発するときに使うと良い。

    広告

    -> React開発で e.target.value を受け取って何かする必要があったのですが、20文字ほどの提案が出たのでTabを押して自動補完したら、思い通りに動きました。

    -> もちろん疑っていたのでStackOverFlowで確認してみましたが、提案された内容は正確でした。

  • よく知っている言語や環境では、提案が最適ではないので気になることがある。

  • Inferenceのためにコードが送信されるはずだが大丈夫だろうか?という心配はあるものの、ファイル1つ1つに入っているコードをどうこうされるわけでもないだろう、という気持ちでそのまま使っています。

12件のコメント

 
ruinnel 2021-08-03

https://www.youtube.com/watch?v=a9349pRiCRk

こういう意見もあるようです。

これを見て、私は急に関心が薄れました。

 
budlebee 2021-08-03

コードの著作権についてあまり詳しくないのですが、著作権で保護されているコードを変数名だけ変えたり、関数名を変えたりして少しだけ修正して使う場合でも、ライセンス違反になるのでしょうか?

 
dalinaum 2021-08-05

はい。違反です。

 
ruinnel 2021-08-03

コードが完全に同一かどうかというより……コードの出所がどこなのか? が、コード著作権では重要な要素なのではないかと思います。

MIT や Apache ライセンスの場合は、持ってきて変更して使っても大きな問題にはならないでしょうが……

Copilot が推薦したコードが GPL ライセンスを持つコードと同一のコードを推薦していて……

開発者がコードの一部を修正して開発中のプロジェクトに含めたとすると……

GPL ライセンス上は、そのプロジェクトはソースコード全体を公開しなければならないのではないかと思うんですよね。

GPL ライセンスのコードを使うと、それを使った全体のコードを公開しないと GPL ライセンス違反になると認識しています。

極端な例をひとつ仮定の話として書いてみると……

会社でソリューションを開発していて、開発者が Copilot を使っていたところ、運悪く推薦されたコードが GPL ライセンスを持つところのコードを AI が学習してそのまま吐き出したものだとしたら……会社のソリューションのコード全体を公開するかどうか、という問題が生じるのではないかと思います。

 
budlebee 2021-08-03

気になるのですが、では copilot が吐き出したコードをユーザーが少し修正して使った場合、それを見つけ出す方法はあるのでしょうか? 同じ I/O、同じ機能でもさまざまなスタイルのコードが出てくるはずですが、そうしたコードの盗用はどうやって見つけるのか気になります(音楽の盗作訴訟のように、リファレンスと相互に比較する方法論があるのでしょうか?)

 
ruinnel 2021-08-03

そうですね。類似性をどう検証して、どこまでを同じコードと見なすのか、その判断基準は私にもよくわからないですね(笑)

 
laeyoung 2021-08-03

関連する投稿がGeekNewsにも上がっていました

https://ja.news.hada.io/topic?id=4659

そのYouTube動画では著作権の話をしていますが、肝心の動画内にある資料映像(ニュース、アニメなど)について出典や著作権の明記がないのを見ると、本当に難しい問題だなと思います……

 
ruinnel 2021-08-03

ご指摘の動画にあるニュース/漫画に対する著作権は…それを書いた当事者(動画を制作・配布した人)が責任を負えばいい問題ですが…

Copilotを使っていて著作権に抵触するコードが自分のコードに含まれてしまったら、という問題なんですよね。

自分はツールを使っただけなのに、自分が開発したプログラムが著作権訴訟に巻き込まれることになるわけですから。

 
yeop2 2021-08-02

私も使ってみたいのですが、いつ頃割り当ててもらえるのか… (泣)

 
ktseo41 2021-08-02

+1 ずっと待っていますね

 
cog25 2021-08-02

GitHubをたくさん使うほど、より早く提供されると認識しています。

 
laeyoung 2021-08-02

どういうわけか、昨年コロナの影響で急いで作ったRepoがStarを100個以上もらうことになったのですが。 そのせいなのか、私はCopilotもそうですしGitHub Codespaceもそうですし、申し込むとわりとうまく選ばれるんですよね。