5 ポイント 投稿者 GN⁺ 2024-05-10 | 1件のコメント | WhatsAppで共有

Stack OverflowとOpenAIのパートナーシップ発表に対するユーザーの反発

  • Stack OverflowとOpenAIが最近パートナーシップを発表したことに対し、一部のユーザーが反発している
  • 一部のユーザーはStack Overflowで自分のコンテンツ(質問と回答)を削除しようとしたが、Webサイト上で簡単に削除できず、困難に直面した
  • そのため該当ユーザーたちは、Stack OverflowとOpenAIの協力に抗議するため、自分の質問や回答を編集して「破壊」することに決めた

Stack OverflowとOpenAIパートナーシップの概要

  • Stack OverflowとOpenAIは、新しいAPIパートナーシップを通じて協力することになった
  • この協力は、Stack Overflowの膨大な知識プラットフォームとOpenAIの高度なAIモデルを組み合わせて開発者に提供することを目的としている
  • OpenAIユーザーは、OverflowAPIへのアクセスを通じてStack Overflowの正確で検証済みのデータを活用し、より速い問題解決が可能になり、優先度の高い作業に集中できるようになる
  • またOpenAIは、ChatGPTにStack Overflowの検証済み技術知識を統合し、ユーザーが信頼できる情報やコードへアクセスしやすくする予定である

AIに対する反発

  • Stack OverflowをはじめとするStack ExchangeのWebサイト群はコミュニティにとって非常に有用なツールだが、自分のコンテンツがAI学習に使われ、出典表示なしで回答提供に利用されることについて、一部のユーザーはあまり歓迎していない
  • これは今日のStack Overflowに限らず、インターネット全体でコンテンツ制作者によく見られる反応である
  • 現在のインターネットは、ブログトラフィックやページビューの減少、AIを使った回答検索の増加、一部の人々による検索エンジン利用の減少など、変化の時期を迎えている
  • ChatGPTやその他のLLM(大規模言語モデル)の新機能への適応と、これらすべてが私たちの知るインターネットにとって何を意味するのかという不確実性が同居する、緊張の時期でもある
  • Stack OverflowとOpenAIのパートナーシップに対する最近の反発は、人々がAIの大規模採用とそれに伴う急激な変化に否定的に反応する一例にすぎない

Stack Overflowはコンテンツ削除によってアカウントを停止しているのか?

  • 複数のユーザーがTwitterやHacker Newsに投稿し、以前にStack OverflowのWebサイトへ投稿した質問や回答を複数削除しようとした後、Stack Overflowモデレーターからアカウントが7日間保留または一時停止されたというメールを受け取ったと報告している
  • Stack Overflowのモデレーションチームのメールによれば、他人にとって有用であり得るコンテンツを削除または除去することは、たとえそのコンテンツが作者本人にとってもはや有用でなくても、コミュニティ全体に混乱をもたらし得る
  • Stack OverflowのビジネスとStack Exchangeネットワーク全体は、Webサイトが有用性を維持するためにユーザー生成コンテンツに依存しているため、ユーザーが大量にコンテンツを除去することを望まないビジネス上の理由は明らかである
  • Stack Overflowがアカウント停止や警告メール送信を行うのは、おそらく新しいことではない。プラットフォームを守るため、このようなポリシーを長年実施してきた可能性が高い
  • ユーザーが大量のコンテンツを簡単に破壊または削除できれば、プラットフォームに相当な混乱を与え得るため、コンテンツを保護することはStack Overflowとコミュニティ双方の最善の利益にかなっている
  • また、これはユーザーの行動によってトリガーされた自動メールである可能性が高く、コンテンツについてStack Overflowに直接連絡することが適切な対応となるだろう
  • これまでのところ、こうしたアカウント停止に関するStack Overflowの回答は確認されていない。また、実際にこれを試みているユーザーがどの程度いるのかも不明であり、Stack OverflowとOpenAIのパートナーシップに対する大きな反発は存在しないのかもしれない
  • AI導入の前進モメンタムは当面鈍化しそうにないため、今後これがどのように展開していくのかを見守るのは興味深い
  • 残りのStack Overflowユーザーに対しては、抗議の意思表示として自分のコンテンツを削除することは推奨されていない

GN⁺の意見

  • Stack OverflowとOpenAIのパートナーシップは、AI技術の発展と開発者コミュニティに大きな影響を与えるとみられる。しかし、個々の開発者の知的財産権保護とAI学習データとしての活用の間で、どのようにバランスを取るかは解決すべき課題である
  • 開発者は自らの知識を共有しつつ、それに対する正当な報酬を受けられるべきである。Stack Overflowには、そのための適切な報酬体系を整備する必要がありそうだ
  • 開発者が自発的に知識を共有するよう促すには、コミュニティに対する信頼が非常に重要である。今回の事態によってStack Overflowに対する開発者の信頼が損なわれないよう、慎重なアプローチが必要だとみられる
  • 一方で、ChatGPTなどのAI技術を活用した開発生産性向上は、開発者にとっても大きなメリットがある。個人情報保護などAI技術活用の副作用を最小化しつつ、利点を最大化できる方策を模索していく必要があるだろう
  • 類似の論点として、GitHub Copilotをめぐる著作権論争があった。開発者コミュニティ内で活発な議論を重ね、誰もが納得できる合意点を見いだしていく努力が必要だとみられる

1件のコメント

 
GN⁺ 2024-05-10
Hacker Newsの意見
  • Stack Overflowのユーザーコンテンツのライセンス変更問題:
    • 約5年前、Stack Overflowはユーザーが投稿したすべてのコンテンツをCC-BY-SA 4.0で提供すると誤って宣言した。元のユーザー契約はCC-BY-SA 3.0だった。
    • 2018年半ばから2019年初頭まで、コードと非コードに適用されるライセンスに混乱があった。
    • 2019年初頭、ユーザーに再ログインして新しいライセンス契約を受け入れるよう求めた。
    • 現在は2018年5月5日以前のコンテンツにはCC-BY-SA 3.0、それ以降にはCC-BY-SA 4.0が適用される。
  • Stack OverflowのAIスクレイパーおよびOpenAIへの提供問題に関するユーザー意見:
    • 自分の回答がAI学習に使われることを気にしないユーザーもいる。ChatGPTのようなツールに大きな価値を与えると考えている。
    • OpenAI提携はユーザーによるコンテンツ削除問題の核心ではない。ライセンス上、コンテンツ削除は歓迎されず、たいてい差し戻されてきた。
    • CC-BY-SAライセンスのため、Stack Overflowが許可しなくても他者が複製でき、コンテンツ削除は難しい。
    • ユーザーは名前を削除したり個人情報を編集したりはできるが、質の高いコンテンツ自体を後から取り除くことはできない。
  • 営利企業が「無料」製品を運営することの問題:
    • 収益を上げる必要があるため、オープンソース倫理には縛られない。ユーザーはオープンソースに貢献しているつもりでも、実際はそうではない。
    • Stack Exchangeの行為はおそらく合法だが、貢献者はステークホルダーではなく、商業的に持続可能な水準の貢献者だけを維持すればよい。
    • 無料で提供される製品では、ユーザー自身が製品になる。どう収益化されているかを知らなければ、いつか失望することになる。
  • AI学習に特化した新しいコンテンツライセンスの必要性:
    • 商用AI学習に使われたコンテンツについて、AIの重みの公開を求めるなど、GPLの精神を持つライセンスが登場する可能性。
  • Stack Overflowのデータセット販売モデル:
    • そもそもStack Overflowはユーザー中心ではなく、SEO向けデータセット構築に注力してきた。OpenAIとの取引で大きく変わったわけではない。
    • LLMの登場でStack Overflowの危機は避けられないため、崩壊前にOpenAIに売って得られるものを得たほうがよい。
  • CC BY-SAライセンスのShareAlike条項の重要性:
    • 派生物を作る場合は同一ライセンスで配布しなければならないという条項は非常に広範で曖昧だ。「build upon」の定義は多くのユーザーにとって魅力的でないかもしれない。
  • LLMとStack Overflowの長所・短所の比較:
    • LLMのおかげで、できるだけStack Overflowを避けられるようになった。Stack Overflowはエリート主義と、実質的な助けより手続きを重視する有害さに満ちている。
    • LLMが時々間違った回答をすることへの不満はあるが、Stack Overflowの回答にも完全に誤っていたり質問と無関係だったりするものが多い。古い回答も多い。
    • LLMの文章生成能力とStack Overflowユーザーの検証が組み合わされれば理想的だろう。単にインターネット上のポイント獲得が目的の人には都合が悪いかもしれないが、ユーザーにとっては最高だ。
  • コンテンツ大量削除に対するStack Overflowの自動警告メッセージ:
    • 少なくとも2017年から存在していたようで、大量削除を検知すると自動表示されるらしい。
    • Stack Overflowはフォーラムというよりウィキに近い面があるため、このような方針の理由は理解できる。OpenAI反対デモを鎮めるために導入されたものではなさそうだ。
  • 個人的には、この2年間ほとんどStack Overflowを使っていないという意見もある。