1 ポイント 投稿者 GN⁺ 2023-08-26 | 1件のコメント | WhatsAppで共有
  • ウェブスクレイピングをめぐる法的な複雑さと偽善についての記事
  • MetaやMicrosoftのような大企業が、自社プラットフォームではウェブスクレイピングを禁止しながら、同時に他社プラットフォームからデータを収集しているあり方
  • インターネット上のデータにアクセスし利用することをめぐる法的問題と、その目的の複雑さ。著作権やその他の知的財産権で保護されるデータの形態もあるが、インターネット上のデータの大半は容易には保護されない
  • LinkedInやFacebookのようなソーシャルメディア企業が、ウェブスクレイピング訴訟を最も攻撃的に追及している。しかし彼らが守ろうとしているコンテンツはユーザーが生成したものであり、彼ら自身の財産ではない
  • インターネット初期には、企業はウェブスクレイピングを動産侵害として止めるための法理を用いていた。つまり、望まれない大量のデータ要求は個人の有体財産、すなわちコンピューターサーバーへの侵入にあたると主張した
  • 2000年代初頭から2017年まで、Computer Fraud and Abuse Act (CFAA) がウェブスクレイピングを防ぐ主要な法理だった。CFAAは「保護されたコンピューター」への無断アクセスを禁じている
  • 2017年のhiQ Labs, Inc. v. LinkedIn Corp.事件では、ウェブスクレイパーがCFAAの下で公開LinkedInデータにアクセスする権利が確認され、これを公開データをスクレイピングできる積極的な権利だと解釈する人も多くなった
  • 現在、ウェブスクレイピングを止める主な方法は、契約違反の主張を通じたものになっている。これにより企業は契約法を通じて、データの使用およびアクセスに対する財産権を主張できるようになっている
  • 財産法から契約法への移行によって、ウェブサイト所有者はオンライン利用規約を通じてオンラインデータに対する権利を定義できるようになった
  • Microsoftのような企業の偽善を強調する記事。最近、AIサービスによるスクレイピングを禁止する利用規約に更新した一方で、その関連会社であるOpenAIは、インターネット全体をスクレイピングするよう設計された製品を公開した
  • 著者は、裁判所が私企業に対して付合契約を通じて知的財産権を生み出すことを許している点を批判し、こうした判断は公共の利益に関わる問題であるべきだと主張している
  • 記事は、現在のウェブスクレイピングをめぐる法的体制が生成AIの事例によって試されるだろうと示唆しており、法の一貫性は維持できず、今後数年のうちに重要な法的発展が起こると予測している

1件のコメント

 
GN⁺ 2023-08-26
Hacker Newsの意見
  • 最近のAIとLLMの競争は、Webスクレイピングへの懸念を高めており、主要なテック業界の人物や企業は認識された脅威に対する防御を強化している。
  • データスクレイピングをめぐる恐怖を和らげるためには、商用AIアプリケーションに対する新たな著作権解釈が必要だ。
  • HiQ対LinkedIn事件はWebスクレイピングの議論で頻繁に引用されるが、事件の詳細は複雑で、しばしば見過ごされる。
  • データをスクレイピングしながら自社データのスクレイピングを禁じる企業の、見かけ上の偽善は、矛盾ではなく競争戦略として理解できる。
  • 財産法から契約法への移行により、Webサイト所有者は自らの権利を定義できるようになり、その結果、大企業による一方的な「契約」が広がった。
  • Microsoftがインターネットをスクレイピングするよう設計された製品を公開しながら、同時にスクレイピングを禁止した最近の事例は、企業の偽善の例として指摘された。
  • Webスクレイピングは、特にその規模の大きさゆえにビジネスモデル上の問題と見なされており、広告収益に依存する無料コンテンツ提供者は、広告を迂回するスクレイピングによって脅かされている。
  • Facebookのようなプラットフォームにおけるユーザー生成コンテンツの所有権は複雑で、ユーザーは所有権を保持しつつ、プラットフォームに広範な利用権を与えている。
  • Webスクレイピングに対する法的障壁は一般に有害と見なされているが、スパムメールのようにスクレイピングによる悪影響を経験した個人もいる。