- ウェブスクレイピングをめぐる法的な複雑さと偽善についての記事
- MetaやMicrosoftのような大企業が、自社プラットフォームではウェブスクレイピングを禁止しながら、同時に他社プラットフォームからデータを収集しているあり方
- インターネット上のデータにアクセスし利用することをめぐる法的問題と、その目的の複雑さ。著作権やその他の知的財産権で保護されるデータの形態もあるが、インターネット上のデータの大半は容易には保護されない
- LinkedInやFacebookのようなソーシャルメディア企業が、ウェブスクレイピング訴訟を最も攻撃的に追及している。しかし彼らが守ろうとしているコンテンツはユーザーが生成したものであり、彼ら自身の財産ではない
- インターネット初期には、企業はウェブスクレイピングを動産侵害として止めるための法理を用いていた。つまり、望まれない大量のデータ要求は個人の有体財産、すなわちコンピューターサーバーへの侵入にあたると主張した
- 2000年代初頭から2017年まで、Computer Fraud and Abuse Act (CFAA) がウェブスクレイピングを防ぐ主要な法理だった。CFAAは「保護されたコンピューター」への無断アクセスを禁じている
- 2017年のhiQ Labs, Inc. v. LinkedIn Corp.事件では、ウェブスクレイパーがCFAAの下で公開LinkedInデータにアクセスする権利が確認され、これを公開データをスクレイピングできる積極的な権利だと解釈する人も多くなった
- 現在、ウェブスクレイピングを止める主な方法は、契約違反の主張を通じたものになっている。これにより企業は契約法を通じて、データの使用およびアクセスに対する財産権を主張できるようになっている
- 財産法から契約法への移行によって、ウェブサイト所有者はオンライン利用規約を通じてオンラインデータに対する権利を定義できるようになった
- Microsoftのような企業の偽善を強調する記事。最近、AIサービスによるスクレイピングを禁止する利用規約に更新した一方で、その関連会社であるOpenAIは、インターネット全体をスクレイピングするよう設計された製品を公開した
- 著者は、裁判所が私企業に対して付合契約を通じて知的財産権を生み出すことを許している点を批判し、こうした判断は公共の利益に関わる問題であるべきだと主張している
- 記事は、現在のウェブスクレイピングをめぐる法的体制が生成AIの事例によって試されるだろうと示唆しており、法の一貫性は維持できず、今後数年のうちに重要な法的発展が起こると予測している
1件のコメント
Hacker Newsの意見