7 ポイント 投稿者 GN⁺ 2024-09-24 | 2件のコメント | WhatsAppで共有
  • Cloudflareは、Webサイト所有者がAIモデル提供事業者に対して自サイトのコンテンツをスクレイピングするアクセス権を販売できるマーケットプレイスを来年立ち上げる計画を発表
  • このマーケットプレイスは、Cloudflare CEOのMatthew Princeによるより大きな構想の最終段階であり、パブリッシャーがAIボットによるWebサイトのスクレイピング方法と時期をより適切にコントロールできるようにするもの
  • その第一段階として、Cloudflareは無料のobservabilityツールであるAI Auditを公開
    • Webサイト所有者には、AIモデルがサイトをどの程度の頻度でスクレイピングしているかの分析を確認できるダッシュボードが提供される
    • AI Auditを通じて、Webサイト所有者はAIボットをブロックしたり、特定のWebスクレイパーを許可したりできる
    • AI Auditのデモでは、Webサイト所有者が各スクレイパーの発信元を確認でき、OpenAI、Meta、AmazonなどのAIモデル提供事業者がサイトをどの程度の頻度で訪れているかを見られる選択ウィンドウも提供される
  • AI業界の課題への対応
    • AIモデル提供事業者は、何千もの小規模Webサイトをスクレイピングし、LLMを動かす情報源として利用している
    • ほとんどのWebサイトは何の対価も受け取っておらず、これは多くのWebサイトのビジネスモデルを壊しかねない
    • Cloudflareは、Webサイト所有者がAIボットをブロックできるボタンを公開
  • 顧客要件の反映
    • Cloudflareの顧客は、どのAIモデルがサイトにアクセスできるかを選択できるツールを求めていた
    • Cloudflareの新しいツールは、一部のAIクローラーをブロックしつつ、他のクローラーは許可できるようにする
  • マーケットプレイスの目標
    • Cloudflareのマーケットプレイスは、小規模なパブリッシャーがAIモデル提供事業者と取引できるようにする
    • Webサイトはスクレイピング料金を設定したり、AI研究所にクレジットを要求したりできる
  • AIエコシステムへの影響
    • 現在、一部のAI企業がコンテンツに対してまったく費用を支払っていない状況は持続可能ではない
    • CloudflareのCEOは、このマーケットプレイスが最終的にAIエコシステムにとって良いものになると考えている

GN⁺のまとめ

  • Cloudflareは、Webサイト所有者がAIモデル提供事業者に対して自サイトのコンテンツをスクレイピングするアクセス権を販売できるマーケットプレイスを立ち上げる計画を発表
  • AI Auditツールにより、Webサイト所有者はAIモデルがサイトをどの程度の頻度でスクレイピングしているかを分析できる
  • このマーケットプレイスは、小規模なパブリッシャーがAIモデル提供事業者と取引できるようにし、コンテンツに対する対価を得られるようにする
  • これはAIエコシステムの持続可能性を高めることに寄与する可能性がある

2件のコメント

 
yangeok 2024-10-01

趣旨は良いですね

 
GN⁺ 2024-09-24
Hacker Newsの意見
  • Common Crawl は OpenAI や Anthropic とともに「Providers」一覧に含まれている

    • Common Crawl は AI 学習以外にもさまざまな用途で使われている
    • Wayback Machine の主要なコンテンツソースである
    • Common Crawl プロジェクトの目的は、複数の企業が個別にクローラーを運用する代わりに、Common Crawl がデータを収集して標準形式で提供することにある
    • Cloudflare がコンテンツへのアクセスを制限すると、大きな影響が出る可能性がある
    • ほとんどのウェブサイトがセキュリティ製品を使ってアクセスを制限する世界が来るかもしれない
  • OpenFoodFacts、OpenStreetMap、Wikipedia は DDoS 攻撃を受けている

    • データは無料でダウンロードできるにもかかわらず、ボットがあらゆるものをスクレイピングしている
    • その結果、不要なトラフィックが発生し、コストが増加している
    • これは著作権の問題ではなく、ボットの非効率さと運営者の無関心が原因である
    • 解決策が必要である
  • クローリングを防ぐことは無意味な作業かもしれない

    • この機能は、すでに大量のデータをクロールした大手プレイヤーをさらに強化する可能性がある
    • 誤検知や過剰な CAPTCHA によってユーザーに影響が出る可能性がある
  • Cloudflare は新しい方法で濫用から保護するサービスを提供している

    • Cloudflare は濫用者と協力して「マーケットプレイス」を形成している
    • Cloudflare のサービスを使わなければ濫用は続くだろう
    • これはみかじめ料を要求する行為に似ているかもしれない
  • World Wide Web の未来への疑問

    • 永遠に続くように思えたが、いつかは IRC のように消えていくかもしれない
    • 黄金時代はすでに過ぎ去っており、「AI」は終わりの始まりかもしれない
  • Cloudflare ブログでさらに詳しい情報を確認できる

    • AI Audit のデモでは、ウェブサイト所有者が AI モデルにサイトがどのようにスクレイピングされているかを確認できる
    • OpenAI、Meta、Amazon などのスクレイパーがサイトを訪れた回数を確認できる
  • AI Audit を使った Bingeclock の例

    • Cloudflare の発表後 48 時間の興味深い変化
    • 支払いプログラムは興味深いが、トラフィック減少によってウェブサイトが非効率になる可能性がある
    • AI スクレイパーは最低限の支払いしかしない可能性が高い
  • 次の段階: 生成 AI を使ってコンテンツを生成し、Cloudflare がそれをスキャンするたびに支払いを受け取る

  • 同じサイトを繰り返しスクレイピングするのは大きな無駄である

    • Cloudflare が変更点や更新を管理できれば、多くのリソースを節約できる
    • サイトが変更点を Cloudflare に直接知らせ、Cloudflare がそれを AI に伝える
    • AI が変更点を購入し、Cloudflare がサイトに支払い、マージンを維持する