6 ポイント 投稿者 GN⁺ 2026-02-23 | 1件のコメント | WhatsAppで共有
  • uBlock OriginでAIが生成したコンテンツファームサイトをブロックするための公開ブラックリストプロジェクト
  • 生成AIが作成したWebサイトは、広告や推薦リンクで埋め尽くされ、信頼できない情報を含むことが多い
  • ユーザーはlist.txtファイルを購読するか、URLを直接追加してブロックリストを適用できる
  • AI生成サイトの特徴と識別基準が具体的に示されており、コントリビューターのPull Requestを通じてリストを拡張できる
  • 検索結果の上位に表示されるAIコンテンツ汚染問題を減らすための実用的なツールとして活用できる

プロジェクト概要

  • AI uBlock Blacklistは、uBlock Origin拡張機能で利用できるAI生成コンテンツのブロックリストを提供
  • 生成AIが作成したWebサイトを閲覧中に見つけるたび、手動でリストに追加
  • 自動化ツールは使用しておらず、AI生成かどうかをアルゴリズムで判定するのが難しいためと明記している

プロジェクトの目的

  • 生成AIが作成したWebサイトは、有用な情報に乏しく、広告・推薦リンクで収益化を狙う構造になっている
  • AIが作成したコンテンツは、検証なしに大量投稿され、危険な情報を含む可能性がある
    • 例として、回路の短絡、rm -rf /コマンドの実行、漂白剤とアンモニアの混合など、危険な助言を示す可能性に言及
  • こうした理由から、AI生成コンテンツは信頼できず、ブロックが必要としている
  • 作成者はイタリア国籍のため、イタリア語サイトが多数含まれており他言語サイト追加への貢献も歓迎している

Webサイトの追加方法

  • 技術知識のないユーザーは、GitHub Issueを通じて疑わしいサイトを報告できる
  • Pull Requestで直接追加する場合、ドメイン単位または特定ブログのパス単位でブロックできる
    • 例: ||example.com/@slopUser^$doc または ||example.com^$doc 形式
  • SEOやデジタルマーケティングサービスを販売する組織が複数のコンテンツファームを運営している場合、関連サイトをあわせて追加することを推奨

AIコンテンツファームの識別基準

  • 不要な導入と結論「Comprehensive Guide」など誇張されたタイトル外部リンク・出典の欠如推薦リンクの多さ
  • 短期間で数千件の投稿誤情報(ハルシネーション)2022年11月以降の投稿AI生成画像・ロゴ
  • 体裁の粗いテキストレンダリングされていないMarkdown記法主題と無関係な長文検索上位への反復表示
  • 連絡先の欠如曖昧な紹介ページAIを賛美するコンテンツなども主要な特徴として挙げられている

Google Dorksの活用

  • AIが生成した文章をそのままコピーして掲載している場合、特定のフレーズ検索でAIページを発見できる
    • 例: "Sure! Here's an article about"(英語), "Certo! Ecco un articolo"(イタリア語)
  • こうしたフレーズを含むページは、ドメイン全体をブラックリストに追加

類似プロジェクト

  • uBlockOrigin & uBlacklist Huge AI Blocklistプロジェクトは、AI関連の結果をすべて非表示にする
  • 本プロジェクトは、正常なAIツールは維持しつつ、AIコンテンツファームのみをブロックする点で差別化されている

1件のコメント

 
GN⁺ 2026-02-23
Hacker News の意見
  • このアイデアは興味深く、私もリストに貢献しようと思ったが、FAQ の 「Cry about it」 という文言を見てやめた
    こういう態度は公開ブラックリストを運営するやり方として不適切だと思う。メンテナが自分は 無謬 だと信じているかのような印象を受ける

    • 私の個人ウェブサイトでも似たことがあった。友人たちがアクセスできないと言うのでサーバーの問題かと思ったが、PiHole のある ブロックリスト に私のサイトが入っていた
      解除を依頼したが何の返答もなく、今もまだブロックされたままだ
    • こうした異議申し立てはまるで VAC バン解除申請 のようで信用しにくいと見る人もいる
    • こういう態度では、このプロジェクトが 5年後も維持 されている可能性は低いと思う。こういうものは Easylist のような実績あるチームが担うべきだ
    • 「個人用 uBlock Origin リスト」 であることを忘れるな、という意見もあった
    • ただ、今は修正されたようだ。関連コミットは こちら で確認できる
  • もう少し現実的なアプローチとして、コンテンツファーム や低品質サイトだけをブロックする新しいリストが登場した
    従来の広範な AI ブロックリストより良い代替案に見える
    uBlockOrigin-HUGE-AI-Blocklist を参照
    Reddit でも 関連議論 が活発だ

    • 既存のリストは単なる ヘイトリスト に近いと感じる。AI コンテンツを公然と運営しているサイトまで含まれている
    • ウェブサイト一覧がスプレッドシートで整理されているのは興味深い。以前 SEO で埋め尽くされたメディアグループの事例を見て、似たサイトを探して uBlacklist に追加したことがある
      私の gist に検索過程と一覧を共有している
    • ただしこのリストは 5か月間更新がない
    • 両方のリストを追加したという人もいた
  • 時間がたつほど 誤検知の問題 は深刻になる。ドメインが売られたり、サイトが方向転換したり、コンテンツが削除されたりもする
    「Cry about it」 のような態度では、ただの 名誉毀損ブラックホール になるだけだ。少なくとも 期限切れや再レビューの仕組み は必要だ

  • uBlock Origin にはすでに「AI widget」ブロックリストがある。この機能のおかげで今でも Firefox を使っている。Chromium では役に立たない

  • 原則には同意するが、「AI で文章を書くのはスキル不足だ」というような態度は Grammarly ユーザー や非英語話者に不公平だ

    • 「Skill issue」 と呼ばれた集団が不満を持たなかったことはない
    • 私はむしろ AI 生成テキスト より、拙い英語の文章や翻訳調の文章のほうが人間的で多様に感じる
      いずれにせよ、このプロジェクトは個人の書き手ではなく コンテンツファーム を狙っているので論点が違う
    • しかしこの作成者はドメインの所有権が変わっても リストから削除しない。たとえば Whitehouse.com は昔はポルノサイトだったが今はそうではない
    • 英語がよく分からないなら、ただ 機械翻訳 を使えばいいという意見もあった
    • 私は仕事で Grammarly を使っているが、ブランドガイドラインを守るためだ。AIっぽい文体に変えるためではない。
      作成者は AI ボットファーム を狙っているようだ
  • それでも、インターネットに ホワイトリスト ができたわけではまだない

    • アプリ中心の時代が終わり、その危機は過ぎ去った
  • 文章が AI によって書かれたかを トロープベースで判定 し、元のプロンプトを復元するツールを使っている
    tropes.fyi/aidr

  • こういう方向性は良い。もっと多様な サイトカテゴリ別ブロック ができるようになってほしい
    企業環境では URL レピュテーションサービスを通じてサイトを分類し、アクセスを制御している
    個人ユーザーにもこうした クラウドファンディング型インフラ が必要だと思う
    たとえばブラウザ、VPN、DNS、メール、認証局など、信頼できるエコシステムのために年間 10 億ドル規模の非営利ファンドがあればいいと思う

  • botblock.ai のように、Twitter で AI の返信を検出する拡張機能もある

    • ただし「そもそも Twitter を使わないほうがいい」という反応もあった
    • 実際にはあまりうまく動いていないようだ。たとえば明らかな AI アカウントを 100% 人間 と判定している
      証拠画像
    • Twitter はすでに有料アカウントが上位表示される $8 広告プラットフォーム になってしまった
  • 私は広告が多すぎると、そのサイトを閉じてしまうほうだ。広告の構成が妥当ならそのまま使う
    アドブロック戦争 にうんざりしている。毎回新しいプラグイン名が出てきて、終わりのない競争のように感じる

    • 問題は、広告がしばしば マルウェア流入経路 になることだ