5 ポイント 投稿者 GN⁺ 2025-11-14 | 1件のコメント | WhatsAppで共有
  • AI生成スパムとコンテンツファームによって汚染されたウェブ環境を浄化するため、Kagi Searchが**コミュニティ参加型検出システム「SlopStop」**を導入
  • SlopStopは、検索結果内に**AI生成テキスト・画像・動画のリアルタイムな「AI slopスコア」**を表示し、ユーザーが低品質コンテンツを直接報告できる仕組み
  • ドメイン単位の自動順位引き下げAI生成メディアのフィルタリング機能を通じて、信頼性の高い情報の露出を強化
  • SlopStopは**「Small Web」プロジェクト**と連携し、人間中心のクリエイターと真正性のあるコンテンツを優先表示
  • Kagiはこれにより、世界最大規模のAI slopデータセット構築を目指しており、今後はAIハルシネーション・虚偽情報防御技術に活用する予定

AI Slopの定義とKagiの対応

  • AI slopとは、検索順位の操作や注目獲得を目的に生成された欺瞞的または低価値なAIコンテンツを意味
    • 例として、偽レビュー、虚偽の専門性、誤情報、収益目的のコンテンツファームなどが含まれる
  • KagiはAI自体を排斥しているわけではないが、人間の洞察やつながりを代替する形のAIコンテンツは有害だと明示
  • Kagiの哲学は**「人間が主導権を持つ検索体験」**であり、広告・トラッカー中心の低品質ページをすでに順位引き下げしてきた
  • SlopStopは既存の画像フィルターを拡張し、動画・記事・ドメインなど全領域のAI生成物を検出

SlopStopの仕組み

  • 検索結果にAI slopスコア表示機能が追加され、ユーザーはコンテンツの信頼性を即座に確認可能
  • ユーザーはウェブ・画像・動画の検索結果で**「AI生成物として報告」**機能を通じて低品質コンテンツを通報可能
    • Kagiは独自シグナルでこれを検証した後、AIコンテンツ比率の高いドメインを自動的に順位引き下げ
    • 混在ドメインの場合は、個別ページにのみAI生成表示を付与
  • AI生成画像・動画は確認次第ラベル付けと自動順位引き下げが行われ、ユーザーはAIメディア完全ブロックフィルターを選択可能
  • CEOのVladは、「AI slopは人間中心のインターネットに対する実存的脅威であり、SlopStopはそれを除去するための第一歩だ」と述べた

SlopStopとSmall Webの結合

  • AIの発展速度は速いが、SlopStopとSmall Webはともに人間中心のウェブ生態系の回復を目標としている
  • Small Webは検証済みの人間クリエイターのホワイトリストを構築し、真正性のあるコンテンツを優先表示
  • SlopStopがAIコンテンツをふるい落とすほど、創造的で人間らしいコンテンツの可視性が高まる
  • 両システムは商業化と人為的汚染からインターネットを守る二重防御体制として機能

AI Slopデータセットの構築と活用

  • SlopStopはKagiエコシステム全体の信頼性強化フェーズとして、コミュニティ通報と内部検出技術を組み合わせ、世界最大のAI slopドメインデータセット構築を目指す
  • このデータセットは、AIハルシネーション・虚偽主張・誤情報防止のための検出技術の開発に活用される予定
  • KagiはNewsGuardの調査結果を引用し、他のチャットボットの30〜41%が虚偽の応答を生成すると述べた
  • データベースは今後公開予定であり、関心のあるユーザーは登録を通じて更新を受け取ることができる

ユーザー参加と品質保護

  • Kagiはクラウドソーシング型のSlopStop運用を通じて、自動化された最終ソリューションの開発を進める
  • ユーザーは検索結果横の盾アイコンをクリック → 「AI生成物として報告」を選択することで参加可能
  • すべての通報はKagiのレビュー担当チームが確認後に反映され、検索品質の改善に寄与
  • SlopStop関連の技術文書とフォーラムを通じて、仕組みとフィードバックチャネルを提供
  • Kagiは「すべてのユーザーの参加がより信頼できる検索体験を作る」と強調

1件のコメント

 
GN⁺ 2025-11-14
Hacker Newsのコメント
  • 本当に興味深いニュースだ。HNもこれを参考にして、同様のフラグを追加してほしい
    • @freediver にデータベースアクセスを依頼した。近いうちに hcker.news に統合される予定だ。
      Kagiのコミュニティ中心のアプローチが気に入っている。公開されている Small Web リスト は本当に有用だ。
      HNで smallweb フィルター を適用すると、メインページがかなり新鮮になる
    • 同意する
  • HNにもこういうものが必要だ。高度なスパムメールのようなコンテンツからの安全な避難所があればいいのに
    • 解決策は簡単だ。すべてのコメントに対して人間認証を要求すればいい。たとえば、コメントごとに血を一滴ずつ提出する、とか
  • ドキュメントでは画像、動画、そして「ウェブページ」スロップを区別しているが、ウェブページのスロップだけを別に積極的にフィルタリングする方法があるのか気になる。
    ときどき洞察に富んだ文章なのに、AIが作ったヘッダー画像を付けていることがある。本文が本物なら、そういう記事まで弾きたくはない。ドキュメントの分類でこうした細かなフィルタリングが可能になるのか気になる
  • 自分の持っている理論を研究してくれる賢い人がいてほしい。人間が書いたコンテンツとLLMが書いたコンテンツのエントロピー差を学習させることが、検出の核心かもしれない。
    たとえば「Will Smithがスパゲッティを食べるテスト」のように、本物のシーンと生成されたシーンのエントロピーを比べれば、違いは明確に見える気がする。結局のところ「本物らしく見える」というのは、私たちが期待するエントロピーの水準と合っているという意味だ
    • AIスロップがAIスロップを解決できるとは思わない。広告・アテンション経済はすでにスロップ化していて、AIはそれをさらに露呈させただけだ。
      AIがエントロピーを人為的に高くするのは簡単だ。結局は情報戦になり、人々がその被害者になるだろう
    • 実際、それが「AI検出器」の基本原理だ。人間生成かLLM生成かを分類するよう訓練されたモデルだが、みんな知っている通り精度はひどい
    • そうした試みはすでに存在する。画像では拡散モデルのアーティファクトのおかげで通用するが、テキストではうまくいかない。
      テキストは情報密度が高すぎるし、GPT系モデルはむしろ君の言うエントロピーを最小化するように学習されている
    • 実写写真とAI生成写真の見分けには通用するかもしれないが、テキストではエントロピーはそれほど重要ではないと思う。
      しかもAIもいくらでもその検出を欺くように学習できる
    • 「Will Smithスパゲッティテスト」は冗談だと思っていたが、検索してみたら本当にあった。驚いた
  • インターネットは死んではいないが、妙な臭いがし始めている
  • Kagiの有料ユーザーになって1年になる。これまで使ったお金の中で最も価値のある出費だった。
    最近Google検索を使ってみたが、本当にひどかった。
    私は静かなインターネットがほしい — 問いかければ答えてくれて、意図も広告もなく、誠実な答えだけがある空間を
  • スケーラブルなアプローチは結局AIにAIを識別させることになるのではないかと思う。もちろん人間のレビューは必須だが。
    たいていの人は、プロンプトで「デフォルトの声」から外れたAIテキストを見分けられない気がする
    • 次世代モデルは、AIだと分類されたサンプルを学習データから除外しながら進化していくだろう。
      こうした循環は続いていき、GAN(Generative Adversarial Network) の構造に似たものになる
    • AIにAIを捕まえさせるのは、「善いAIが悪いAIに勝つ」という類のアラインメント問題の幻想に近い。可能性はあるが、あまりに多くの仮定に依存している
    • AIがAIを検出できるなら、もう解決しているはずの問題だ。信頼性の欠如が核心だ
    • プロンプトを慎重に扱えば、検出が難しいテキストを作ることはできる。
      しかし実際のウェブには依然としてAIスロップがあふれている。
      私は事実性が重要な情報を探すことが多いので、AI検出の有無よりも情報源の信頼性のほうが重要だ。
      結局のところ、誰が自分の名前や評判を懸けて書いたのかが核心だ
  • 今の世界は二つの宇宙に分かれているように思える。一つは生成コンテンツを無理やり押し込む宇宙、もう一つはそれを徹底的に拒絶する宇宙だ。
    一部のCEOたちがなぜここまで固執するのか分からない。人々は人工的なコンテンツを嫌っているのに、彼らはなお執着している
    • YouTubeにはAI生成コンテンツを楽しむ巨大な視聴者層が存在する。
      たとえば この動画この動画 はどちらもGPTが書いたスクリプト、AIイラスト、AI音声で作られている。
      RedditでもGPTが書いた投稿が上位に来て、人々は「美しい比喩だ」と褒めている。
      結局、多くの人はAIコンテンツを意識せず楽しんでいる
    • CEOたちの固執の大半は、取締役会とウォール街の圧力によるものだ。実際にはLLMを使ったこともない人たちが、市場シグナルに反応しているだけだ
    • 完全なサンクコストの罠と成長への強迫だ。論理よりも流行と投資家の焦りが支配している
    • KagiもLLMを完全に排除しているわけではない。実際、ニュース要約にはLLMを使っている。
      関連イシュー を見ても分かる通り、経済的効率性のために完全排除は難しい
    • クリエイターがAI使用を開示しなければならないなら、私はそれをフィルタリングする権利を持つべきだ。
      今では本物のコンテンツを見つけるのがあまりに難しい。
      問題はAIコンテンツそのものというより、丁寧に作るクリエイターたちが埋もれる環境にある
  • 今の状況はまるでAIが自分自身とチェスをしている試合のようだ。
    検出はさらに精巧になり、AIはさらに巧妙になる。終わりのない検出対回避の決闘が続いている
  • 「スロップ戦争が始まった」
    検索結果におけるAIスロップの氾濫を防ごうとするあらゆる試みを応援する。
    昔のSEOスパムが戻ってきたようなものだ。ただ、包装が変わっただけだ
    • 今回はずっと深刻だ。昔のSEOスパムは人が見ればすぐ区別できたが、今は見た目だけは完璧なゴミがあふれている。
      他の検索エンジンがこれを好む理由は、自分でコンテンツを作らなくても入口としての役割を強化できるからだ
    • 皮肉なことに、AIコンテンツを最も嫌っている集団はSEO業界だ。
      AI要約が彼らのクリック誘導型コンテンツを置き換えつつあるからだ。
      もしかすると、こうしたフィルタリング運動の背後には彼らがいるのかもしれない