- AI生成スパムとコンテンツファームによって汚染されたウェブ環境を浄化するため、Kagi Searchが**コミュニティ参加型検出システム「SlopStop」**を導入
- SlopStopは、検索結果内に**AI生成テキスト・画像・動画のリアルタイムな「AI slopスコア」**を表示し、ユーザーが低品質コンテンツを直接報告できる仕組み
- ドメイン単位の自動順位引き下げとAI生成メディアのフィルタリング機能を通じて、信頼性の高い情報の露出を強化
- SlopStopは**「Small Web」プロジェクト**と連携し、人間中心のクリエイターと真正性のあるコンテンツを優先表示
- Kagiはこれにより、世界最大規模のAI slopデータセット構築を目指しており、今後はAIハルシネーション・虚偽情報防御技術に活用する予定
AI Slopの定義とKagiの対応
- AI slopとは、検索順位の操作や注目獲得を目的に生成された欺瞞的または低価値なAIコンテンツを意味
- 例として、偽レビュー、虚偽の専門性、誤情報、収益目的のコンテンツファームなどが含まれる
- KagiはAI自体を排斥しているわけではないが、人間の洞察やつながりを代替する形のAIコンテンツは有害だと明示
- Kagiの哲学は**「人間が主導権を持つ検索体験」**であり、広告・トラッカー中心の低品質ページをすでに順位引き下げしてきた
- SlopStopは既存の画像フィルターを拡張し、動画・記事・ドメインなど全領域のAI生成物を検出
SlopStopの仕組み
- 検索結果にAI slopスコア表示機能が追加され、ユーザーはコンテンツの信頼性を即座に確認可能
- ユーザーはウェブ・画像・動画の検索結果で**「AI生成物として報告」**機能を通じて低品質コンテンツを通報可能
- Kagiは独自シグナルでこれを検証した後、AIコンテンツ比率の高いドメインを自動的に順位引き下げ
- 混在ドメインの場合は、個別ページにのみAI生成表示を付与
- AI生成画像・動画は確認次第ラベル付けと自動順位引き下げが行われ、ユーザーはAIメディア完全ブロックフィルターを選択可能
- CEOのVladは、「AI slopは人間中心のインターネットに対する実存的脅威であり、SlopStopはそれを除去するための第一歩だ」と述べた
SlopStopとSmall Webの結合
- AIの発展速度は速いが、SlopStopとSmall Webはともに人間中心のウェブ生態系の回復を目標としている
- Small Webは検証済みの人間クリエイターのホワイトリストを構築し、真正性のあるコンテンツを優先表示
- SlopStopがAIコンテンツをふるい落とすほど、創造的で人間らしいコンテンツの可視性が高まる
- 両システムは商業化と人為的汚染からインターネットを守る二重防御体制として機能
AI Slopデータセットの構築と活用
- SlopStopはKagiエコシステム全体の信頼性強化フェーズとして、コミュニティ通報と内部検出技術を組み合わせ、世界最大のAI slopドメインデータセット構築を目指す
- このデータセットは、AIハルシネーション・虚偽主張・誤情報防止のための検出技術の開発に活用される予定
- KagiはNewsGuardの調査結果を引用し、他のチャットボットの30〜41%が虚偽の応答を生成すると述べた
- データベースは今後公開予定であり、関心のあるユーザーは登録を通じて更新を受け取ることができる
ユーザー参加と品質保護
- Kagiはクラウドソーシング型のSlopStop運用を通じて、自動化された最終ソリューションの開発を進める
- ユーザーは検索結果横の盾アイコンをクリック → 「AI生成物として報告」を選択することで参加可能
- すべての通報はKagiのレビュー担当チームが確認後に反映され、検索品質の改善に寄与
- SlopStop関連の技術文書とフォーラムを通じて、仕組みとフィードバックチャネルを提供
- Kagiは「すべてのユーザーの参加がより信頼できる検索体験を作る」と強調
1件のコメント
Hacker Newsのコメント
Kagiのコミュニティ中心のアプローチが気に入っている。公開されている Small Web リスト は本当に有用だ。
HNで smallweb フィルター を適用すると、メインページがかなり新鮮になる
ときどき洞察に富んだ文章なのに、AIが作ったヘッダー画像を付けていることがある。本文が本物なら、そういう記事まで弾きたくはない。ドキュメントの分類でこうした細かなフィルタリングが可能になるのか気になる
たとえば「Will Smithがスパゲッティを食べるテスト」のように、本物のシーンと生成されたシーンのエントロピーを比べれば、違いは明確に見える気がする。結局のところ「本物らしく見える」というのは、私たちが期待するエントロピーの水準と合っているという意味だ
AIがエントロピーを人為的に高くするのは簡単だ。結局は情報戦になり、人々がその被害者になるだろう
テキストは情報密度が高すぎるし、GPT系モデルはむしろ君の言うエントロピーを最小化するように学習されている
しかもAIもいくらでもその検出を欺くように学習できる
最近Google検索を使ってみたが、本当にひどかった。
私は静かなインターネットがほしい — 問いかければ答えてくれて、意図も広告もなく、誠実な答えだけがある空間を
たいていの人は、プロンプトで「デフォルトの声」から外れたAIテキストを見分けられない気がする
こうした循環は続いていき、GAN(Generative Adversarial Network) の構造に似たものになる
しかし実際のウェブには依然としてAIスロップがあふれている。
私は事実性が重要な情報を探すことが多いので、AI検出の有無よりも情報源の信頼性のほうが重要だ。
結局のところ、誰が自分の名前や評判を懸けて書いたのかが核心だ
一部のCEOたちがなぜここまで固執するのか分からない。人々は人工的なコンテンツを嫌っているのに、彼らはなお執着している
たとえば この動画、この動画 はどちらもGPTが書いたスクリプト、AIイラスト、AI音声で作られている。
RedditでもGPTが書いた投稿が上位に来て、人々は「美しい比喩だ」と褒めている。
結局、多くの人はAIコンテンツを意識せず楽しんでいる
関連イシュー を見ても分かる通り、経済的効率性のために完全排除は難しい
今では本物のコンテンツを見つけるのがあまりに難しい。
問題はAIコンテンツそのものというより、丁寧に作るクリエイターたちが埋もれる環境にある
検出はさらに精巧になり、AIはさらに巧妙になる。終わりのない検出対回避の決闘が続いている
検索結果におけるAIスロップの氾濫を防ごうとするあらゆる試みを応援する。
昔のSEOスパムが戻ってきたようなものだ。ただ、包装が変わっただけだ
他の検索エンジンがこれを好む理由は、自分でコンテンツを作らなくても入口としての役割を強化できるからだ
AI要約が彼らのクリック誘導型コンテンツを置き換えつつあるからだ。
もしかすると、こうしたフィルタリング運動の背後には彼らがいるのかもしれない