Google検索、大規模なスパム攻撃に圧倒される
- Googleの検索結果はここ数日スパム攻撃を受けており、完全に制御不能な状態になっている。
- 多くのドメインが数十万件のキーワードごとに順位を獲得しており、この攻撃の規模は数百万件のキーワードフレーズに及ぶ可能性がある。
Googleのアルゴリズムはどのように悪用されるのか
- スパムサイトは、Googleがウェブサイトをランキングする方法にある少なくとも3つの隙を利用しているように見える。
- スパムサイトが上位表示される検索クエリは競争が低く、順位を取りやすい。
- ローカル検索アルゴリズム、ロングテールキーワード、そして新規登録ドメインが利用できる隙がある。
- 新しいサイトは、Googleのアルゴリズムがそのサイトを把握している間の短い期間、検索クエリで順位を獲得しやすい利点を持つ。
リンクはGoogleがスパムサイトを見つける助けになる
- Bill HartzerがMajesticのバックリンクツールを使って複数のスパムサイトのリンクネットワークを明らかにした投稿を通じて、この事実が知られることになった。
- バックリンクネットワークの構築には多くの労力が費やされていたが、リンク自体が高順位を決定する主因ではない。
- リンクはGoogleが新しいスパムサイトを発見し、クロールし、最終的にランキングするのを助ける。
Google SERPsで制御不能なスパム
- 複数のサイトが、順位を取りやすいロングテールフレーズやローカル検索要素を含むフレーズで上位表示されている。
- ロングテールの概念はほぼ20年前から存在し、2006年に出版された"The Long Tail"という本によって広く知られるようになった。
- スパムサイトは競争の少ないフレーズで順位を獲得でき、これを利用して短時間で数十万件のキーワードに対して上位表示されている。
スパムページの見た目
- スパムページをブラウザで直接訪問することはできない。
- スパムサイトは別のドメインへ自動リダイレクトされる。
- GoogleのRich Resultsテスターを使ってスパムサイトにアクセスし、ページのHTMLを記録した。
1つのドメインが300,000件以上のキーワードで順位を獲得
- Billが送ったスプレッドシートには、あるスパムサイトが順位を獲得したキーワードフレーズの一覧が含まれていた。
- そのスパムサイトは300,000件以上のキーワードフレーズで順位を獲得していた。
このスパム手法が有効な理由
- ローカル検索は、非ローカルのアルゴリズムとは異なるアルゴリズムを使っている。
- ローカル検索アルゴリズムは、ローカル系サイトが順位を獲得できるよう、より寛容に設計されている。
- Googleは少なくとも12月19日の時点でこのスパム問題を認識しており、Danny Sullivanのツイートで確認できる。
GN⁺の見解
- この記事で最も重要なのは、Google検索結果が大規模なスパム攻撃に脆弱であり、検索エンジンの信頼性に影響を与えうる点だ。
- スパム攻撃が効果的なのは、Googleアルゴリズムの特定の弱点を突いているためであり、Googleがアルゴリズム改善を進める必要性を浮き彫りにしている。
- この記事が興味深いのは技術的な側面だけでなく、Googleのような大手テック企業であっても依然として予期しない問題に直面しうることを示しているからだ。
7件のコメント
Googleのスパム報告用ウェブ文書です。スパムを報告する際、
abc.abc.uk/trashasdaのようなドメインであればabc.ukとして報告し、abc.abc.uk/sitemap.xmlを問題を正確に把握できる検索語に入れて報告するとよいです。すでにソリューションとして固められたウェブで、一般ユーザーがアクセスするとすぐに派生文書を再生成する構造になっているようです。対処方法としては積極的に報告するのが適切で、Googleで押された分だけ再びスパムページが作られ、google.com/urlimage.google.com/urlnaver redirectなどのようにボットがアクセスするよう仕向けて、また生成されたスパムページへ移動する過程があるので、押さずにリンクだけを取って報告すれば大丈夫です。google.com/urlと明示してリダイレクトするアルゴリズムが撤廃されない限り、現在の問題は今後も続くと見られます。(スパム、スパムウェブ文書の報告)
上記のスパム対策ソリューションに該当するウェブ文書を報告する場合、
全5つの欄のうち、1つ目にはメインドメイン、追加の4つのURLにはそこから派生して作られた文書の一覧を記入するのが適切で、さらにそのドメインのサイトマップを検索語に入れるのが望ましいです。サイトマップを開いてみると、
/new/asdasdのようにアクセスした瞬間に生成されるような戦略を取っており、報告文書を作成すると結局Googleが閲覧する際に逃げる文書を追加で生成するよう仕組まれている巧妙な相手なので、ドメイン自体を報告する必要があります。私の場合
(h は x に、/ は | に置き換えました)
xttp:||baddomain.com
xttp:||baddomain.com/blogs
xttp:||baddomain.com/blogs/asdasd1
xttp:||baddomain.com/asdasd1
xttp:||baddomain.com/asdasd2
このように通報書を作成した後、
サブドメインから腐っているやつなら、
site:*baddomain.comこのキーワードでこんなふうに通報書を書いて送ります。
その後、サイト自体が完全にスパム的なら、フィッシングサイト通報書も一緒に送ります.
それらのスパムWebサイトのソフトウェアには皮肉にもタグマネージャーが連携されており、https://picsum.photos のようなサイトが使われているにもかかわらず、インデックス登録は正常に行われています。これはGoogleが審査していないことを意味します。スパム活動が通常の範囲を超えているにもかかわらず、スパムWebページ + AdWords広告が付いている状態であれば、いくら通報しても広告流入数のぶんだけ派生文書がすぐに作られます。スパムWebサイトがタグマネージャーを普通に使っているという点がぞっとします。
1か月にわたってスパム報告を出し続けていますが、スパム文書・詐欺文書として通報しつつ、フィッシングサイト通報ページでも一緒に報告していただけると、より早く整理されます。該当ページも入力しますが、最上位ドメインが
abc.abc.ukならabc.ukと入力していただくことで、ドメイン自体の整理に役立ちます。ウェブマスターにとっては宿題のような日常になってしまいました。ただでさえGoogleは以前から検索結果の質が全体的に低下しているのが目に見えていましたが、このように短期間で大量の攻撃を受ければ、多くの人がGoogleの検索結果をさらに信頼できなくなるでしょう。
Hacker Newsの意見
スパムサイトがGooglebotのIPアドレスを確認している
Kagi検索エンジンへ切り替えたユーザーの体験
単純な質問に答えるために、過剰な量のテキストを提供するサイトが増えている
Google検索結果の品質低下に関する観察
検索エンジンそのものへの疑問
Googleの検索エンジンアルゴリズム変更への指摘
Googleがオーガニック検索を放棄したという主張
Google検索エンジンの限界に関する指摘
Bingへの切り替え体験の共有
広告会社としてのGoogleの振る舞いへの批判