1 ポイント 投稿者 GN⁺ 2023-12-24 | 7件のコメント | WhatsAppで共有

Google検索、大規模なスパム攻撃に圧倒される

  • Googleの検索結果はここ数日スパム攻撃を受けており、完全に制御不能な状態になっている。
  • 多くのドメインが数十万件のキーワードごとに順位を獲得しており、この攻撃の規模は数百万件のキーワードフレーズに及ぶ可能性がある。

Googleのアルゴリズムはどのように悪用されるのか

  • スパムサイトは、Googleがウェブサイトをランキングする方法にある少なくとも3つの隙を利用しているように見える。
  • スパムサイトが上位表示される検索クエリは競争が低く、順位を取りやすい。
  • ローカル検索アルゴリズム、ロングテールキーワード、そして新規登録ドメインが利用できる隙がある。
  • 新しいサイトは、Googleのアルゴリズムがそのサイトを把握している間の短い期間、検索クエリで順位を獲得しやすい利点を持つ。

リンクはGoogleがスパムサイトを見つける助けになる

  • Bill HartzerがMajesticのバックリンクツールを使って複数のスパムサイトのリンクネットワークを明らかにした投稿を通じて、この事実が知られることになった。
  • バックリンクネットワークの構築には多くの労力が費やされていたが、リンク自体が高順位を決定する主因ではない。
  • リンクはGoogleが新しいスパムサイトを発見し、クロールし、最終的にランキングするのを助ける。

Google SERPsで制御不能なスパム

  • 複数のサイトが、順位を取りやすいロングテールフレーズやローカル検索要素を含むフレーズで上位表示されている。
  • ロングテールの概念はほぼ20年前から存在し、2006年に出版された"The Long Tail"という本によって広く知られるようになった。
  • スパムサイトは競争の少ないフレーズで順位を獲得でき、これを利用して短時間で数十万件のキーワードに対して上位表示されている。

スパムページの見た目

  • スパムページをブラウザで直接訪問することはできない。
  • スパムサイトは別のドメインへ自動リダイレクトされる。
  • GoogleのRich Resultsテスターを使ってスパムサイトにアクセスし、ページのHTMLを記録した。

1つのドメインが300,000件以上のキーワードで順位を獲得

  • Billが送ったスプレッドシートには、あるスパムサイトが順位を獲得したキーワードフレーズの一覧が含まれていた。
  • そのスパムサイトは300,000件以上のキーワードフレーズで順位を獲得していた。

このスパム手法が有効な理由

  • ローカル検索は、非ローカルのアルゴリズムとは異なるアルゴリズムを使っている。
  • ローカル検索アルゴリズムは、ローカル系サイトが順位を獲得できるよう、より寛容に設計されている。
  • Googleは少なくとも12月19日の時点でこのスパム問題を認識しており、Danny Sullivanのツイートで確認できる。

GN⁺の見解

  • この記事で最も重要なのは、Google検索結果が大規模なスパム攻撃に脆弱であり、検索エンジンの信頼性に影響を与えうる点だ。
  • スパム攻撃が効果的なのは、Googleアルゴリズムの特定の弱点を突いているためであり、Googleがアルゴリズム改善を進める必要性を浮き彫りにしている。
  • この記事が興味深いのは技術的な側面だけでなく、Googleのような大手テック企業であっても依然として予期しない問題に直面しうることを示しているからだ。

7件のコメント

 
devstudyman7 2024-03-09

Googleのスパム報告用ウェブ文書です。スパムを報告する際、abc.abc.uk/trashasda のようなドメインであれば abc.uk として報告し、abc.abc.uk/sitemap.xml を問題を正確に把握できる検索語に入れて報告するとよいです。すでにソリューションとして固められたウェブで、一般ユーザーがアクセスするとすぐに派生文書を再生成する構造になっているようです。対処方法としては積極的に報告するのが適切で、Googleで押された分だけ再びスパムページが作られ、google.com/url image.google.com/url naver redirect などのようにボットがアクセスするよう仕向けて、また 生成された スパムページへ移動する過程があるので、押さずにリンクだけを取って報告すれば大丈夫です。google.com/url と明示してリダイレクトするアルゴリズムが撤廃されない限り、現在の問題は今後も続くと見られます。

 
devstudyman7 2024-03-09

上記のスパム対策ソリューションに該当するウェブ文書を報告する場合、
全5つの欄のうち、1つ目にはメインドメイン、追加の4つのURLにはそこから派生して作られた文書の一覧を記入するのが適切で、さらにそのドメインのサイトマップを検索語に入れるのが望ましいです。サイトマップを開いてみると、/new/asdasd のようにアクセスした瞬間に生成されるような戦略を取っており、報告文書を作成すると結局Googleが閲覧する際に逃げる文書を追加で生成するよう仕組まれている巧妙な相手なので、ドメイン自体を報告する必要があります。

 
devstudyman7 2024-03-09

私の場合
(h は x に、/ は | に置き換えました)

xttp:||baddomain.com
xttp:||baddomain.com/blogs
xttp:||baddomain.com/blogs/asdasd1
xttp:||baddomain.com/asdasd1
xttp:||baddomain.com/asdasd2

このように通報書を作成した後、

サブドメインから腐っているやつなら、site:*baddomain.com
このキーワードでこんなふうに通報書を書いて送ります。

その後、サイト自体が完全にスパム的なら、フィッシングサイト通報書も一緒に送ります.

 
devstudyman7 2024-03-09

それらのスパムWebサイトのソフトウェアには皮肉にもタグマネージャーが連携されており、https://picsum.photos のようなサイトが使われているにもかかわらず、インデックス登録は正常に行われています。これはGoogleが審査していないことを意味します。スパム活動が通常の範囲を超えているにもかかわらず、スパムWebページ + AdWords広告が付いている状態であれば、いくら通報しても広告流入数のぶんだけ派生文書がすぐに作られます。スパムWebサイトがタグマネージャーを普通に使っているという点がぞっとします。

 
devstudyman7 2024-03-09

1か月にわたってスパム報告を出し続けていますが、スパム文書・詐欺文書として通報しつつ、フィッシングサイト通報ページでも一緒に報告していただけると、より早く整理されます。該当ページも入力しますが、最上位ドメインが abc.abc.uk なら abc.uk と入力していただくことで、ドメイン自体の整理に役立ちます。ウェブマスターにとっては宿題のような日常になってしまいました。

 
aobamisaki 2023-12-24

ただでさえGoogleは以前から検索結果の質が全体的に低下しているのが目に見えていましたが、このように短期間で大量の攻撃を受ければ、多くの人がGoogleの検索結果をさらに信頼できなくなるでしょう。

 
GN⁺ 2023-12-24
Hacker Newsの意見
  • スパムサイトがGooglebotのIPアドレスを確認している

    • Googlebotだと確認されると、そのページでコンテンツを表示する
    • それ以外の訪問者は、不審なコンテンツのある別ドメインへリダイレクトされる
    • 以前のGoogleは、Googlebotと一般ユーザーに異なるコンテンツを見せるサイトを許可しておらず、違反時には大きなペナルティを課していた
    • このポリシーはなくなったが、自動化ツールがうまく機能するなら、今でも有効かもしれない
  • Kagi検索エンジンへ切り替えたユーザーの体験

    • ときどき良い検索結果を得にくいことはあるが、Googleでも結果がより良いわけではない
    • ユーザーはドメインを「ブースト」したり「ピン留め」したりして、検索結果を個人の好みに合わせて調整している
    • GmailやGoogle Mapsなど、ほかのGoogleサービスは今でも使っているが、検索はもう使っていない
  • 単純な質問に答えるために、過剰な量のテキストを提供するサイトが増えている

    • 実際の答えはページ下部にある
    • 表面的には関連性があるように見えるが、実際には一般的な内容にすぎない
  • Google検索結果の品質低下に関する観察

    • この傾向がいつから始まったのかははっきりしないが、長い間十分な注目を集めてこなかった可能性がある
    • スパム攻撃は最後の段階なのかもしれない
  • 検索エンジンそのものへの疑問

    • ウェブクローリングに基づく単一目的の検索エンジンという概念は消えるかもしれない
    • 特定の目的に合った複数のシステムでGoogleを置き換えるほうがよい可能性がある
    • たとえば技術的な質問はStackOverflowやGithubで直接検索し、地域の場所検索は信頼できるデータベースで検索する、といった形だ
    • 検索エンジンはLLM(大規模言語モデル)を活用して検索タイプを推測し、キュレーションされた特化型検索へ誘導する方向に進化するかもしれない
  • Googleの検索エンジンアルゴリズム変更への指摘

    • Googleはときどきアルゴリズムを変更し、サイトの順位に影響を与える
    • こうした変更により、特定のクエリでは低品質な結果が上位に来ることがある
    • 以前は、SEO関連サイトでこうしたアルゴリズム更新を監視し議論することが重要だった
  • Googleがオーガニック検索を放棄したという主張

    • SEOに詳しいユーザーでさえ、Google検索結果の順位がなぜ決まるのか理解しづらい
    • Googleは有料結果の価値を高め、ユーザーが有料広告をクリックするよう誘導している
  • Google検索エンジンの限界に関する指摘

    • 特定のものを探すときには役立つが、それ以外ではBing、ChatGPT、Phindなどを使っている
    • ユーザーのゲームはBingやほかの検索エンジンでは上位結果に表示されるが、Googleではスパム広告サイトが優先される
  • Bingへの切り替え体験の共有

    • ChatGPTを活用したBingの進化によって、Googleの代わりにBingを使い始めた
    • 完璧ではないが、Googleと比べるとより満足のいく結果を提供している
  • 広告会社としてのGoogleの振る舞いへの批判

    • 新しいGmailアカウントを作り、誰にも知らせていないにもかかわらず、スパムメールを受け取った
    • Googleが自社のメールアドレス一覧を販売していると推測するのは合理的だ