ウェブボットを認識する方法 101
(antoinevastel.com)行動の認識:
-
サーバー側: セッションあたりのページ数、リクエスト数、ページごとの時間差
-
クライアント側: マウス移動 / クリック / スクロール / キー入力の時間差
フィンガープリントの認識:
-
Passive TCP や TLS
-
ブラウザー: ヘッドレスブラウザー(PhantomJS、Puppeteer など)の特定の属性を確認、UA と実際が異なるかを確認。Red Pills(VM 環境かどうかの確認)
そして最後は、CAPTCHA
3件のコメント
やはり最後のが一番手っ取り早いですね
この記事で指摘されていることもすぐに解決したボットが出てきそうですね(笑)
UA が本物かどうかを確認する部分が面白いですね。
eval.toString().lengthを呼び出したとき、FF と Safari は 37、Chrome は 33、IE は 39 を返すのでUA が送ってきた情報が本当にそのブラウザのものかを確認して、両者が違えばボットだということです。