Playwrightのボット検知を回避するスキル
(github.com/greekr4)Playwrightでサイトにアクセスすると、ボット検知にすぐブロックされることがよくあります。ネット上に出回っている「ステルス」スニペットを試してみたところ、ものによってはむしろさらに検知されやすくなりました。そこで8種類の検知器で直接計測し、実際に通過した組み合わせだけを選んでスキルにしました。
インストール / 使用方法
- インストール:
npx skills add greekr4/playwright-bot-bypass - 使用:
playwright-bot-bypassを呼び出す
少し意外だった点
- よく使われる
navigatorの偽装(偽のプラグイン・キャンバスノイズ・webdriverの削除など)は、本物のChromeと微妙に一致せず、かえって検知シグナルになります。1つは実際のChromeでクラッシュまで起きました - そのため偽装はすべて外し、本物のChrome(headed)に任せたうえで、Playwrightの痕跡2つだけを除去しました(
__pwInitScriptsの除去 + rebrowserのCDPリーク遮断) - 結論は「飾り立てないほど、かえって検知されにくい」でした
フィードバック歓迎です — 特に「この検知器は突破できなかった」といった報告をいただければ反映します。
まだコメントはありません。