3 ポイント 投稿者 GN⁺ 2026-03-16 | 1件のコメント | WhatsAppで共有
  • Chrome DevTools MCP サーバーが、コーディングエージェントがアクティブなブラウザーセッションに直接接続できるよう改善
  • この機能により、エージェントはログイン済みセッションを再利用したり、DevTools のアクティブなデバッグセッションにアクセスしたりできる
  • Chrome M144(ベータ)で**--autoConnect オプション**を使用すると、MCP サーバーが実行中の Chrome インスタンスに自動接続
  • 接続のたびにユーザー承認ダイアログが表示され、デバッグ中は「自動化されたテストソフトウェアによって制御中」のバナーが表示される
  • 手動デバッグと AI 支援デバッグを自由に切り替えられるため、開発効率が向上

Chrome DevTools MCP サーバー改善の概要

  • Chrome DevTools MCP サーバーが、コーディングエージェントがアクティブなブラウザーセッションに直接接続できるようアップデート
    • ユーザーはログイン済みセッションを再利用できるため、追加のログインなしでデバッグ可能
    • DevTools UI のNetwork パネルElements パネルで選択した項目を、エージェントに調査させるよう依頼可能
  • 従来の接続方式も維持され、MCP サーバー専用プロファイルの使用、リモートデバッグポート接続、一時プロファイルベースの複数インスタンス実行が可能

動作の仕組み (How it works)

  • Chrome M144(現在ベータ)にリモートデバッグ接続要求機能が追加
    • MCP サーバーが --autoConnect オプション付きで実行されると、アクティブな Chrome インスタンスに自動接続し、リモートデバッグセッションを要求
  • セキュリティ強化のため、Chrome はリクエストのたびにユーザー承認ダイアログを表示し、承認後にのみ接続を許可
  • デバッグセッションが有効になると、ブラウザー上部に**“Chrome is being controlled by automated test software”** バナーが表示

はじめに (Get started)

  • 新しいリモートデバッグ機能を使うには、Chrome でリモートデバッグを有効にし、MCP サーバーを設定する必要がある

Step 1: Chrome でリモートデバッグを設定

  • chrome://inspect/#remote-debugging に移動してリモートデバッグを有効化
  • ダイアログでデバッグ接続を許可するかどうかを選択

Step 2: MCP サーバーの自動接続を設定

  • chrome-devtools-mcp サーバー実行時に --autoConnect 引数を追加
  • 設定例(gemini-cli):
    {
       "mcpServers": {
        "chrome-devtools": {
          "command": "npx",
          "args": [
            "chrome-devtools-mcp@latest",
            "--autoConnect",
            "--channel=beta"
          ]
        }
      }
    }
    
    • Chrome M144 が安定チャネルに到達するまでは --channel=beta の指定が必要

Step 3: 設定をテスト

  • gemini-cli で次のコマンドを実行:
    Check the performance of https://developers.chrome.com
    
  • Chrome がユーザーにリモートデバッグセッションを許可するかどうかを尋ねるダイアログを表示
  • Allow をクリックすると、MCP サーバーがサイトを開いてパフォーマンストレースを実行

コーディングエージェントとの統合デバッグ

  • アクティブな Chrome インスタンスへの接続により、自動化と手動操作を並行できる
    • ユーザーが DevTools で問題のある要素を見つけたあと、その要素をコーディングエージェントに渡して修正を依頼可能
    • Network パネルでも同様にリクエストを選択し、エージェントに分析を指示可能
  • Chrome DevTools MCP サーバーを通じて、追加パネルのデータアクセス機能を段階的に拡大していく予定

1件のコメント

 
GN⁺ 2026-03-16
Hacker Newsの意見
  • 私は Playwright を使ってすべてのリクエストとレスポンスを横取りし、Claude Code が YouTube のようなウェブサイトを巡回しながらクリックや入力を行う間、関連トラフィックを記録している
    こうして収集したデータをもとに 強い型付けのAPI を自動生成し、どんなウェブサイトでも内部API経由でやり取りできるようにしている
    もちろん利用規約違反の可能性はあるが、広告や画像、マークアップをすべて読み込まなくていいのが利点だ
    興味のある人がいれば今週公開する予定

    • HN がこのアイデアを気に入っているのは興味深い
      実際、これは AnthropicOpenAI のような LLM メーカーがすでにやってきたやり方だ
      彼らが広告を回避したり著作物をダウンロードしたりするときは「神の贈り物」と呼ばれ、Zuck が同じことをすると「悪魔の呪い」と呼ばれるのは皮肉だ
    • 私も似たような使い方をしている
      主に DOM ツリーの特定箇所でページのレイアウトやスタイルを再現したり、レスポンシブ動作を自動でキャプチャしたりする用途だ
      Playwright で画面幅を調整しながらスタイル変化を追跡し、スクリーンショットとスタイル階層データ を一緒に保存している
      手動の検査ツールもあるが、遅すぎて非効率だ
      個人的には MCP より カスタムCLI を自作するほうがずっと効率的だと思う
      AI が直接アクセスし、「スキル」を通じて活用するのが本当に強力だ
    • なぜわざわざ Playwright を使う必要があるのか疑問だ
      Claude なら agent-browser さえあれば決定論的なコードをその場で生成できそうだ
    • ぜひ公開してほしい。これを agent skill として作ったのか気になる
    • この方式なら yt-dlp のように継続的な更新をしなくても YouTube 動画を直接ダウンロードできるのか気になる
  • DevTools MCP プロジェクト は最近スタンドアロン CLI をリリースした
    chrome-devtools-cli のドキュメントを見ると v0.20.0 に含まれている
    MCP の トークンコスト問題 を意識していた人には朗報だ
    (参考までに、私は DevTools チームで以前働いていて、今も働いている)

    • いまや Tool Search のおかげで MCP は CC ではコストがかからない
  • 私はここ数か月 TideWave を使っている
    tidewave.ai はもともと Elixir/LiveView ベースだったが、いまは JS フレームワークと RoR もサポートしている
    このツールは単なるブラウザだけでなく、アプリの ランタイムアクセス まで可能だ
    つまり、エージェントがデータベースやエンドポイントに直接アクセスできるので非常に強力だ

  • Google は agentic CLI コーディングではかなり出遅れている
    Gemini CLI はひどすぎて、社内ですら使われていないのは明らかだ
    MCP はすでに死んだ技術 だと思う。CLI ツールのほうが速く柔軟で、すでに学習済みの環境も多い
    本気の開発者なら Playwright と headless Chromium を使うのが定石だ
    MCP は初心者にしか魅力がない

    • 私は大規模な エンタープライズ環境 で働いているが、認証・RBAC・速度制限・運用管理といった要素のため MCP は依然として有用だ
      CLI だけではセキュリティと運用の複雑さが大きすぎる
      ただし Gemini CLI がひどいという点には同意する
    • MCP は死んだ という主張に同意する
      Anthropic が改善を試みたが コンテキスト膨張 の問題は依然として残っている
      MCP サーバーは使わなくてもコンテキストを消費する
      これからは agent skill に移行すべきだ
    • ちなみに Gemini CLI は実際には Google 社内でかなり使われている
      コード検索、ドキュメントアクセス、バグ参照、RAG データベース接続などに MCP サービスを使っている
      (Google 社内の人たちから直接聞いた話だ)
    • MCP が死んだのなら、Chrome を開いてボタンをクリックし、コンソール出力を読む 作業はどの CLI でやればいいのか気になる
      MCP がコンテキストを消費するなら、CLI スキルは無料なのかも疑問だ
  • すでにこの機能を実装した エージェントスキル がある
    chrome-cdp-skill を毎日使っているが、本当に素晴らしい
    たとえば codex でローカルの音楽ライブラリを管理しつつ YT Music タブを開き、アルバムを検索して URL を yt-dlp に渡せた
    ただし現状では Chrome 専用なので、ほかのブラウザを使うにはバイナリパスを修正する必要がある

    • 素晴らしいデモではあるが、プロンプトインジェクション 一発であらゆるデータへアクセス可能になる点は怖いと思う
    • これは DevTools MCP 用のスキルではなく 独立プロジェクト
      ブラウザ自動化 + エージェント分野はすでに競争が激しい
      DevTools MCP と新 CLI は Chrome DevTools & Puppeteer チームが保守しているので、より安定していそうだ
      それでも オープンソースの競争 がイノベーションを生むのは良いことだ
    • こういう場当たり的なスキルを実際に使っている人がいるのか疑問だ
      むしろ playwriter.dev のような安定したツールを使うほうがよいと思う
  • 私は WebSocket プロキシ + Chrome 拡張 を作って、エージェントが DOM を制御できるようにしている
    browserbox を通じてセッション Cookie を許可した状態でアクセスできるよう構成している
    現在は エージェントのツール利用成功率 を高めるための研究用ミドルウェアとして活用している

  • この MCP はかなり長く使ってきたが、codex on opencode と一緒に使うときが最も安定していた
    とくに SVG 編集 REPL として使ったとき、見事なカスタムアイコンを自動生成してくれて驚いた
    Electron アプリ でもリバースエンジニアリングや拡張作業に向いている

  • playwriter を使ってみたが、既存セッションに接続する方式が驚くほどうまく動いた

  • 私も似たものを Playwright で実装した
    以前はトークン消費が激しくコストが高かったが、結果をディスクに保存してエージェントに問い合わせさせる ラッパー を作って解決した
    uisnap.dev で確認できる
    このプロジェクトが トークン消費問題 を解決したのか気になる

    • ほとんど解決されたようだ。参考までに playwright-cli を見るといい
    • 私は Claude Haiku でページスナップショットを要約する ラッパー MCP サーバー を作って使っている
      playwright-slim-mcp で確認できる
  • firefox-devtools-mcp を使ってみたが、標準の Chrome MCP よりはるかに速く効率的だった