2 ポイント 投稿者 GN⁺ 2025-04-08 | 1件のコメント | WhatsAppで共有
  • AIアプリをMCP経由でブラウザに接続し、Webサイト上の作業を自動化できるようにするツール
    • たとえば、Webサイトで繰り返しフォーム入力を行う作業を自動化
  • ワークフロー自動化: 作業速度を高めて自動化し、効率を向上
  • 自動化テスト: AIエディタを使用してコードのエンドツーエンドテストを自動実行。ユーザーフローをテストし、UI要素を検証し、さまざまなシナリオでアプリケーションが期待どおりに動作するかを確認
  • 作業自動化: データ収集、フォーム入力、ワークフロー自動化など、反復的なWebベースの作業を簡単に自動化し、時間の節約とエラー削減を図る

Browser MCPの利点

  • 速度: 自動化がローカルで行われるため、ネットワーク遅延がなく性能が向上。
  • プライバシー保護: 自動化がローカルで行われるため、ブラウザ活動はデバイス内にとどまり、リモートサーバーへ送信されない。
  • ログイン維持: 既存のブラウザプロファイルを使用して、すべてのサービスでログイン状態を維持。
  • 秘匿性: 実際のブラウザフィンガープリントを使用し、ボット検知やCAPTCHAを回避。

使い方

  1. Browser MCP拡張機能をインストール: ブラウザにBrowser MCP拡張機能を追加。
  2. MCPサーバーを設定: AIアプリケーションにBrowser MCPサーバーを追加して、ブラウザ拡張機能と接続。
  3. 自動化を開始: 自動化ワークフローを作成し、AIアシスタントがブラウザ上で反復作業を処理するようにする。

ブラウザ自動化機能ツール

  • ナビゲート: URLへ移動
  • 戻る: 前のページへ移動
  • 進む: 次のページへ移動
  • 待機: 指定した時間(秒)だけ待機
  • キー入力: キーボードでキーを押す
  • スナップショット: 現在のページのアクセシビリティスナップショットを取得
  • クリック: Webページでクリックを実行
  • ドラッグ&ドロップ: 2つの要素間でドラッグ&ドロップを実行
  • ホバー: ページ上の要素にマウスオーバー
  • テキスト入力: 編集可能な要素にテキストを入力
  • オプション選択: ドロップダウンからオプションを選択
  • コンソールログ取得: ブラウザのコンソールログを取得

対応するMCP AIアプリケーション

  • Cursor
  • Claude
  • Windsurf
  • VSCode

1件のコメント

 
GN⁺ 2025-04-08
Hacker Newsの意見
  • このウェブサイトは「実際のブラウザーフィンガープリントを使ってボット検知とCAPTCHAを回避する」と主張している

    • 類似のシステムを使ったことがあるが、AIがブラウザーを操作している間にCAPTCHAが表示され、複数のウェブサイトでブロックされた経験がある
    • ブラウザーセッションの使用をやめるとブロックは解除されたが、この方法は万能な解決策ではない
  • このシステムはMicrosoftのPlaywright-MCPの古いコピーのように見える

  • ショッピングサイトで特定の条件に合う商品をフィルタリングできるブラウザーがあれば便利そう

  • MCPが何なのかわからないし、もう尋ねるのも怖い

  • ウェブで情報を検索してGoogle Sheetsに結果を挿入する作業は、最初はほぼ完璧に動いたが、その後の試行では失敗した

    • ブラウザーとMCPアプリの間に遅延の問題があるのか気になる
    • 最初の試行では素早く「このチャットを許可」の権限をクリックしたが、その後の試行ではLLMがクリックの問題を報告した
    • Googleスプレッドシートのタイトルをクリックして名前を入力する作業は最初は成功したが、その後の試行では失敗した
    • セルA1、B1などを識別して行に挿入する作業も最初は成功したが、その後の試行では失敗した
    • 最初の試行ではほぼ完璧だったが、その後は100%再現できなかった
    • 体験はスムーズで、設定と実行は素晴らしい
  • Claude Desktopでテストしたときはスムーズに動作し、Playwrightより煩雑さが少なかった

    • ページ上でCAPTCHAを検出したら自動化を一時停止してユーザーに通知する機能があるとよい
    • PlaywrightはCAPTCHAを繰り返し試そうとする
  • Chrome DevToolsのアクセシビリティツリーを使ってページをナビゲートできるとよい

  • 手作業のタスク、特に払い戻し申請のような作業に期待している

    • 毎月サービス提供事業者にログインし、明細書をダウンロードし、Googleドキュメントを作成し、メールを書いてファイルをアップロードするのは面倒
    • 自動化はすでに可能で、実際の経費追跡アプリならこの作業の半分は減らせる
    • AIツールには細かな仕様を取り除く可能性がある
    • こうしたワークフローはしばしば小さな変更の影響を受ける
  • MCPは新しいRPA(ロボティック・プロセス・オートメーション)なのだろうか

  • ハードウェアシンセを制御し、物理ノブに触れずにサウンドデザインできるような、似た作業をしている