- AIエージェント向けのヘッドレスブラウザ自動化CLI
- 従来の node.js + playwright + CDP 構成から、RustバイナリがCDPを直接呼び出す方式に変更
- スタンドアロンデーモンとして動作し、ランタイムに Node.js プロセスが不要なため、メモリ使用量を削減しフットプリントも小型化
- AIフレンドリーなワークフローコマンド
snapshotコマンドでアクセシビリティツリーを取得し、**一意のref(@e1、@e2)**を生成してこれを基準に動作(従来のセレクターもサポート)
- ページ操作(
open、goto)、クリック・入力(click、fill、type、hover、check、..)、スクリーンショット・PDF生成(screenshot、pdf)
- 状態取得(
get text、get attr)、状態チェック(is)、待機(wait)、マウス・キーボード制御(mouse、keyboard)
- 要素検索(
find)、ブラウザ設定(set)、タブ/ウィンドウ/フレーム/ダイアログ(tab、window、frame、dialog)
- 比較(
diff):スナップショット/スクリーンショット/URLなどで比較
- セッション・ストレージ・Cookie管理(
cookie、storage)、ネットワークリクエストのインターセプトとモック(network route)をサポート
--sessionで分離されたブラウザインスタンスを実行
--profileまたは--session-nameでログイン・ストレージ状態を維持
--annotateオプションで要素番号が表示された注釈付きスクリーンショットの生成をサポート
- macOS、Linux、Windows向けのRustバイナリを提供し、Node.jsフォールバックもサポート
- Apache-2.0ライセンス
2件のコメント
とてもとても便利に使っています。トークン効率も良いです。
agent-browser を紹介したことがなかったですね。最近は何かと多すぎて見落としていたようです(笑)
新たに実験的機能として
--native引数が導入され、さらに小さく速くなりました。https://x.com/ctatedev/status/2028960626685386994
portless - ポート番号を名前ベースの .localhost URL に置き換えるツール を作った Chris Tate の別プロジェクトです。