16 ポイント 投稿者 GN⁺ 2025-01-10 | 1件のコメント | WhatsAppで共有
  • Stagehandは、シンプルで拡張性の高いAI Webブラウジングフレームワークで、Playwrightと完全に互換性がある
    • actextractobserveという3つのシンプルなAI APIを提供し、自然言語によるWeb自動化を可能にする
    • 非技術ユーザーにとっても扱いやすく、UI/DOMの些細な変更の影響を受けにくい
    • 例: Hacker Newsからトップニュースを抽出、AmazonでAirPodsを検索して購入、ESPNでSteph Curryの直近10試合の成績を検索
  • 耐久性が高く高性能なブラウザ自動化コードを簡単に書ける。
  • Browserbaseと併用すると、セッション再生やステップごとのデバッグなど、優れたデバッグツールを利用できる。
  • Stagehandは初期リリース段階にあり、コミュニティからのフィードバックを積極的に集めている。
  • MITライセンス

1件のコメント

 
GN⁺ 2025-01-10
Hacker Newsのコメント
  • Stagehandを使ってページからデータを抽出する際、LLMを使わずにページを再スクレイピングできるxpath要素を返してくれるとよい、という意見がある

    • 新しいページをスクレイピングするときは非決定的なLLMツールを使い、コンテンツ更新のために再スクレイピングするときは従来のスクレイピング手法を使える
    • LLM版からxcode版への切り替えがどれほど安定しているのか、xcodeスクリプトが失敗した場合にLLM版へフォールバックできるのか、という疑問がある
    • スマートツールでスクレイピングした後、時間をかけてシンプルなスクレイピングスクリプトのライブラリを構築していくのは有用そうだ、という意見がある
  • StagehandがPlaywrightなどを置き換えるべきだというアイデアには同意しない

    • 個人的には決定論的なPlaywrightコードを生成する中間ワークフローとして使いたいが、このツールは直接実行するためのものに見える
    • 作業中のテストスイートでランタイムにLLMを使うのは説得が難しいだろう、という意見がある
  • 類似のフレームワークを使ってワークフロー自動化を実装しようとしたが、見えないCAPTCHAのために頓挫した

    • PlaywrightインスタンスがDOMと相互作用する方法のために検出される可能性がある
    • クローリングとスクレイピングは制御不能になりつつあり、これが標準になる可能性があると見ている
  • "create-browser-app"という名前はあまりに汎用的で、"stagehand"と命名すべきだった、という意見がある

  • testdriver.ai向けのテストプラットフォームを構築する前に、Goodlooksという類似SDKを作ったが大きな反響は得られなかった

    • 興味のある人のためにリンクを共有している
  • Stagehandを使ってみた結果、有用な抽象化だと感じた

    • 敵対的なWebサイト向けのスクレイパーを構築するうえで、プロキシとCAPTCHAが組み込まれていて役立つ
    • MCPやコンピュータ利用について同様の抽象化を行う計画があるのか気になる
  • Stagehandのブラウザ自動化をDOM変更に対してより強くすることに注力している点が気に入った

    • act、extract、observeメソッドがとてもクリーンだ
    • Lightpandaというオープンソースの軽量ヘッドレスブラウザを勧めている
  • 既存の開いているブラウザタブを自動化できる可能性があるのか気になる

  • Slackでこのチームの驚異的な製品開発スピードを見ており、今後の発展が楽しみだ

  • AIメソッドをPlaywrightの下位メソッドに変換する形で動作するのか、そして変換された実際のメソッドをデバッグできるのか気になる

    • テスト実行のたびに異なるコマンドが出るのか、それとも決定論的な挙動があるのか、という疑問がある