Skyvern – LLMとコンピュータビジョンを活用したブラウザワークフロー自動化
(github.com/Skyvern-AI)- 従来のブラウザ自動化方式では、Webサイトが変更されるたびに壊れやすいDOM解析やXPathベースのスクリプト作成が必要だった
- Skyvernは、リアルタイムでビューポート内の項目を解析して計画を生成し、Webサイトと対話することでこの問題を解決
- 視覚的な要素をアクションにひも付けるため、初めて見るWebサイトでも動作する
- Webサイトのレイアウト変更にも強い
- LLMを用いて推論することで、複雑な状況にも対応する
- BabyAGIとAutoGPTによって広まったTask-Driven自律エージェント設計に着想を得ており、Playwrightのようなブラウザ自動化ライブラリを使ってWebサイトと対話できる能力を追加
- インフラ管理なしで複数のSkyvernインスタンスを並列実行し、大規模にワークフローを自動化できるマネージド版のSkyvern Cloudも別途提供
- Python 3.11、Brew(Macユーザーの場合)、Poetry、PostgreSQL 14が必要
まだコメントはありません。