Taxy AI - GPT-4でブラウザを完全自動化する
(github.com/TaxyAI)- ユーザーが命令を出すと、WebページのDOMをGPTに渡し、
click/setValueの2種類の操作を指示 - LLM経由で命令を送り応答を受け取ったら、
chrome.debuggerAPIを使ってアクションとして実行 - 1タスクあたり最大50個までのアクションを実行可能
- 現在はアドホックな命令のみ定義可能だが、今後はワークフローの保存とスケジューリングに対応できるよう改善予定
- 動作例: Googleカレンダー - "Schedule standup tomorrow at 10am. Invite david@taxy.ai"
まだコメントはありません。