<script src="page-agent.js"></script> を1行入れるだけで、WebサイトがAIネイティブアプリに変身
- ブラウザ拡張、Python、ヘッドレスブラウザ なしでも動作
- 自然言語で指示すると、残りはAIが処理。テキストベースのDOM操作 機能により、スクリーンショット、OCR、マルチモーダルLLMは不要
- すべての処理がWebページ内部で実行される in-page 実行モデル により、追加の権限要求なしでDOM要素を直接制御
- OpenAI、Claude、DeepSeek、Qwen など多様なモデルが利用可能で、Ollama により完全オフライン動作も可能(APIキー統合ベース)
- インタラクティブなUIと human-in-the-loop インターフェース を提供
- ブックマークレットを使って、どんなWebページでもテスト可能
- Chrome 拡張 をインストールすると、複数ページをまたぐタスクにも対応 し、ブラウザレベルの制御、外部連携まで対応
- 主な活用事例
- SaaS AI Copilot: バックエンド修正なしで製品内にAI Copilotを実装
- スマートフォーム自動化: 多段階のクリック操作を1文に短縮し、ERP/CRM/管理者ツールを改善
- アクセシビリティ強化: 音声コマンドとスクリーンリーダーによるWebアクセシビリティの向上
- MITライセンス : Repo は alibaba/page-agent
11件のコメント
わあ、すごい…!!
わあ、すごいですね。
bookmarklet で手軽にページに LLM を付けるのに良さそうです。デフォルトの bookmarklet はアリババ(中国)に接続されるのが気になる方は、
baseURLとapiKeyを入れて、ご自身が使っている LLM Endpoint を指定して使えます。(local LLMや OpenAI など)javascript:(function(){import('https://cdn.jsdelivr.net/npm/page-agent@1.5.5/+esm').then(module=>{window.agent=new module.PageAgent({model:'gpt-5.4',baseURL:'<your-api-url>',apiKey:'<your-api-key>'});if(window.agent.panel)window.agent.panel.show();}).catch(e=>console.error(e));})();
最初は「何だこれ、どうやって使うんだ?」と思ったのですが、今は理解できました。
拡張機能をインストールして、トス証券でSOXLの30日前の株価を知りたいと言うと、自分で操作して該当ページに入り、価格を見て教えてくれます。
PlaywrightとAIを連携させるより、速度もずっと速いですね。
これ、SNSでかなり話題みたいなので……試してみないとですね
すごいですね。すぐに活用できる場面が本当にいろいろありそうです。
セキュリティ面だけ改善して使えばよさそうです
おお、本当に面白いですね
> Try on Other Sites
> Step 2: Drag this button to your bookmarks
そしてサイトにこういうものがあるのですが、本当にドラッグするとブックマークに追加されますね。
初めて見ましたが、とても不思議です。ブックマークレットを共有するときに良い方法ですね
あっ.. GeekNewsのブックマークレットもオープン初期からありました。
https://news.hada.io/bookmarklet
うわっ、GeekNewsにもこんないいブックマークレットがあったんですね(笑)
一般の人でも使いやすそうですし、本当にいいものだと思います
面白いですね。アリババがまた不思議なものを出してきたようです。
サービス内の管理者向けツールには入れてみる価値があるかもしれませんね?
ざっくり CRUD だけ作って、これをやってあれをやってと順番に指示すれば、ワークフローが作れる感じです。
デモの動作が興味深いですね。
これをコードに直接入れなくても、ブックマークレットを使って
どんなウェブサイトにも適用できます。