Comet - PerplexityのWebエージェント兼ブラウザ
(perplexity.ai)Comet: Perplexityが作った新しいブラウザ
リリースから少し経っていますが、ウェイトリストを通過したあと実際に使ってみて書いてみます。
核心概要
CometはPerplexityが開発したAIブラウザで、ユーザーの集中力とワークフローを最大化し、好奇心を実行力へと変えてくれます。
主な機能と特徴
-
AI統合検索、即時コンテキスト、サイト自動化
- ブラウザ上でそのまま要約、ショッピング、スケジュール、リサーチが可能
-
Comet Assistant
- クリック、入力、送信、オートコンプリートなどの反復作業を自動処理
-
複雑な業務も自動化
- 製品比較から決済まで、ショッピングの全工程を支援
-
統合管理
- メールとカレンダー(Gmail、Google Calendar)を連携
- スケジュールのブリーフィングからメール/予定の予約まで、ブラウザ内で完結
-
パーソナライズされた体験
- 利用パターンを学習し、タブやインサイトを自動整理
-
自分のアクティビティから直接回答を探す
- 履歴、動画、文書など個人データの検索をサポート
-
スマートアクションとタブ別フォーカス機能
@tab機能で、開いているタブに応じたリアルタイム回答を提供
利用事例
PerplexityのLinkedInで利用事例を追加で投稿していました。
https://www.linkedin.com/company/perplexity-ai/posts/?feedView=all
サービス利用後の個人的な意見
技術
- Chromiumブラウザ + Perplexity + Web Agentという形
- 自然言語クエリ -> Intent/slot抽出 -> Semantic DOMマッピング -> アクション変換 -> イベント実行(web Tool) -> 結果パース後の前処理 -> ReAct形式の構造と推定
- Cometがスクリーンショットを撮ってくれるので現在の作業状況は把握できますが、ビジョンモデルを使って分析しているのかは追加確認が必要
テスト事例
(1) メール作成
- GoogleメールのWebサイトを適切に使ってメールを作成
- Agentは実際の送信は行わず、下書き保存を選択
(2) NAVERマップで経路検索 + 周辺飲食店のおすすめ
- NAVERマップのWebページを訪問したあと、ソウル駅から蚕室までの経路を探してほしいと問い合わせると、NAVERマップのサービスを適切に(人のように)使って経路を検索
- 周辺の飲食店探しではNAVERマップは使わず、既存のPerplexityのSearch Toolを使用
(3) Open AI Platform Pricingのクローリング
- Open AI PlatformはRemixを使っていると理解しており、一部のAPI価格はトグル形式で隠れている状態
- Cometに明示的にトグルを開いてすべてのAPI価格を確認し、Markdownで結果を出してほしいと依頼したところ、適切に提供
- ただし、正確に情報を抽出させるためのプロンプトエンジニアリングは必要
- AnthropicのAPIページも確認させたが、Webページのレイアウト(ディバイダー)が曖昧で、複雑なAPIポリシーは正確にパースできなかった。基本的なAPI価格は正確に抽出。
個人的な意見
- ブラウジングエージェントを開発するにあたり、コンテキストやレンダリングなど考慮点が多かったはずで、それをどう解決したのか気になります。
- 技術的にはwowがありますが、プロダクトの観点ではまだ曖昧な気がします。
- 人によって違うでしょうが、私にはなぜこのプロダクトを使うべきなのか、Cometを使うためにお金を払う理由があるのか、自分(顧客)のどんな問題を解決してくれるのか。つまり、バリュープロポジションが私には明確ではありません。現時点では「おお、すごい。こんなことができるんだ、思い出したときに何回かまた使ってみよう」という感じです。
- もちろんPerplexityは利用事例を提示していますが、「わざわざAgentで解決すべき問題なのか?(自分でやったほうが早いのでは)」や「本当に問題をすべて解決できているのか?」という考えが浮かびます。
- おそらくブラウザがインフラに近い存在だから、こう感じるのではないかと慎重に推測しています。
- AI Agentベースのブラウザは、ある意味で新しいフォーマットなので、顧客に対して「あなたにはこういう問題があり、Cometが本当にその問題を完璧に解決できる」とうまく示せればよいのではないかと思います。
- 注目しながら、もう少し使ってみる必要がありそうです。プロダクト面の課題をどう解決できるのか気になります。
UI
個人的に分析してみた内容です。(リバース企画として作ってみようと作業中です……)
https://www.figma.com/deck/Gky9ZDEqZKdJfG4RWoNYdf
4件のコメント
気になっているのですが、その Comet エージェントを試した際、クエリ使用制限はありましたか? それとも他のツールのようにテスト期間中で、クエリ数は特に関係ない状態だったのでしょうか。
pro-maxのようなものがあったと記憶していて、気になってお聞きしました。現在は Pro を契約しています。私があまり使っていないだけかもしれませんが、Comet を含む Perplexity で今のところ制限に引っかかったことはありません。思ったより余裕がある感じもします。
サブスクリプションプランには rate limit が記載されていないので、はっきりしたことはよく分かりません。
ひとまず beta release は Pro Max とは別に提供されているようです。
https://perplexity.ai/help-center/en/…
個人的な感覚ですが、おっしゃる通りテスト期間だからか、クエリ数は関係ないように見えます。一度に仮想ブラウザを 12 個並列で立ち上げて動作するところまでは確認しました。これは驚きですね。
興味深く読ませていただきました。
予想どおりの内容のようで、少し残念ですね..
これには共感します。
例: Naver のニュースページを読んで、関税交渉に関する新聞ごとの論調を整理してほしいと頼んだとき、読んでいない新聞の内容を「各新聞社の傾向に対する事前学習済みの偏見」に基づいて、未読の新聞社の論調をでっち上げて回答します。