5 ポイント 投稿者 GN⁺ 2025-02-17 | 1件のコメント | WhatsAppで共有
  • Perplexityが、時間を節約しながら詳細な調査と分析を行う Deep Research 機能をリリース
  • ユーザーの質問に対して数十回の検索を実行し、数百の資料を読み込み、それらを論理的に分析して包括的なレポートを提供
  • 金融、マーケティング、技術調査など、専門家レベルのさまざまな作業を実行でき、Humanity’s Last Exam で高い成績を記録
  • Deep Researchはすべてのユーザーに無料で提供され、Pro加入者 は無制限に利用可能
  • 非加入者は1日に利用できる回答数に制限あり。現在は Web版 で利用可能で、まもなくiOS、Android、Macでも提供予定
  • Deep Researchを利用するには、perplexity.ai の検索ボックスにある モードセレクター で "Deep Research" を選択し、質問を入力すればよい

仕組み

  • PerplexityのDeep Researchは既存の回答機能をさらに発展させ、人間なら数時間かかる調査を 2〜4分以内 に完了する。
  • 論理的な調査の実行
    • 検索およびコーディング機能を備えたPerplexityは、複数回の検索を実行しながら文書を読み、分析する。
    • 調査テーマについて段階的に学習しながら、調査計画を修正していく方式で進行する。
  • レポート作成
    • 評価した資料をもとに、明確で包括的なレポートを作成する。
  • エクスポートと共有
    • 最終レポートは PDFまたは文書として保存 でき、Perplexity Page に変換して共有することも可能。

Deep Researchの活用事例

  • Deep Researchは、さまざまな複雑なテーマを専門的に分析するのに適しており、次のような分野で有用に活用できる。
  • 金融
  • マーケティング
  • 技術
  • 時事問題
  • 健康
  • 人物調査
  • 旅行計画

Humanity’s Last Examでの成績

  • Deep Researchは Humanity’s Last Exam21.1%の正答率 を記録し、Gemini Thinking、o3-mini、o1、DeepSeek-R1 など複数のAIモデルを上回った
  • この試験は、100以上の分野 にわたる3,000問以上の質問で構成されたAI性能評価ベンチマーク

SimpleQAでの成績

  • Deep Researchは SimpleQAベンチマーク93.9%の正答率 を記録し、多様な事実ベースの質問に対して業界最高水準の性能を示した。

実行速度

  • Deep Researchは高い精度を維持しながらも、ほとんどの調査作業を3分以内 に完了する
  • 今後は性能最適化を通じて、速度をさらに改善していく計画

1件のコメント

 
GN⁺ 2025-02-17
Hacker Newsのコメント
  • 毎週のように新しいAIが登場し、AI優秀性ベンチマークによれば以前のAIより20%優れているとされるが、最新のSOTAモデルの有用性は、数年前に公開された最初のChatGPTよりわずかに高い程度

    • これらのAIは幼児のような推論能力しか持たない一方で、ますます権威的な文体になるようファインチューニングされている
    • 研究論文のように整形された出力物で、フォントと色だけが欠けている状態
  • こうした深層調査アプリケーションがリリースされたのはうれしい

    • LLMsの明確なユースケースに見える
    • Perplexityをテストクエリで試してみた
    • 「Fortune 100 CEOたちの専攻一覧」というクエリで苦戦していた
    • OpenAIとGeminiはある程度うまく結果テーブルを生成するが、Perplexityはその話題について一般論を述べる
    • 同様の失敗例がさらにある
    • 単一の質問の要約には良いが、2つ目のデータ一覧を見つけて結果を結合するような場合にはうまく機能しない
  • OpenAIが月額$200版のDeep Researchをリリースしてから約2週間で、24時間以内にオープンソース化され、Perplexityでは無料で提供された

    • 変化のスピードは驚異的で、OpenAIがなお競争優位を持っているのか疑問
  • 「Deep Research」という名前を使う3つ目の製品

    • 1つ目はGemini Deep Research、2つ目はChatGPT Deep Research、3つ目はPerplexity Deep Research
  • こうしたツールに対する問いは同じだ。PerplexityやOAIなどが、実際に自社のビジネスでこうしたツールを使っている証拠はどこにあるのか

    • 提示された例には感心しない
    • 「バイオテック系スタートアップ上位20社」のようなクエリは、さまざまな無料ソースから回答可能
    • とりわけ金融/投資情報では、シグナルとノイズを見分けるためにより深く掘り下げる必要がある
  • OpenAIが新しい製品やインタラクションの仕組み/UXを導入するたびに、他の人たちがそれを模倣する

    • ChatGPT、コードインタープリタ、対話モデル、深層調査などで起きている
    • OpenAIが新しいUXパラダイムを導入するのは良いことだが、他の皆がそれに追随しているように見える
    • Operator/MCP/ブラウザ利用は除く
  • Perplexityを使って、50州の地域法、政策、税率、法的障壁に関するテーブルを作ってみた

    • OpenAI DRと同じプロンプトを与えたが、PerplexityはOpenAIと違ってCSVダウンロードをうまく処理した
    • おすすめできる
  • OpenAIやGoogleのDeep Researchは使ったことがないが、Amiga 500のサウンドチップが特別である理由についてのクエリでは、すばらしく詳細な記事を書いた

    • 個人的にとても有益で、新しいことを学べた
  • 代替手段よりも深い回答を提供するが、結果の正確性は代替手段より劣る

  • Gergely(The Pragmatic Engineer)のツイートに対する人々の意見が気になる

    • Webパブリッシャーが有料化に移行するのか気になる
    • 深層調査やAI検索の経済性が成り立たない
    • Webパブリッシャーやサイト所有者はトラフィックと訪問者を失っている