RAGは死んでいない

(hamel.dev)

33 ポイント投稿者 GN⁺ 2025-07-17 | 1件のコメント | WhatsAppで共有

> RAGの未来は「より大きなコンテキストウィンドウ」ではなく、より優れた検索にある

「RAG Is Dead」という言葉が当てはまるのは、2023年式の単純なRAG実装方式に限られ、本当の問題は情報損失の大きい単一ベクトルベースの検索にある
既存のIR評価指標はRAGに適しておらず、事実の網羅性・多様性・関連性を中心とした新しい評価基準が必要
RAGの検索器は単純なマッチングを超え、指示を理解し推論ベースで関連文書を選択する方式へと進化している
ColBERTスタイルのレイトインタラクションモデルは、情報圧縮なしにトークン単位の表現を維持し、小規模モデルが大規模モデルを上回る
完璧な埋め込みを1つ見つけるのではなく、多様な表現のための複数インデックスとスマートルーティング構造が新たな標準になりつつある

Why the future of RAG lies in better retrieval, not bigger context windows

> Part 1. I don’t use RAG, I just retrieve documents - 単純なベクトル検索が死んだのであって、RAG自体ではない

> Part 2. Modern IR Evals For RAG - 従来のIR評価指標がRAGに合わないことを説明し、FreshStackを提示

Nandan Thakurは、従来の情報検索（IR）評価指標はRAGに適していないと指摘する
- BEIRのようなベンチマークは1位文書の探索だけを最適化している
- RAGでは事実カバレッジ、多様な観点、文脈関連性などを総合的に考慮する必要がある
- そのための新しい評価システムとしてFreshStackを提案する

> Part 3. Optimizing Retrieval with Reasoning Models - 指示を理解し推論可能な検索器の設計

> Part 4. Late Interaction Models For RAG - ColBERTのような構造で情報損失なく表現を維持

Antoine ChaffinはColBERTのようなLate Interactionベースのモデルを通じて、
- 文書を単一ベクトルに圧縮せず、トークン単位の情報を維持し
- その結果、1.5億パラメータのモデルが7Bモデルより推論性能に優れる事例も存在する
情報を失わずに保持する表現構造が核心

> Part 5. RAG with Multiple Representations - 目的別の複数インデックスによる検索性能向上

次の4点がRAGの未来として提示される:

このシリーズは全5部構成で、主要スライドにタイムスタンプを付けて要約を提供している。各Partごとのリンクを参照

パート	タイトル	説明
Part 1	I don’t use RAG, I just retrieve documents	単純なベクトル検索が死んだのであって、RAG自体ではない
Part 2	Modern IR Evals For RAG	従来のIR評価指標がRAGに合わないことを説明し、FreshStackを提示
Part 3	Optimizing Retrieval with Reasoning Models	指示を理解し推論可能な検索器の設計
Part 4	Late Interaction Models For RAG	ColBERTのような構造で情報損失なく表現を維持
Part 5	RAG with Multiple Representations	目的別の複数インデックスによる検索性能向上

ide127 2025-07-18

「完璧な埋め込みを探すのではなく、多様な表現方式に合わせたマルチインデックス + インテリジェントなルーティングシステム」

それが簡単じゃないから…。