turbo-graph – turbovecにグラフメモリ/フィルタキャッシュを載せた constrained RAG インデックス
(github.com/bigmacfive)こんにちは。turbovec/TurboQuant ベースで、constrained RAG 向けの graph memory layer を付けた turbo-graph を作りました。
turbovec は、flat top-k や cheap allowlist がある場合にはすでに優れています。ですが、実際の RAG ではクエリがしばしば次のような形になります。
tenant ACL ∩ tag ∩ source ∩ time window ∩ graph neighbors ∩ BM25 candidates
この組み合わせを毎回 Python/SQL/app layer で作り、再び vector search に渡し、結果を graph/BM25 と rerank し、なぜこの結果になったのかを explain するコードが繰り返し発生していました。
turbo-graph は turbovec-compatible core を維持しつつ、その周辺の graph/metadata view compilation、cache reuse、graph rerank、explain telemetry をインデックスレイヤーへ移してみる実験です。
まだ Alpha なので、production にすぐ使ってほしいという目的よりは、実際の RAG route でどんな API が必要なのかについてフィードバックをもらいたいです。
まだコメントはありません。