1 ポイント 投稿者 mansuiki 4 시간 전 | まだコメントはありません。 | WhatsAppで共有

こんにちは。turbovec/TurboQuant ベースで、constrained RAG 向けの graph memory layer を付けた turbo-graph を作りました。

turbovec は、flat top-k や cheap allowlist がある場合にはすでに優れています。ですが、実際の RAG ではクエリがしばしば次のような形になります。

tenant ACL ∩ tag ∩ source ∩ time window ∩ graph neighbors ∩ BM25 candidates

この組み合わせを毎回 Python/SQL/app layer で作り、再び vector search に渡し、結果を graph/BM25 と rerank し、なぜこの結果になったのかを explain するコードが繰り返し発生していました。

turbo-graph は turbovec-compatible core を維持しつつ、その周辺の graph/metadata view compilation、cache reuse、graph rerank、explain telemetry をインデックスレイヤーへ移してみる実験です。

まだ Alpha なので、production にすぐ使ってほしいという目的よりは、実際の RAG route でどんな API が必要なのかについてフィードバックをもらいたいです。

GitHub:
https://github.com/bigmacfive/turbo-graph

まだコメントはありません。

まだコメントはありません。