FLAMEHAVEN FileSearch v1.3.1 – ML依存を排除し、セマンティック検索エンジンを大幅刷新
(github.com/flamehaven01)FLAMEHAVEN FileSearchは、
👉 *「文書検索向けRAGを、軽量で、再現可能で、完全にself-hostedにできないだろうか?」*という問いから始まったオープンソースプロジェクトです。
現在、⭐ Star 81 / 🍴 Fork 11で、規模は小さいながらも、リリースごとに明確な改善を積み重ねてきたプロジェクトです。
今回のv1.3.1リリースは、単なる機能追加ではなく、
👉 「セマンティック検索 = 重いMLスタック」という前提を覆すアップデートです。
🔍 プロジェクトの一行要約
-
Self-hosted RAG検索エンジン
-
文書(PDF/DOCX/MD/TXT)をアップロードすると、キーワード + セマンティック + ハイブリッド検索
-
外部ベクターDBなしでローカル動作
-
Docker 1行で3分以内に実行可能
✨ v1.3.1 主要アップデート(開発者に刺さるポイント)
1️⃣ ML依存を完全排除(最大の変更点)
-
sentence-transformers/torchを完全削除 -
独自実装のDSP v2.0(Deterministic Semantic Projection)を導入
-
✔️ ベクトル生成 < 1ms
-
✔️ 初期化遅延なし(従来2分 → 即時)
-
セマンティック検索でありながら、MLフレームワークなしで決定論的に動作
2️⃣ メモリ & パフォーマンス最適化
-
int8ベクトル量子化
→ メモリ使用量を75%削減 -
コサイン類似度計算を30%以上高速化
-
メタデータを90%以上圧縮(Gravitas-Pack)
-
個人サーバー / 社内VMでも無理なく運用可能
3️⃣ 検索モード拡張
-
keyword / semantic / hybrid 検索モードをサポート
-
typo correction + query refinement を含む
-
既存APIと完全なbackward-compatible
4️⃣ 安定性 & 信頼性
-
テストフレームワークを pytest → unittest に移行
-
19/19 テスト通過(0.33s)
-
タイムアウト、CIの不安定さを解消
🔐 引き続き維持される本番向け機能
-
API Keyベースの認証 & 権限管理
-
Rate limiting / Audit log
-
Batch search(1〜100 queries)
-
Optional Redis cache
-
Prometheusメトリクス
👀 特にこんな方に適しています
-
社内文書検索向けのローカルRAGが必要なチーム
-
外部SaaS(Pineconeなど)にデータを上げにくい環境
-
「PoCはできたけれど、本番運用はどうする?」の段階にいる開発者
-
再現可能性 / コスト / コントロールを重視するエンジニア
🔗 GitHub
👉 https://github.com/flamehaven01/Flamehaven-Filesearch
---使ってみて役に立ったら、⭐ を一度押していただけると大きな励みになります。
ご意見・フィードバック・PRはすべて歓迎します。
まだコメントはありません。