2 ポイント 投稿者 flamehaven01 2025-12-19 | まだコメントはありません。 | WhatsAppで共有

FLAMEHAVEN FileSearchは、
👉 *「文書検索向けRAGを、軽量で、再現可能で、完全にself-hostedにできないだろうか?」*という問いから始まったオープンソースプロジェクトです。

現在、⭐ Star 81 / 🍴 Fork 11で、規模は小さいながらも、リリースごとに明確な改善を積み重ねてきたプロジェクトです。

今回のv1.3.1リリースは、単なる機能追加ではなく、
👉 「セマンティック検索 = 重いMLスタック」という前提を覆すアップデートです。


🔍 プロジェクトの一行要約

  • Self-hosted RAG検索エンジン

  • 文書(PDF/DOCX/MD/TXT)をアップロードすると、キーワード + セマンティック + ハイブリッド検索

  • 外部ベクターDBなしでローカル動作

  • Docker 1行で3分以内に実行可能


✨ v1.3.1 主要アップデート(開発者に刺さるポイント)
1️⃣ ML依存を完全排除(最大の変更点)

  • sentence-transformers / torch を完全削除

  • 独自実装のDSP v2.0(Deterministic Semantic Projection)を導入

  • ✔️ ベクトル生成 < 1ms

  • ✔️ 初期化遅延なし(従来2分 → 即時)

  • セマンティック検索でありながら、MLフレームワークなしで決定論的に動作


2️⃣ メモリ & パフォーマンス最適化

  • int8ベクトル量子化
    → メモリ使用量を75%削減

  • コサイン類似度計算を30%以上高速化

  • メタデータを90%以上圧縮(Gravitas-Pack)

  • 個人サーバー / 社内VMでも無理なく運用可能


3️⃣ 検索モード拡張

  • keyword / semantic / hybrid 検索モードをサポート

  • typo correction + query refinement を含む

  • 既存APIと完全なbackward-compatible


4️⃣ 安定性 & 信頼性

  • テストフレームワークを pytest → unittest に移行

  • 19/19 テスト通過(0.33s)

  • タイムアウト、CIの不安定さを解消


🔐 引き続き維持される本番向け機能

  • API Keyベースの認証 & 権限管理

  • Rate limiting / Audit log

  • Batch search(1〜100 queries)

  • Optional Redis cache

  • Prometheusメトリクス


👀 特にこんな方に適しています

  • 社内文書検索向けのローカルRAGが必要なチーム

  • 外部SaaS(Pineconeなど)にデータを上げにくい環境

  • 「PoCはできたけれど、本番運用はどうする?」の段階にいる開発者

  • 再現可能性 / コスト / コントロールを重視するエンジニア


🔗 GitHub

👉 https://github.com/flamehaven01/Flamehaven-Filesearch

---使ってみて役に立ったら、⭐ を一度押していただけると大きな励みになります。
ご意見・フィードバック・PRはすべて歓迎します。

まだコメントはありません。

まだコメントはありません。