OpenDocuments – 散在する組織ドキュメントを自然言語で検索するオープンソースRAGプラットフォーム
(github.com/joungminsung)GitHub、Notion、Drive、Confluence などに散在していて見つけにくいチーム文書の問題を解決するために作られた self-hosted RAG プラットフォームです。
ドキュメントソースを接続すると、パース・チャンク化・埋め込みを行ってインデックス化し、自然言語で質問すると出典付きで回答します。
- コネクタ: GitHub, Notion, GDrive, S3, Confluence, Swagger, Webクローラー, Tavily Web検索
- ファイル形式: PDF, DOCX, XLSX, HTML, Jupyter, ソースコード, メールなど12種類
- LLM: Ollama でローカル実行可能(データ流出なし)。OpenAI/Claude/Gemini/Grok もサポート
- 検索: ベクトル + キーワードのハイブリッド、リランキング、ハルシネーションガード
- 日本語・英語のクロス検索
- MCP サーバーで Claude Code/Cursor 連携
- Web UI、CLI 17コマンド、TypeScript SDK
- プラグインシステム(パーサー/コネクタ/モデル/ミドルウェア)
- Docker デプロイ対応
スタック: TypeScript, Hono, React, SQLite, LanceDB, Turborepo
テスト 51 スイート / 約300件
MIT ライセンスです。
3件のコメント
v0.2.0アップデートのお知らせです。
今回のバージョンの要点は、導入ハードルの解消と実運用性の改善です。
ワンタッチOllama統合 - インストール有無を自動検出 → なければOS別に自動インストール → 埋め込みモデルの自動プルまでを一括で実行します。
docker compose upの1行だけで、ローカルLLMを含むフルスタック全体が立ち上がります。マルチターン対話 - 以前のバージョンでは単発のクエリしかできませんでしたが、これからは文脈を維持したまま連続対話が可能です。
セキュリティパッチ10件以上 - FTS5 SQLインジェクション、パストラバーサル、OAuth state固定攻撃、ReDoS など、コミュニティからのフィードバックと独自監査で見つかった問題を一括修正しました。
そのほか: .env の自動読み込み、モデル接続失敗時の3回リトライ + 具体的なエラーメッセージ、プラグインAPIドキュメントの全面拡張。
リリースノート: https://github.com/joungminsung/OpenDocuments/releases/
ご利用中にerrorや不便な点がありましたら、GitHub Issueを上げていただけますと幸いです。
上がり次第、すぐに対応いたします
npmパッケージの配布が漏れていました。クローン後にインストールできなかった方々、申し訳ありません。現在は正常に配布を完了していますので、Readmeの変更されたコマンドでもう一度お試しいただけますと幸いです。