7種類の法令を1か所で検索できるRAGデモを作ってみました — MiniLex
(minilex.wellsa.ai)法令を検索していると、「性暴力処罰法第14条」を知らないと見つけられないのが不便だったので、市民が日常語のまま質問すると関連条文を返すRAGデモを作ってみました。
データは法制処の公共OpenAPIから取得してMarkdownに整形し、毎日cronで更新しています。
• 法令 (law-kr): 5,589
• 行政規則 (regulate-kr): 10,765
• 判例 (precedent-kr): 171,014
• 法令解釈例 (interpretation-kr): 8,728
• 憲法裁判所決定例 (constitution-kr): 38,092
• 自治法規 (localrule-kr): 159,910
• 条約 (treaty-kr): 6,907
合計397K+のMarkdown文書。
運用DBに1.36M+の条文をインデックス化。
• デモ: https://minilex.wellsa.ai
• データ/コード (MIT): https://github.com/wellsa-ai
• HF Mirror: https://huggingface.co/wellsa-ai
市民向けシナリオ5件(ディープフェイク / 賃金未払い / 不当解雇 / 個人情報漏えい / ストーキング)については、出典条文付きで返せることを確認しましたが、一般化にはまだ課題があります。
キーワード + 同義語拡張への依存度が高いため、ランキングの一般化が次の課題です。
スタックは一般的な構成で、Next.js + FastAPI + Celery + PostgreSQL + pgvector、埋め込みには nomic-embed-text-v2-moe(768d) を使っています。
独自の安全サンプルベンチでは R@5 0.86 / MRR 0.753 程度でした。
法律相談の代替ツールではなく、出典条文の探索を補助するためのものです。
実際の判断は有資格の専門家に相談してください。
フィードバック / PR 歓迎です。
まだコメントはありません。