5 ポイント 投稿者 wellsa 14 시간 전 | まだコメントはありません。 | WhatsAppで共有

法令を検索していると、「性暴力処罰法第14条」を知らないと見つけられないのが不便だったので、市民が日常語のまま質問すると関連条文を返すRAGデモを作ってみました。

データは法制処の公共OpenAPIから取得してMarkdownに整形し、毎日cronで更新しています。

• 法令 (law-kr): 5,589
• 行政規則 (regulate-kr): 10,765
• 判例 (precedent-kr): 171,014
• 法令解釈例 (interpretation-kr): 8,728
• 憲法裁判所決定例 (constitution-kr): 38,092
• 自治法規 (localrule-kr): 159,910
• 条約 (treaty-kr): 6,907

合計397K+のMarkdown文書。
運用DBに1.36M+の条文をインデックス化。

• デモ: https://minilex.wellsa.ai
• データ/コード (MIT): https://github.com/wellsa-ai
• HF Mirror: https://huggingface.co/wellsa-ai

市民向けシナリオ5件(ディープフェイク / 賃金未払い / 不当解雇 / 個人情報漏えい / ストーキング)については、出典条文付きで返せることを確認しましたが、一般化にはまだ課題があります。
キーワード + 同義語拡張への依存度が高いため、ランキングの一般化が次の課題です。

スタックは一般的な構成で、Next.js + FastAPI + Celery + PostgreSQL + pgvector、埋め込みには nomic-embed-text-v2-moe(768d) を使っています。
独自の安全サンプルベンチでは R@5 0.86 / MRR 0.753 程度でした。

法律相談の代替ツールではなく、出典条文の探索を補助するためのものです。
実際の判断は有資格の専門家に相談してください。

フィードバック / PR 歓迎です。

まだコメントはありません。

まだコメントはありません。