4 ポイント 投稿者 brainer 2023-12-10 | 4件のコメント | WhatsAppで共有

タイプミスが多くても、かなりうまく検索できるPythonライブラリや手法はありますか?

4件のコメント

 
n0roo 2023-12-10

RDBMS を使い、対象がフルテキストであれば、たいていは PostgreSQL に焦点を当てますね。
それより簡単な道を行くなら MongoDB。
難しくてスリリングな道を行くなら、ハングルを正準分解してハッシュ比較したり、ASCII 値に置き換えてインデックス化したりする方法がありますが、基本はまず NFD や NFC への対応からです。

 
brainer 2023-12-11

詳しいご回答ありがとうございます。

関連内容について調べてみる必要がありそうですね。

 
joyfui 2023-12-10

ふと思い出した記事があります。ただ、JavaScriptライブラリで、誤字検索というよりは初声検索に効果的という点ですが……
https://taegon.kim/archives/10671

 
brainer 2023-12-11

GeekNewsで見たことがありますね。

ご回答ありがとうございます。