私はメディア翻訳会社に勤めており、字幕エディタを提供しています。
エディタにはスペルチェック機能があり、字幕全体をテキストに変換して(分割して)APIを呼び出しています。
今は bing API を使っていますが、かなり性能が良くありません。拾うべきものを拾えず、拾うべきでないものを拾ってしまいます。
試してみた代替案は次のとおりです。
- AWS のスペルチェックは1回の呼び出しで20文字制限があり、使うのがとても難しく
- Grammarly は昨年 API サポートが終了しており
- https://sapling.ai/ をテストしてみましたが、むしろ bing の品質のほうが良く
- https://rapidapi.com/collection/grammar-spellcheck-api ここにあるものもすべてテストしましたが、bing より特に優れているとは言い難かったです。
必ずしも「多言語」でなくても、英語だけでもしっかり検出できれば良いのですが、良い代替案があまりありません。製品のおすすめでなくても、スペルチェックを試した経験を共有していただけるとありがたいです。
1件のコメント
https://huggingface.co/mzbac/mistral-grammar/tree/main
多言語という言葉に惹かれてMistral系を探していたところ、こういうものがありましたが、製品レベルまで満たす程度かどうかはよく分かりません...
英語向けにファインチューニングされたようですが、このモデルを一度試してみてはいかがでしょうか