Mozilla Common Voice

(voice.mozilla.org)

5 ポイント投稿者 xguru 2019-12-06 | 7件のコメント | WhatsAppで共有

誰でも使える音声認識技術を作り、利用可能にするために、さまざまな言語のデータを集めて精製するオープンソースの音声データベースです。

日本語版ではまだデータがあまり足りません。参加して一緒に作りましょう。

多くの企業が作る音声データセットは、外部で利用するのが難しいことが多いです。

だからこそ、オープンに作られるデータが重要です。特に日本語ではなおさらです。

7件のコメント

sduck4 2019-12-06

Goalを設定する部分に韓国語がなくて、進められませんね..

sduck4 2019-12-06

韓国語データセットは、まだ文章サイトのローカライズや文セットが不足していてできなかったんですね。

sduck4 2019-12-06

サイトの翻訳が完了し、5,000文以上が収集されると、音声の収集と検証が可能になるようです。ご関心のある方はぜひご参加ください。

xguru 2019-12-06

同じコメントを付けて、削除してしまいましたね（笑）

ここにそのように説明されています。

sduck4 2019-12-06

あっ…はい（笑）、私も削除しようとしたんですが、削除ボタンがなくて戸惑いました…。

それと関連して、韓国語のコーパスがいくつかあるようですが、著作権の問題があるので、載せてもいいのか分からないですね。

xguru 2019-12-06

あ、コメントの削除はコメント上部のID横にある時間のリンクを押すと、コメントページ内で削除できます。

xguru 2019-12-06

既存で公開されている韓国語音声認識オープンソースには、Kaldi を使った Zeroth プロジェクトもあります。

（ GitHub の内容を見ると、最終モデルは2018年7月版のようですね）