wav2vec-U：教師あり学習不要の高性能音声認識

xguru · 2021-05-24T09:20:05+09:00

Facebook AIチームが開発した音声認識フレームワーク書き起こし済みの音声データなしで多様な言語認識をサポート → 約1000時間分の音声で学習した教師あり学習モデルに近い性能 → 書き起こし音声データが多くないスワヒリ語やタタール語などでテストラベル付けされていない音声の構造を学習する方式 → 音声録音を、それぞれのサウンドに緩やかに対応する音声単位へ分割 → cat には「/K/」「/AE/」「/T/」の3つの音が含まれる → generator と discriminator で構成された GAN で学習コードと論文を公開

(ai.facebook.com)

4 ポイント投稿者 xguru 2021-05-24 | まだコメントはありません。 | WhatsAppで共有

Facebook AIチームが開発した音声認識フレームワーク
書き起こし済みの音声データなしで多様な言語認識をサポート

→ 約1000時間分の音声で学習した教師あり学習モデルに近い性能

→ 書き起こし音声データが多くないスワヒリ語やタタール語などでテスト

ラベル付けされていない音声の構造を学習する方式

→ 音声録音を、それぞれのサウンドに緩やかに対応する音声単位へ分割

→ cat には「/K/」「/AE/」「/T/」の3つの音が含まれる

→ generator と discriminator で構成された GAN で学習

コードと論文を公開

wav2vec-U：教師あり学習不要の高性能音声認識

関連記事

まだコメントはありません。