wav2vec-U:教師あり学習不要の高性能音声認識
(ai.facebook.com)-
Facebook AIチームが開発した音声認識フレームワーク
-
書き起こし済みの音声データなしで多様な言語認識をサポート
→ 約1000時間分の音声で学習した教師あり学習モデルに近い性能
→ 書き起こし音声データが多くないスワヒリ語やタタール語などでテスト
- ラベル付けされていない音声の構造を学習する方式
→ 音声録音を、それぞれのサウンドに緩やかに対応する音声単位へ分割
→ cat には「/K/」「/AE/」「/T/」の3つの音が含まれる
→ generator と discriminator で構成された GAN で学習
- コードと論文を公開
まだコメントはありません。