4 ポイント 投稿者 xguru 2021-05-24 | まだコメントはありません。 | WhatsAppで共有
  • Facebook AIチームが開発した音声認識フレームワーク

  • 書き起こし済みの音声データなしで多様な言語認識をサポート

→ 約1000時間分の音声で学習した教師あり学習モデルに近い性能

→ 書き起こし音声データが多くないスワヒリ語やタタール語などでテスト

  • ラベル付けされていない音声の構造を学習する方式

→ 音声録音を、それぞれのサウンドに緩やかに対応する音声単位へ分割

→ cat には「/K/」「/AE/」「/T/」の3つの音が含まれる

→ generator と discriminator で構成された GAN で学習

  • コードと論文を公開

まだコメントはありません。

まだコメントはありません。