Meta、音声向け生成AIモデル「Voicebox」を公開

xguru · 2023-06-21T11:06:02+09:00

画像/テキスト生成AIのように、多様なスタイルで高品質なオーディオクリップを生成与えられた音声サンプルの修正も可能 6言語の音声を合成するだけでなく、ノイズ除去、コンテンツ編集、スタイル変換、多様なサンプル生成にも対応従来の音声向け生成AIは、各タスクごとに慎重に準備した訓練データを必要としていた。Voiceboxは新しい手法を用いて、生の音声と文字起こしデータで学習英語、フランス語、スペイン語、ドイツ語、ポーランド語、ポルトガル語のパブリックドメインのオーディオブック5万時間以上を使って訓練

(ai.facebook.com)

15 ポイント投稿者 xguru 2023-06-21 | 2件のコメント | WhatsAppで共有

画像/テキスト生成AIのように、多様なスタイルで高品質なオーディオクリップを生成
与えられた音声サンプルの修正も可能
6言語の音声を合成するだけでなく、ノイズ除去、コンテンツ編集、スタイル変換、多様なサンプル生成にも対応
従来の音声向け生成AIは、各タスクごとに慎重に準備した訓練データを必要としていた。Voiceboxは新しい手法を用いて、生の音声と文字起こしデータで学習
英語、フランス語、スペイン語、ドイツ語、ポーランド語、ポルトガル語のパブリックドメインのオーディオブック5万時間以上を使って訓練

2件のコメント

zer0ne 2023-06-21

楽曲からボーカルだけを除去して高品質なMRを作るのに使えるのか、よく分かりませんね

cosine20 2023-06-22

それには、すでに実用的なオープンソースがあります:
https://github.com/Anjok07/ultimatevocalremovergui

Meta、音声向け生成AIモデル「Voicebox」を公開

関連記事

2件のコメント