Meta、音声向け生成AIモデル「Voicebox」を公開
(ai.facebook.com)- 画像/テキスト生成AIのように、多様なスタイルで高品質なオーディオクリップを生成
- 与えられた音声サンプルの修正も可能
- 6言語の音声を合成するだけでなく、ノイズ除去、コンテンツ編集、スタイル変換、多様なサンプル生成にも対応
- 従来の音声向け生成AIは、各タスクごとに慎重に準備した訓練データを必要としていた。Voiceboxは新しい手法を用いて、生の音声と文字起こしデータで学習
- 英語、フランス語、スペイン語、ドイツ語、ポーランド語、ポルトガル語のパブリックドメインのオーディオブック5万時間以上を使って訓練
2件のコメント
楽曲からボーカルだけを除去して高品質なMRを作るのに使えるのか、よく分かりませんね
それには、すでに実用的なオープンソースがあります:
https://github.com/Anjok07/ultimatevocalremovergui