OpenVoice v2 - 多機能なインスタント音声クローン

xguru · 2024-04-29T09:31:01+09:00

v2のリリースにより、より高い音声品質、韓国語を含む多言語対応、商用利用も無料話者の短い音声クリップだけで音声を複製し、複数の言語で音声を生成可能参照話者の声色を複製するだけでなく、感情、イントネーション、リズム、間、抑揚などの音声スタイルを細かく制御学習セットに含まれていない言語に対しても、ゼロショット（zero-shot）のクロスリンガル音声クローンを実現商用利用可能なAPIより数十倍少ない計算コストで優れた性能を提供 V1のすべての機能を含むV2の変更点（2024/04リリース）より高い音声品質: V2は、より高い音声品質を提供する別のトレーニング戦略を採用ネイティブな多言語対応: 英語、スペイン語、フランス語、中国語、日本語、韓国語がOpenVoice V2で標準サポート無料の商用利用が可能: 2024年4月から、V2とV1はどちらもMITライセンスで公開され、商用利用も無料

(github.com/myshell-ai)

34 ポイント投稿者 xguru 2024-04-29 | 1件のコメント | WhatsAppで共有

v2のリリースにより、より高い音声品質、韓国語を含む多言語対応、商用利用も無料
話者の短い音声クリップだけで音声を複製し、複数の言語で音声を生成可能
参照話者の声色を複製するだけでなく、感情、イントネーション、リズム、間、抑揚などの音声スタイルを細かく制御
学習セットに含まれていない言語に対しても、ゼロショット（zero-shot）のクロスリンガル音声クローンを実現
商用利用可能なAPIより数十倍少ない計算コストで優れた性能を提供
V1のすべての機能を含むV2の変更点（2024/04リリース）
- より高い音声品質: V2は、より高い音声品質を提供する別のトレーニング戦略を採用
- ネイティブな多言語対応: 英語、スペイン語、フランス語、中国語、日本語、韓国語がOpenVoice V2で標準サポート
- 無料の商用利用が可能: 2024年4月から、V2とV1はどちらもMITライセンスで公開され、商用利用も無料

1件のコメント

xguru 2024-04-29

GN⁺: OpenVoice：多用途な即時音声複製技術
 GN⁺: OpenVoice - 多用途なインスタント音声複製技術

GN+でこれまで何度か取り上げられていましたが、今回V2の公開により多言語がサポートされ、日本語も追加されました。

OpenVoice v2 - 多機能なインスタント音声クローン

関連記事

1件のコメント