OpenVoice v2 - 多機能なインスタント音声クローン
(github.com/myshell-ai)- v2のリリースにより、より高い音声品質、韓国語を含む多言語対応、商用利用も無料
- 話者の短い音声クリップだけで音声を複製し、複数の言語で音声を生成可能
- 参照話者の声色を複製するだけでなく、感情、イントネーション、リズム、間、抑揚などの音声スタイルを細かく制御
- 学習セットに含まれていない言語に対しても、ゼロショット(zero-shot)のクロスリンガル音声クローンを実現
- 商用利用可能なAPIより数十倍少ない計算コストで優れた性能を提供
- V1のすべての機能を含むV2の変更点(2024/04リリース)
- より高い音声品質: V2は、より高い音声品質を提供する別のトレーニング戦略を採用
- ネイティブな多言語対応: 英語、スペイン語、フランス語、中国語、日本語、韓国語がOpenVoice V2で標準サポート
- 無料の商用利用が可能: 2024年4月から、V2とV1はどちらもMITライセンスで公開され、商用利用も無料
1件のコメント
GN⁺: OpenVoice:多用途な即時音声複製技術
GN⁺: OpenVoice - 多用途なインスタント音声複製技術
GN+でこれまで何度か取り上げられていましたが、今回V2の公開により多言語がサポートされ、日本語も追加されました。