34 ポイント 投稿者 xguru 2024-04-29 | 1件のコメント | WhatsAppで共有
  • v2のリリースにより、より高い音声品質、韓国語を含む多言語対応、商用利用も無料
  • 話者の短い音声クリップだけで音声を複製し、複数の言語で音声を生成可能
  • 参照話者の声色を複製するだけでなく、感情、イントネーション、リズム、間、抑揚などの音声スタイルを細かく制御
  • 学習セットに含まれていない言語に対しても、ゼロショット(zero-shot)のクロスリンガル音声クローンを実現
  • 商用利用可能なAPIより数十倍少ない計算コストで優れた性能を提供
  • V1のすべての機能を含むV2の変更点(2024/04リリース)
    • より高い音声品質: V2は、より高い音声品質を提供する別のトレーニング戦略を採用
    • ネイティブな多言語対応: 英語、スペイン語、フランス語、中国語、日本語、韓国語がOpenVoice V2で標準サポート
    • 無料の商用利用が可能: 2024年4月から、V2とV1はどちらもMITライセンスで公開され、商用利用も無料

1件のコメント

 
xguru 2024-04-29

GN⁺: OpenVoice:多用途な即時音声複製技術
GN⁺: OpenVoice - 多用途なインスタント音声複製技術

GN+でこれまで何度か取り上げられていましたが、今回V2の公開により多言語がサポートされ、日本語も追加されました。