9 ポイント 投稿者 vulcanidic 2024-12-08 | 1件のコメント | WhatsAppで共有

Voice-Proは、音声認識、翻訳、音声合成をサポートするGradio WebUIです。

主な機能:

  • ゼロショットのボイスクローニング。15秒の音声サンプルだけで利用可能。50人以上のセレブ音声を提供
  • YouTubeオーディオのダウンロード
  • ボーカル分離
  • 多言語テキスト読み上げ(Edge-TTS、F5-TTS)
  • 多言語翻訳
  • さまざまなWhisperエンジンをサポート(Whisper、Faster-Whisper、Whisper-Timestamped)

動画デモ:

GitHub:
https://github.com/abus-aikorea/voice-pro

1件のコメント

 
yangeok 2024-12-16

韓国の方が作られたみたいですね