Voice-Pro – 音声認識、翻訳、音声合成をサポートするGradio WebUI
(github.com/abus-aikorea)Voice-Proは、音声認識、翻訳、音声合成をサポートするGradio WebUIです。
主な機能:
- ゼロショットのボイスクローニング。15秒の音声サンプルだけで利用可能。50人以上のセレブ音声を提供
- YouTubeオーディオのダウンロード
- ボーカル分離
- 多言語テキスト読み上げ(Edge-TTS、F5-TTS)
- 多言語翻訳
- さまざまなWhisperエンジンをサポート(Whisper、Faster-Whisper、Whisper-Timestamped)
動画デモ:
-
Voice-Pro使用チュートリアル: https://youtu.be/z8g8LMhoh_o
-
Voice-Cloningポッドキャスト制作デモ: https://youtu.be/Wfo7vQCD4no
-
デモとサンプル動画: https://youtube.com/playlist/?list=PLwx5dnMDVC9Y7dAjm9r26CZUw1uU5VIeq
1件のコメント
韓国の方が作られたみたいですね