Voice-Pro – 音声認識、翻訳、音声合成をサポートするGradio WebUI

(github.com/abus-aikorea)

9 ポイント投稿者 vulcanidic 2024-12-08 | 1件のコメント | WhatsAppで共有

Voice-Proは、音声認識、翻訳、音声合成をサポートするGradio WebUIです。

主な機能:

ゼロショットのボイスクローニング。15秒の音声サンプルだけで利用可能。50人以上のセレブ音声を提供
YouTubeオーディオのダウンロード
ボーカル分離
多言語テキスト読み上げ（Edge-TTS、F5-TTS）
多言語翻訳
さまざまなWhisperエンジンをサポート（Whisper、Faster-Whisper、Whisper-Timestamped）

動画デモ:

Voice-Pro使用チュートリアル: https://youtu.be/z8g8LMhoh_o
Voice-Cloningポッドキャスト制作デモ: https://youtu.be/Wfo7vQCD4no
デモとサンプル動画: https://youtube.com/playlist/?list=PLwx5dnMDVC9Y7dAjm9r26CZUw1uU5VIeq

GitHub:
https://github.com/abus-aikorea/voice-pro

1件のコメント

yangeok 2024-12-16

韓国の方が作られたみたいですね