Kitten TTS - CPUのみで動作する25MBのオープンソースTTSモデル
(github.com/KittenML)- Kitten TTSは、軽量化と高音質を同時に追求するオープンソースのTTS(テキスト読み上げ)モデル
- 1,500万パラメータ בלבדで、モデルサイズは25MB未満
- 他の大規模TTSと異なり、モバイル、組み込みなどあらゆる環境で実行できる点が大きな特徴
- GPUがなくても、あらゆるデバイスで高品質な音声合成を処理可能
- 多様なプレミアム音声オプションを提供し、実際の音声に近い高音質な音声合成をサポート
- 高速な音声推論が可能で、リアルタイム合成に最適化
- 開発者プレビュー版モデルが公開されており、今後は学習完了済みの全モデル重み、モバイルSDK、Web版などを順次公開予定
まだコメントはありません。