ppaso-tts : エッジデバイス向け軽量韓国語TTS
(huggingface.co)スタンドアロンのエッジデバイスAIに関心があります。
RK3576チップセットは6 TOPSのNPUを搭載していますが、軽量な英語TTSモデルはしばしば見かける一方で、韓国語TTSモデルはほとんどありませんでした。
MeloTTS-ko の場合は、直接RKNN変換を通じて韓国語の利用が可能でしたが、EncoderはRKNN変換が不可能で、速度もそれほど速くありませんでした。
そこで、エッジデバイスでも使えるように、品質よりも速度に重点を置いた軽量な韓国語TTSモデルを作りました。
不自然な機械音声の発話ではありますが、リアルタイム水準の音声生成が可能です。 (RK3576基準)
Apache 2.0で公開したので、エッジデバイスで品質よりも速度が速い韓国語TTSを探している方がいれば、役に立つかもしれないと思い投稿します。
まだコメントはありません。