Audiblezとは?
.epub 電子書籍を .m4b オーディオブックに変換するツール
- Kokoro-82M ベースの高品質な音声合成を使用
- Apache ライセンスで提供され、100時間以下の音声データで学習
- Google Colab の T4 GPU では「1秒あたり600文字の変換速度」で "Animal Farm" を約5分以内に変換可能
- M2 MacBook Pro(CPU モード)では「1秒あたり60文字の速度で約1時間を要する」
- Apple Silicon(M1、M2)では現在 CUDA をサポートしていない(MLX 対応待ち)
Audiblez 4.2 の主なアップデート
- wxWidgets ベースのマルチプラットフォーム GUI をサポート(Mac、Windows、Linux)
- 多言語対応(英語、スペイン語、フランス語、ヒンディー語、イタリア語、日本語、ポルトガル語、中国語)
- ONNX から
kokoro パッケージを使用する Torch ベースへ変更
- CUDA アクセラレーションをサポート(ただし Apple Silicon では CPU モードで実行)
- オーディオブックに表紙画像とチャプターのタイムスタンプを含める
- Windows 対応を改善
2件のコメント
Kokoro-82Mモデルで電子書籍をオーディオブックに変換する
これがベースですが、ここに含まれている韓国語はAudiblezにはありませんね(コメントでKokoroの韓国語品質はいまひとつだという話はあります)
kokoroプロジェクトの過去の記録を見ると、たしかに韓国語の音声があったのですが、Discord側の議論を見る限り、韓国のAIHubの海外データ持ち出し禁止条項のため、配布には苦労している状況のようです……