8 ポイント 投稿者 xguru 2025-02-19 | 2件のコメント | WhatsAppで共有

Audiblezとは?

  • .epub 電子書籍を .m4b オーディオブックに変換するツール
  • Kokoro-82M ベースの高品質な音声合成を使用
  • Apache ライセンスで提供され、100時間以下の音声データで学習
  • Google Colab の T4 GPU では「1秒あたり600文字の変換速度」で "Animal Farm" を約5分以内に変換可能
  • M2 MacBook Pro(CPU モード)では「1秒あたり60文字の速度で約1時間を要する」
    • Apple Silicon(M1、M2)では現在 CUDA をサポートしていない(MLX 対応待ち)

Audiblez 4.2 の主なアップデート

  • wxWidgets ベースのマルチプラットフォーム GUI をサポート(Mac、Windows、Linux)
  • 多言語対応(英語、スペイン語、フランス語、ヒンディー語、イタリア語、日本語、ポルトガル語、中国語)
  • ONNX から kokoro パッケージを使用する Torch ベースへ変更
  • CUDA アクセラレーションをサポート(ただし Apple Silicon では CPU モードで実行)
  • オーディオブックに表紙画像とチャプターのタイムスタンプを含める
  • Windows 対応を改善

2件のコメント

 
xguru 2025-02-19

Kokoro-82Mモデルで電子書籍をオーディオブックに変換する
これがベースですが、ここに含まれている韓国語はAudiblezにはありませんね(コメントでKokoroの韓国語品質はいまひとつだという話はあります)

 
inosphe 2025-02-19

kokoroプロジェクトの過去の記録を見ると、たしかに韓国語の音声があったのですが、Discord側の議論を見る限り、韓国のAIHubの海外データ持ち出し禁止条項のため、配布には苦労している状況のようです……