16 ポイント 投稿者 xguru 2024-05-07 | まだコメントはありません。 | WhatsAppで共有
  • Linux、Windows、Android およびその他の OS
  • "Formant Synthesis(フォルマント合成)" 方式を使用する eSpeak エンジンベース
    • 小さなサイズで多くの言語をサポートするため、Windows や Google 翻訳エンジンなどで使われていたことがある(現在は多くが独自エンジンに置き換えられている)
    • 音声は明瞭で高速に利用できるが、人間の音声録音をベースにする大規模な合成器ほど自然だったり滑らかだったりはしない
    • また、Klatt フォルマント合成をサポートし、バックエンド音声合成器として MBROLA を利用可能
  • サポート形態
    • コマンドラインプログラム : Linux & Windows。ファイルおよび Stdin で受け取った文字列を読み上げ
    • Shared ライブラリ(Windows では DLL)
    • Windows 向け SAPI5 バージョン。スクリーンリーダーや他のプログラムで SAPI5 インターフェース経由で利用可能
    • Solaris、MacOS を含むさまざまなプラットフォームへ移植
  • 機能
    • 特性を変更できるさまざまな音声を含む
    • 音声出力を WAV ファイルとして生成可能
    • SSML(音声合成マークアップ言語)をサポートし(完全ではない)、HTML もサポート
    • コンパクトなサイズ。複数言語を含むプログラムとデータの総容量は数 MB 程度
    • MBROLA diphone Voices のフロントエンドとして使用可能。eSpeak NG はテキストを音程と長さの情報を持つ音素に変換
      • MBROLA は音声合成のための音節集合で構成されたオープンソースの音声エンジン
      • 音声は商用目的でない場合は無料で提供されるが、オープンソースではない
    • テキストを音素コードに変換できるため、他の音声合成エンジンのフロントエンドとして適用可能
    • 他言語向けのサポート追加が可能。複数の言語がさまざまな段階で含まれている
    • C で書かれている

まだコメントはありません。

まだコメントはありません。