Google、エンドツーエンドのニューラル音声コーデック SoundStream を公開
(ai.googleblog.com)- 音声と音楽の両方に適用できる初のニューラルネットワークコーデック
→ リアルタイムでスマートフォンの CPU 上で実行可能
→ 高品質オーディオとクリアな音声、ノイズや残響の多い音声、音楽、環境音を含むさまざまなサウンドタイプをエンコード
- 両端でニューラルネットワークを用いて学習され、圧縮と音質向上を同時に行うことで高品質なオーディオを提供
→ SoundStream は 3kbps で Opus 12 kpbs を上回り、EVS 9.6bps 程度の品質を提供
→ 3.2x-4x 少ないビットしか使わないため、転送量を大幅に削減可能
→ 優れたレベルのノイズ除去が可能
- 今年初めに公開した低ビットレート音声向けコーデック Lyra に統合予定
1件のコメント
Opusもかなり優れていることで有名ですが
すごいですね