- MetaはWhatsApp、Instagram、Messengerなどのアプリを通じて、数十億人の人々にリアルタイム通信(RTC)を提供している。
- 高速な接続や最新のスマートフォンを持たないユーザーにも高品質な体験を提供できるよう取り組んでいる。
- Metaは低速接続でも音声品質を改善するMeta Low Bitrate(MLow)コーデックを開発した。
新しいコーデック開発の動機
- Meta製品における大規模なRTC利用により、さまざまなネットワーク環境でのコーデック性能を観測できた。
- 多くの通話は、ネットワーク接続が良くない状況で行われている。
- Opusコーデックは、低ビットレートでは十分な音声品質を提供できない。
- 新しいMLベースの音声コーデックは低ビットレートで良好な品質を提供するが、計算コストが高いことが問題である。
- 多くのユーザーが低価格帯の端末を使っているため、計算要件が低く高品質な音声コーデックが必要である。
MLowコーデック
- MLowコーデックはOpusより2倍優れた品質を提供し、計算複雑度は10%低い。
- MLowはInstagramとMessengerにはすでに完全導入されており、WhatsAppにも積極的に導入が進められている。
- 低ビットレートでも高品質な音声をエンコードできるため、パケット損失が発生するシナリオで音声品質を大きく向上させる。
MLowの内部構造
- MLowはCELP(Code Excited Linear Prediction)コーデックの概念を基盤として発展させた技術を用いている。
- 入力信号を低周波帯域と高周波帯域に分け、それぞれをエンコードする。
- 高周波帯域を少ないビット数でエンコードすることで、低ビットレートでSuperWideBand(32kHzサンプリング)を提供する。
今後の計画
- MLowは低価格帯の端末でも音声品質を大きく向上させる。
- パケット損失の多いネットワークで音声復元を改善するため、より多くの冗長音声を効率的に提供していく計画である。
GN⁺の見解
- MLowの利点: 低速接続でも高い音声品質を提供し、ユーザー体験を大きく向上させる。
- 技術的課題: 低い計算複雑度で高品質を維持することは、技術的に非常に難しい課題である。
- 競合製品: Opus以外にもさまざまな音声コーデックが存在するが、MLowは低価格帯の端末でも優れた性能を提供する。
- 導入時の考慮事項: 新しいコーデックを導入する際は、既存システムとの互換性や性能テストが重要である。
- ユーザーへの影響: 低価格帯の端末を利用する多くのユーザーに大きな恩恵をもたらす可能性がある。
1件のコメント
Hacker Newsの意見
新しい低ビットレートコーデック: リアルタイム通信では遅延を減らすためにパケットレートを高くする必要があり、その結果、実際のペイロードよりもオーバーヘッドの方が大きくなることがある。ただし、回線交換通信やヘッダー圧縮を使うVoIPシステムでは有用かもしれない。
Metaの研究共有: Metaは多くの研究やオープンソースの取り組みを共有しており、再び好感を得つつあるように見える。Facebookの評判は悪かったが、それをいくらか取り戻したようだ。
Codec2との比較不足: Codec2との比較がないため、この取り組みの実際の価値や動機に疑問が生じる。新たなIPに縛られたオーディオコーデックは必要ない。
Google Meetとの比較: Google Meetは遅いインターネット環境でも音声通話をうまくこなしているが、このコーデックがGoogle Meetより優れているのか気になる。Google Meetの技術は公開されていない。
電話通話の品質: なぜ最近の電話通話は、90年代の8kHz 8ビット μ-law ADPCMよりも明瞭でないのか気になる。
Pied Piperとの比較不足: Pied Piperとの比較がない。
リリースの有無: このコーデックが実際にリリースされるのか、それとも単なる技術デモなのか気になる。Meta AI Researchは革新的だが、このコーデックに関する他の参照を見つけられない。
ライセンス: ライセンスに関する情報がない。
NoLACEへの言及不足: NoLACEが言及されていないため、比較サンプルの有用性が下がっている。
Opusとの比較: Opusは6 kbpsでより滑らかな音を出す一方、MLowのサンプルには粗く人工的なアーティファクトがある。より高いビットレートでは、どちらを選ぶべきかはもっと明確になるだろう。