2 ポイント 投稿者 GN⁺ 2024-06-14 | 1件のコメント | WhatsAppで共有
  • MetaはWhatsApp、Instagram、Messengerなどのアプリを通じて、数十億人の人々にリアルタイム通信(RTC)を提供している。
  • 高速な接続や最新のスマートフォンを持たないユーザーにも高品質な体験を提供できるよう取り組んでいる。
  • Metaは低速接続でも音声品質を改善するMeta Low Bitrate(MLow)コーデックを開発した。

新しいコーデック開発の動機

  • Meta製品における大規模なRTC利用により、さまざまなネットワーク環境でのコーデック性能を観測できた。
  • 多くの通話は、ネットワーク接続が良くない状況で行われている。
  • Opusコーデックは、低ビットレートでは十分な音声品質を提供できない。
  • 新しいMLベースの音声コーデックは低ビットレートで良好な品質を提供するが、計算コストが高いことが問題である。
  • 多くのユーザーが低価格帯の端末を使っているため、計算要件が低く高品質な音声コーデックが必要である。

MLowコーデック

  • MLowコーデックはOpusより2倍優れた品質を提供し、計算複雑度は10%低い。
  • MLowはInstagramとMessengerにはすでに完全導入されており、WhatsAppにも積極的に導入が進められている。
  • 低ビットレートでも高品質な音声をエンコードできるため、パケット損失が発生するシナリオで音声品質を大きく向上させる。

MLowの内部構造

  • MLowはCELP(Code Excited Linear Prediction)コーデックの概念を基盤として発展させた技術を用いている。
  • 入力信号を低周波帯域と高周波帯域に分け、それぞれをエンコードする。
  • 高周波帯域を少ないビット数でエンコードすることで、低ビットレートでSuperWideBand(32kHzサンプリング)を提供する。

今後の計画

  • MLowは低価格帯の端末でも音声品質を大きく向上させる。
  • パケット損失の多いネットワークで音声復元を改善するため、より多くの冗長音声を効率的に提供していく計画である。

GN⁺の見解

  • MLowの利点: 低速接続でも高い音声品質を提供し、ユーザー体験を大きく向上させる。
  • 技術的課題: 低い計算複雑度で高品質を維持することは、技術的に非常に難しい課題である。
  • 競合製品: Opus以外にもさまざまな音声コーデックが存在するが、MLowは低価格帯の端末でも優れた性能を提供する。
  • 導入時の考慮事項: 新しいコーデックを導入する際は、既存システムとの互換性や性能テストが重要である。
  • ユーザーへの影響: 低価格帯の端末を利用する多くのユーザーに大きな恩恵をもたらす可能性がある。

1件のコメント

 
GN⁺ 2024-06-14
Hacker Newsの意見
  • 新しい低ビットレートコーデック: リアルタイム通信では遅延を減らすためにパケットレートを高くする必要があり、その結果、実際のペイロードよりもオーバーヘッドの方が大きくなることがある。ただし、回線交換通信やヘッダー圧縮を使うVoIPシステムでは有用かもしれない。

  • Metaの研究共有: Metaは多くの研究やオープンソースの取り組みを共有しており、再び好感を得つつあるように見える。Facebookの評判は悪かったが、それをいくらか取り戻したようだ。

  • Codec2との比較不足: Codec2との比較がないため、この取り組みの実際の価値や動機に疑問が生じる。新たなIPに縛られたオーディオコーデックは必要ない。

  • Google Meetとの比較: Google Meetは遅いインターネット環境でも音声通話をうまくこなしているが、このコーデックがGoogle Meetより優れているのか気になる。Google Meetの技術は公開されていない。

  • 電話通話の品質: なぜ最近の電話通話は、90年代の8kHz 8ビット μ-law ADPCMよりも明瞭でないのか気になる。

  • Pied Piperとの比較不足: Pied Piperとの比較がない。

  • リリースの有無: このコーデックが実際にリリースされるのか、それとも単なる技術デモなのか気になる。Meta AI Researchは革新的だが、このコーデックに関する他の参照を見つけられない。

  • ライセンス: ライセンスに関する情報がない。

  • NoLACEへの言及不足: NoLACEが言及されていないため、比較サンプルの有用性が下がっている。

  • Opusとの比較: Opusは6 kbpsでより滑らかな音を出す一方、MLowのサンプルには粗く人工的なアーティファクトがある。より高いビットレートでは、どちらを選ぶべきかはもっと明確になるだろう。