1 ポイント 投稿者 GN⁺ 4 시간 전 | 1件のコメント | WhatsAppで共有
  • AV2はAOMediaの次世代ビデオコーディング仕様で、AV1を基盤として、より高い圧縮効率と低ビットレートでの高品質配信を目指している
  • 最終v1.0.0仕様はビットストリーム文法、セマンティクス、デコード手順を扱い、AV2実装の適合性を判断する技術的リファレンスとなる
  • ストリーミング、放送、リアルタイムビデオ会議向けに最適化されており、AR/VR、分割画面配信、画面コンテンツ処理の改善もサポートする
  • 現在のリリースは、2026年5月28日に公開されたAV2 Bitstream & Decoding Process Specification v1.0.0とAVM参照ソフトウェアで構成される
  • 実装者はオンライン仕様、PDF、Cヘッダーの参照テーブル、Syntax Browser、AVM v1.0.0タグを活用でき、v13ドラフトは参照用として残されている

AV2概要

  • AV2はAlliance for Open Media(AOMedia)の次世代ビデオコーディング仕様で、AV1を基盤として、より高い圧縮効率を提供するよう設計されている
  • はるかに低いビットレートで高品質ビデオを配信することを目標としており、ストリーミング、放送、リアルタイムビデオ会議の要件に合わせて最適化されている
  • v1.0.0仕様はAV2実装のための最終技術リファレンスであり、完全な適合性に必要なビットストリーム文法、セマンティクス、デコード手順を扱う
  • AV2はAR/VRアプリケーション、複数プログラムの分割画面配信、画面コンテンツ処理の改善、より広い視覚品質レンジでの動作をサポートする
  • 実装者向けの公式参照ソフトウェアとしてAOMedia Video Model(AVM) が提供される
  • フィードバックや問題はwg-codec-chair@aomedia.orgへ送るか、AVM issue trackerに登録できる

リリースと実装資料

  • AV2 specification and reference code v1.0.0

    • 現在のリリースは、2026年5月28日に公開されたAV2 Bitstream & Decoding Process Specification v1.0.0と、それに対応するAVM参照ソフトウェアである
    • Read Online: v1.0.0仕様のオンライン文書
    • Download PDF: 完全なv1.0.0仕様PDF
    • Additional Tables: セクション9から抽出した参照テーブルのCヘッダーファイル
    • Syntax Browser: 文法構造とセマンティクスをあわせて探索できるブラウザー
    • Software: v1.0.0タグのAVM参照ソフトウェア
  • AV2 working draft v13

    • v13作業ドラフトは2026年1月5日に公開され、v1.0.0に置き換えられた
    • 「v13」ラベルは作業ドラフトのマイルストーンを意味し、v1.0.0より新しいバージョンという意味ではない
    • 参照目的で保存されている
    • Read Online: v13オンライン文書
    • Additional Tables: v13追加テーブル
    • Syntax Browser: v13文法ブラウザー
    • Software: research-v13.0.0参照ソフトウェア
    • Release Notes: v13リリースノート
  • 仕様活用資料

    • 完全な仕様は、範囲と定義から付録までを含み、形式、文法、セマンティクス、デコード手順を網羅する
    • PDF版は、完全なv1.0.0仕様をオフライン参照用として提供する
    • Additional Tablesは、実装参照に有用なセクション9の参照テーブルをCヘッダーファイルとして抽出した資料である
    • Syntax Browserは、セクション5のSyntax Structuresとセクション6のSemanticsを分割ウィンドウのインターフェースで提供する
    • Syntax Browserでは、文法定義とセマンティクスの並列表示、クリック可能な文法要素、両セクション検索、文法構造のコピーが可能である
    • Reference Softwareは仕様v1.0.0に対応するAVMであり、v1.0.0タグが該当バージョンである

1件のコメント

 
GN⁺ 4 시간 전
Hacker Newsのコメント
  • AV2は非常に長い道のりの一段階にすぎず、現状では実用は事実上難しいと思う
    まともなハードウェアでもエンコーダは通常1fps程度で、最初のAV2ハードウェアアクセラレーションチップが出る2028年ごろまではその状態が続く可能性が高く、AV2ストリームが一般的になるのは2030年ごろになりそう
    効率向上だけを見ればAV1比で**20〜30%**とかなり大きいが、AV2にそこまでの価値があるかは微妙。ただしマルチストリーム対応はVRやライブスポーツに大きな利点があり、アルファチャンネルを別ストリームとして送ってファイル内で合成し、まともな透過動画をサポートできる点も面白い

    • AV1の流れを見ると、ハードウェアエンコーディングは必須ではない。あれば望ましいが、現在のエンコーダはリファレンスエンコーダだ
      仕様が確定したので、実製品向けエンコーダでは速度が大きく改善する可能性がある。ただしリアルタイムエンコーディングは、ハードウェア実装が入るまでは難しい可能性が高い
    • 「最大の追加機能がマルチストリーム対応」だとしたら、これはビデオコーデックというよりコンテナフォーマットの領域だと思っていた
    • 今の流れだと、PCでAV2ハードウェアエンコーダを近いうちに見るのは難しいと思う。最新・最高性能のチップ製造能力はAppleとAI企業にほぼ吸い上げられている
      チップメーカーがAV2設計をより古く安価なプロセスへ移さない限り一般ユーザーには厳しく、中国のTV向けチップメーカーがチェックボックスを埋めるためのAV2デコーダを載せることはあっても、実用的なエンコーダは当面期待しにくい
    • GPU開発がNPU寄りに逸れているのを見ると、これは早くても2035年目標のように感じる。メーカーは行列演算向けのシリコン面積を最大化しようとするはず
      データセンターに兆単位の投資が入る時代ではトラフィックコストは後回しで、恩恵を受けるのはYouTubeやNetflixくらいかもしれない。その規模ならISPレベルのキャッシュに投資するほうが安い可能性すらある
    • 「はるかに低いビットレートで高画質動画を提供」が目標だと言うのに、実際にそれを必要とする遅い機器がまだ存在すらしないのなら、何の意味があるのかよく分からない
  • AV2がAVIF画像フォーマットをどう改善するのか気になる。AVIFは低ビットレートの静止画、特にクロマサブサンプリングを使う場合、競合フォーマットを圧倒する
    ただし可逆画像ではそうではない。可逆JPEG XLや可逆WEBPと比べると、可逆AVIFは笑ってしまうほど見劣りする

    • AVIFは今いちばん好きな画像フォーマットだ。可逆、HDR、透過、ブラウザ対応を全部備えたフォーマットはほとんどない
      かなり強く圧縮した画像でも優秀で、ファイルサイズがどこまで小さくなるのか驚かされる。HEICやUltra HDR JPEGと違って、サイドカーgain mapのような便法ではなく、ファイルフォーマット自体がHDRをネイティブにサポートしている。万人向けではないかもしれないが、自分はHDRが好きで、AVIFだけがそれを本気で扱っているフォーマットに感じる
    • いつもそうとは限らない https://tonisagrista.com/blog/2023/jpegxl-vs-avif/
    • libavifがAV2対応を取り込めば、v2.0.0のようなバージョンに更新するだけでさらなる効率向上が得られるかもしれない
    • 正直、今必要なのはAVIF2ではない。すでに少数派の画像フォーマットが多すぎる
  • AV1では今、複数の企業が積極的にクレームチャートを作っていて、訴訟もほぼ確実に来そうだ。AV2でも同じ流れがすでに始まっているが、多くはAV1の案件が熟すのを待っている
    人々はAV系コーデックを相変わらず「ロイヤリティフリー」と呼ぶが、実際には法的・財務的な賭けにますます見えてくる

    • こういう話は何十年も続いてきた
      企業が数学を所有することを、地元スポーツチームを応援するみたいに好む人たちがいる理由は理解したことがない
      しばらくの間は、H.264エンコーダに多大な努力を注いだ人たちがいたので、デジタル小作人たちが、汚くても自由を擁護する人に腹を立てて嫉妬しているのかと思っていた。でも中には、企業が動画配信に税金を課すという発想そのものを楽しんでいるような人もいる
      幸い、その貪欲な企業は何度も自分で自分の足を撃っており、影響力は弱まりつつある
    • AV1が出てからどれくらい経った? 約8年経ったが、いまだに信頼できる特許権者はいない
      圧縮標準の周辺には常にハゲタカが群がるものなので、あまり深刻に受け取る必要はない。仮に訴訟が起きても、根拠のない請求を防ぐための法的防衛基金がある
    • AV系コーデックが法的・財務的な賭けに見えるなら、代替は何なのか?
      H.265には加入が必要なHEVCライセンスプールが2つあり、プールに属していない企業も少なくとも2社ある
      https://en.wikipedia.org/wiki/High_Efficiency_Video_Coding#P...
      AVxではないコーデックを選んだからといって、複雑さが減ったり訴訟リスクが下がったりするわけではないと思う
    • HEVCのようなものと比べてもそうだということか? HEVCでは確実を期すなら、条件の異なる特許プール3か所に支払う必要があり、そのうえ、どのプールにも属さない特許権者がいつでも独自条件でロイヤリティを要求できる
    • 通信標準は特許化できないようにすべきだ。ロックイン効果による乱用の可能性が大きすぎる
  • この標準を誰かが実装して、AdobeやDolbyのようなところが一発かましたくなって訴訟を起こすまで、どれくらいかかるだろう? 自分の知識が古いのかもしれないが、これがAV1と同じくらい「オープン」だとしても、各企業が実際に許容するのかかなり懐疑的だ。欲もあるし

    • AV1に対する最初の特許主張が裁判所に行くまで7年かかり、その事件が解決するまでもかなり時間がかかりそうだ
      面白いことに、ここ数年ずっとニュースに出ていたあの特許プールから出てきたものではなかった。つまり、そうした試みが現れるまでかなり長くかかる可能性がある
    • パテントトロールは最悪だ。自分たちの利益のために米国司法の独立性を揺るがす連中から全面的な支援を受けるまで、あとどれくらいかかるのだろう? その腐敗がそれまでに止まることを願う
  • 半分冗談だけど、AV1をサポートするApple TVを待っていたのに、今ではApple TVのAV2対応も待つことになった

  • 動画エンコードの専門家ではないけど、将来的には固定機能の圧縮方式よりも、AIネットワークが映像を再構成し、圧縮映像よりはるかに軽くする方向により依存するようになるのではないかと気になる。
    github.com/Orange-OpenSource/Cool-Chic のようなニューラルネットワークコーデックがその例。

    • おそらく、スマートフォンにNPUが広く搭載されるか、そしてNPUにアクセスする標準APIが生まれるかにかかっている気がする。
      ただ、AIベースのコーデックが固定機能ハードウェアと競争できるほどのバッテリー使用量になるかは分からない
  • AV1はすでに効率的でオープンな動画フォーマットへの大きな飛躍だったし、AV2も長く待たれていた。
    チップやハードウェアに実装され、効率的で高速なハードウェアエンコード・デコードが使えるようになるまでには時間がかかるだろうが、ストレージ価格の上昇とチップ危機を考えると、約25%の効率向上は非常に有望に見える

  • Dav2dは語感がそれほど良くない。その前に、リポジトリ名の言葉遊びがうまい誰かが貢献してくれるといい。
    avi2ude? av2go?

    • rav2dは悪くなさそう — https://github.com/stukenov/rav2d。Rustポートで、rav1d→dav1dと同じような雰囲気。
    • av2では良い名前を見つけるのが難しかった。
      フランス語では d2vid、つまり Deuvid になる
  • かなり高速なエンコーダが出てくることを期待している。AV1のリファレンスエンコーダもあまり良くなかったし、ここでも同じだ。
    でも、SVT-AV2のようなものが出てきたら大いに満足できそう