AV2ビデオ標準が公開、最終v1.0仕様を公開
(av2.aomedia.org)- AV2はAOMediaの次世代ビデオコーディング仕様で、AV1を基盤として、より高い圧縮効率と低ビットレートでの高品質配信を目指している
- 最終v1.0.0仕様はビットストリーム文法、セマンティクス、デコード手順を扱い、AV2実装の適合性を判断する技術的リファレンスとなる
- ストリーミング、放送、リアルタイムビデオ会議向けに最適化されており、AR/VR、分割画面配信、画面コンテンツ処理の改善もサポートする
- 現在のリリースは、2026年5月28日に公開されたAV2 Bitstream & Decoding Process Specification v1.0.0とAVM参照ソフトウェアで構成される
- 実装者はオンライン仕様、PDF、Cヘッダーの参照テーブル、Syntax Browser、AVM v1.0.0タグを活用でき、v13ドラフトは参照用として残されている
AV2概要
- AV2はAlliance for Open Media(AOMedia)の次世代ビデオコーディング仕様で、AV1を基盤として、より高い圧縮効率を提供するよう設計されている
- はるかに低いビットレートで高品質ビデオを配信することを目標としており、ストリーミング、放送、リアルタイムビデオ会議の要件に合わせて最適化されている
- v1.0.0仕様はAV2実装のための最終技術リファレンスであり、完全な適合性に必要なビットストリーム文法、セマンティクス、デコード手順を扱う
- AV2はAR/VRアプリケーション、複数プログラムの分割画面配信、画面コンテンツ処理の改善、より広い視覚品質レンジでの動作をサポートする
- 実装者向けの公式参照ソフトウェアとしてAOMedia Video Model(AVM) が提供される
- フィードバックや問題はwg-codec-chair@aomedia.orgへ送るか、AVM issue trackerに登録できる
リリースと実装資料
-
AV2 specification and reference code v1.0.0
- 現在のリリースは、2026年5月28日に公開されたAV2 Bitstream & Decoding Process Specification v1.0.0と、それに対応するAVM参照ソフトウェアである
- Read Online: v1.0.0仕様のオンライン文書
- Download PDF: 完全なv1.0.0仕様PDF
- Additional Tables: セクション9から抽出した参照テーブルのCヘッダーファイル
- Syntax Browser: 文法構造とセマンティクスをあわせて探索できるブラウザー
- Software: v1.0.0タグのAVM参照ソフトウェア
-
AV2 working draft v13
- v13作業ドラフトは2026年1月5日に公開され、v1.0.0に置き換えられた
- 「v13」ラベルは作業ドラフトのマイルストーンを意味し、v1.0.0より新しいバージョンという意味ではない
- 参照目的で保存されている
- Read Online: v13オンライン文書
- Additional Tables: v13追加テーブル
- Syntax Browser: v13文法ブラウザー
- Software: research-v13.0.0参照ソフトウェア
- Release Notes: v13リリースノート
-
仕様活用資料
- 完全な仕様は、範囲と定義から付録までを含み、形式、文法、セマンティクス、デコード手順を網羅する
- PDF版は、完全なv1.0.0仕様をオフライン参照用として提供する
- Additional Tablesは、実装参照に有用なセクション9の参照テーブルをCヘッダーファイルとして抽出した資料である
- Syntax Browserは、セクション5のSyntax Structuresとセクション6のSemanticsを分割ウィンドウのインターフェースで提供する
- Syntax Browserでは、文法定義とセマンティクスの並列表示、クリック可能な文法要素、両セクション検索、文法構造のコピーが可能である
- Reference Softwareは仕様v1.0.0に対応するAVMであり、v1.0.0タグが該当バージョンである
1件のコメント
Hacker Newsのコメント
AV2は非常に長い道のりの一段階にすぎず、現状では実用は事実上難しいと思う
まともなハードウェアでもエンコーダは通常1fps程度で、最初のAV2ハードウェアアクセラレーションチップが出る2028年ごろまではその状態が続く可能性が高く、AV2ストリームが一般的になるのは2030年ごろになりそう
効率向上だけを見ればAV1比で**20〜30%**とかなり大きいが、AV2にそこまでの価値があるかは微妙。ただしマルチストリーム対応はVRやライブスポーツに大きな利点があり、アルファチャンネルを別ストリームとして送ってファイル内で合成し、まともな透過動画をサポートできる点も面白い
仕様が確定したので、実製品向けエンコーダでは速度が大きく改善する可能性がある。ただしリアルタイムエンコーディングは、ハードウェア実装が入るまでは難しい可能性が高い
チップメーカーがAV2設計をより古く安価なプロセスへ移さない限り一般ユーザーには厳しく、中国のTV向けチップメーカーがチェックボックスを埋めるためのAV2デコーダを載せることはあっても、実用的なエンコーダは当面期待しにくい
データセンターに兆単位の投資が入る時代ではトラフィックコストは後回しで、恩恵を受けるのはYouTubeやNetflixくらいかもしれない。その規模ならISPレベルのキャッシュに投資するほうが安い可能性すらある
AV2がAVIF画像フォーマットをどう改善するのか気になる。AVIFは低ビットレートの静止画、特にクロマサブサンプリングを使う場合、競合フォーマットを圧倒する
ただし可逆画像ではそうではない。可逆JPEG XLや可逆WEBPと比べると、可逆AVIFは笑ってしまうほど見劣りする
かなり強く圧縮した画像でも優秀で、ファイルサイズがどこまで小さくなるのか驚かされる。HEICやUltra HDR JPEGと違って、サイドカーgain mapのような便法ではなく、ファイルフォーマット自体がHDRをネイティブにサポートしている。万人向けではないかもしれないが、自分はHDRが好きで、AVIFだけがそれを本気で扱っているフォーマットに感じる
AV1では今、複数の企業が積極的にクレームチャートを作っていて、訴訟もほぼ確実に来そうだ。AV2でも同じ流れがすでに始まっているが、多くはAV1の案件が熟すのを待っている
人々はAV系コーデックを相変わらず「ロイヤリティフリー」と呼ぶが、実際には法的・財務的な賭けにますます見えてくる
企業が数学を所有することを、地元スポーツチームを応援するみたいに好む人たちがいる理由は理解したことがない
しばらくの間は、H.264エンコーダに多大な努力を注いだ人たちがいたので、デジタル小作人たちが、汚くても自由を擁護する人に腹を立てて嫉妬しているのかと思っていた。でも中には、企業が動画配信に税金を課すという発想そのものを楽しんでいるような人もいる
幸い、その貪欲な企業は何度も自分で自分の足を撃っており、影響力は弱まりつつある
圧縮標準の周辺には常にハゲタカが群がるものなので、あまり深刻に受け取る必要はない。仮に訴訟が起きても、根拠のない請求を防ぐための法的防衛基金がある
H.265には加入が必要なHEVCライセンスプールが2つあり、プールに属していない企業も少なくとも2社ある
https://en.wikipedia.org/wiki/High_Efficiency_Video_Coding#P...
AVxではないコーデックを選んだからといって、複雑さが減ったり訴訟リスクが下がったりするわけではないと思う
この標準を誰かが実装して、AdobeやDolbyのようなところが一発かましたくなって訴訟を起こすまで、どれくらいかかるだろう? 自分の知識が古いのかもしれないが、これがAV1と同じくらい「オープン」だとしても、各企業が実際に許容するのかかなり懐疑的だ。欲もあるし
面白いことに、ここ数年ずっとニュースに出ていたあの特許プールから出てきたものではなかった。つまり、そうした試みが現れるまでかなり長くかかる可能性がある
半分冗談だけど、AV1をサポートするApple TVを待っていたのに、今ではApple TVのAV2対応も待つことになった
なので、現在のApple TVデバイスもソフトウェアでAV1動画を再生できると考えるのが無難。Apple TV向けのVLCリリースもある。
https://www.videolan.org/vlc/download-appletv.html
https://apps.apple.com/us/app/vlc-media-player/id650377962?p...
動画エンコードの専門家ではないけど、将来的には固定機能の圧縮方式よりも、AIネットワークが映像を再構成し、圧縮映像よりはるかに軽くする方向により依存するようになるのではないかと気になる。
github.com/Orange-OpenSource/Cool-Chic のようなニューラルネットワークコーデックがその例。
ただ、AIベースのコーデックが固定機能ハードウェアと競争できるほどのバッテリー使用量になるかは分からない
AV1はすでに効率的でオープンな動画フォーマットへの大きな飛躍だったし、AV2も長く待たれていた。
チップやハードウェアに実装され、効率的で高速なハードウェアエンコード・デコードが使えるようになるまでには時間がかかるだろうが、ストレージ価格の上昇とチップ危機を考えると、約25%の効率向上は非常に有望に見える
Dav2dは語感がそれほど良くない。その前に、リポジトリ名の言葉遊びがうまい誰かが貢献してくれるといい。
avi2ude? av2go?
フランス語では d2vid、つまり Deuvid になる
かなり高速なエンコーダが出てくることを期待している。AV1のリファレンスエンコーダもあまり良くなかったし、ここでも同じだ。
でも、SVT-AV2のようなものが出てきたら大いに満足できそう