- オーディオとビデオを録画・変換・ストリーミングできるクロスプラットフォームのマルチメディアフレームワークで、最新バージョン 8.1「Hoare」が公開された
- 今回のバージョンでは、xHE-AAC Mps212 および MPEG-H デコード、EXIF メタデータの解析、LCEVC メタデータ処理をサポート
- Vulkan ベースの ProRes エンコード/デコード、D3D12 H.264・AV1 エンコード、Rockchip H.264/HEVC ハードウェアエンコードなど、GPU アクセラレーション機能が強化された
- IAMF アンビソニックオーディオ要素、hxvs デマルチプレクサ、drawvg・vpp_amf フィルターなどの新しいフォーマットとフィルターが追加された
- 内部構造の改善とバグ修正が含まれており、swscale の再実装準備とGLSL ランタイム依存の削除による初期化速度向上が行われた
FFmpeg 8.1 "Hoare" の主な更新
- 新バージョンはマイナーリリースで、ダウンロード可能
- デコーダー: xHE-AAC Mps212(実験的)、MPEG-H(libmpeghdec 使用)をサポート
- メタデータ: EXIF 解析機能を追加
- LCEVC: メタデータの解析および受け渡し機能をサポート
- Vulkan ベースのコーデック: ProRes エンコード・デコード、DPX デコードをサポート
- D3D12 アクセラレーション: H.264/AV1 エンコード、scale_d3d12、mestimate_d3d12、deinterlace_d3d12 フィルターを追加
- Rockchip ハードウェアエンコード: H.264 および HEVC をサポート
- IAMF: Projection モードの Ambisonic Audio Elements のマルチプレクス・デマルチプレクスをサポート
- フォーマットとフィルター: hxvs デマルチプレクサ、drawvg および vpp_amf フィルターを追加
内部改善と性能向上
- 多数の内部コード変更とバグ修正を含む
- swscale の再実装に向けた基盤作業が進行中
- Vulkan ベースのコーデックと一部フィルターでランタイム GLSL コンパイル依存を削除し、初期化速度が向上
Vulkan Compute ベースのコーデック関連
- Vulkan Compute ベースのコーデック実装に関する技術的な詳細と今後の計画が Khronos ブログに掲載
アップグレード推奨
- ユーザー、ディストリビューター、システムインテグレーターに最新バージョンへのアップグレードを推奨
- ただし、現在 git master バージョンを使用している場合は除く
1件のコメント
Hacker News の意見
自分がよく使うオープンソースツールの中でも最高だと思う
Plex、Jellyfin、Tunarr、ローカルの音楽ファイルなどと一緒に毎週使っていて、字幕の抽出、動画のカット、音楽フォーマットの変換、オーディオトラックの削除などをしている
ふと思い返すと一度も寄付したことがなかったので、そろそろ変えなければと思った
「ffmpeg の新バージョンが出た、すぐビルドしよう……いや待てない、バイナリを落とそう」というミームのような状況を見た
関連動画
ffmpeg-builder プロジェクトを参考にしており、映像エンジニア向けアプリの一部として使っている
yadif、mkvtoolnix、ファイル名にアポストロフィが入ると壊れる問題など、現実的な話が多いオーディオ・ビデオコーデックをきちんと把握してインストールさえできれば、ビルドは単純だ
10年以上このやり方でやっていて、mpv を使うためにさまざまなコーデックをサポートするよう設定している。個人的には vlc より mpv のほうが気に入っている
今回のリリースのChangelog要約
ffprobe の -codec オプション、EXIF メタデータ解析、Windows.Graphics.Capture ベースのキャプチャ、MPEG-H 3D オーディオデコード、D3D12 ベースの H.264/AV1 エンコーダ、Vulkan ハードウェアアクセラレーション(ProRes、DPX など)、JPEG-XS サポート、LCEVC メタデータフィルタなど、さまざまな機能が追加された
Wikipedia の説明
この機能のおかげで、ブラウザベースではないネイティブデスクトップアプリとして Discord の代替を作る魅力が増した
Khronos が FFmpeg のVulkan compute codecについて投稿している
公式ブログ記事
今、自分は双方向テキストをビットマップ字幕に変換する機能を Claude Code で追加している
プロジェクトリンク
本当に面白い作業だ
FFmpeg のリリースごとに数学・計算機科学関連の名前でタグ付けしていることを今さら知った。かなりいい
Rockchip のハードウェアエンコードは rkmpp ベースなのでアップストリームのソリューションではない。Rockchip カーネルが必要になりそうだ
今回のリリースのコードのうち、どれほどが大企業の社員によって書かれたのか気になる
FFmpeg は素晴らしいが、使い方が複雑すぎる
昔の avisynth のようなシンプルなスクリプトベースのインターフェースがあればいいのにと思う
今はコマンドを覚えるのがあまりに大変で、開発チームも単純化に関心がなさそうなのが残念だ
-filter_complexが怖かったが、フィルタチェーンという概念で捉えると大丈夫だったコマンドが長くなるほどデバッグは難しくなるが、慣れてくるとエラーパターンが見えてくる
よく使うコマンドはシェルスクリプトとして保存しておくとずっと楽になる