3 ポイント 投稿者 GN⁺ 2026-03-19 | 1件のコメント | WhatsAppで共有
  • オーディオとビデオを録画・変換・ストリーミングできるクロスプラットフォームのマルチメディアフレームワークで、最新バージョン 8.1「Hoare」が公開された
  • 今回のバージョンでは、xHE-AAC Mps212 および MPEG-H デコードEXIF メタデータの解析LCEVC メタデータ処理をサポート
  • Vulkan ベースの ProRes エンコード/デコードD3D12 H.264・AV1 エンコードRockchip H.264/HEVC ハードウェアエンコードなど、GPU アクセラレーション機能が強化された
  • IAMF アンビソニックオーディオ要素hxvs デマルチプレクサdrawvg・vpp_amf フィルターなどの新しいフォーマットとフィルターが追加された
  • 内部構造の改善とバグ修正が含まれており、swscale の再実装準備GLSL ランタイム依存の削除による初期化速度向上が行われた

FFmpeg 8.1 "Hoare" の主な更新

  • 新バージョンはマイナーリリースで、ダウンロード可能
  • デコーダー: xHE-AAC Mps212(実験的)、MPEG-H(libmpeghdec 使用)をサポート
  • メタデータ: EXIF 解析機能を追加
  • LCEVC: メタデータの解析および受け渡し機能をサポート
  • Vulkan ベースのコーデック: ProRes エンコード・デコード、DPX デコードをサポート
  • D3D12 アクセラレーション: H.264/AV1 エンコード、scale_d3d12、mestimate_d3d12、deinterlace_d3d12 フィルターを追加
  • Rockchip ハードウェアエンコード: H.264 および HEVC をサポート
  • IAMF: Projection モードの Ambisonic Audio Elements のマルチプレクス・デマルチプレクスをサポート
  • フォーマットとフィルター: hxvs デマルチプレクサ、drawvg および vpp_amf フィルターを追加

内部改善と性能向上

  • 多数の内部コード変更とバグ修正を含む
  • swscale の再実装に向けた基盤作業が進行中
  • Vulkan ベースのコーデックと一部フィルターでランタイム GLSL コンパイル依存を削除し、初期化速度が向上

Vulkan Compute ベースのコーデック関連

  • Vulkan Compute ベースのコーデック実装に関する技術的な詳細と今後の計画Khronos ブログに掲載

アップグレード推奨

  • ユーザー、ディストリビューター、システムインテグレーターに最新バージョンへのアップグレードを推奨
  • ただし、現在 git master バージョンを使用している場合は除く

1件のコメント

 
GN⁺ 2026-03-19
Hacker News の意見
  • 自分がよく使うオープンソースツールの中でも最高だと思う
    Plex、Jellyfin、Tunarr、ローカルの音楽ファイルなどと一緒に毎週使っていて、字幕の抽出、動画のカット、音楽フォーマットの変換、オーディオトラックの削除などをしている
    ふと思い返すと一度も寄付したことがなかったので、そろそろ変えなければと思った

    • このツールは、私たちが意識していない無数のソフトウェアの下位コンポーネントとして組み込まれている
  • 「ffmpeg の新バージョンが出た、すぐビルドしよう……いや待てない、バイナリを落とそう」というミームのような状況を見た
    関連動画

    • 自分はたいていソースから直接ビルドする。パッケージマネージャー版では特許コーデックのサポートが抜けていることが多いからだ
    • ffmpeg のビルドは設定次第で簡単にも複雑にもなる。今は GitHub Actions でクロスプラットフォームビルダーを作っているが、Mac と Windows のビルドが時間を食いすぎる
      ffmpeg-builder プロジェクトを参考にしており、映像エンジニア向けアプリの一部として使っている
    • 最近の CVE のせいで自前ビルドが必要になったが失敗したので、結局 ffmpeg をラップしてバージョンコマンドを注入し、スキャナーを通した
    • ffmpeg に慣れている人なら上の動画はぜひ見ることを勧める。yadif、mkvtoolnix、ファイル名にアポストロフィが入ると壊れる問題など、現実的な話が多い
    • ffmpeg をソースからビルドすること自体は実はかなり簡単だ。難しいのは必要なコーデック設定のほう
      オーディオ・ビデオコーデックをきちんと把握してインストールさえできれば、ビルドは単純だ
      10年以上このやり方でやっていて、mpv を使うためにさまざまなコーデックをサポートするよう設定している。個人的には vlc より mpv のほうが気に入っている
  • 今回のリリースのChangelog要約
    ffprobe の -codec オプション、EXIF メタデータ解析、Windows.Graphics.Capture ベースのキャプチャ、MPEG-H 3D オーディオデコード、D3D12 ベースの H.264/AV1 エンコーダ、Vulkan ハードウェアアクセラレーション(ProRes、DPX など)、JPEG-XS サポート、LCEVC メタデータフィルタなど、さまざまな機能が追加された

    • 今日初めて知ったのが JPEG XS というコーデックだ。低遅延で視覚的・数学的にロスレスな品質を提供する
      Wikipedia の説明
    • Windows.Graphics.Capture ベースのキャプチャは低遅延ウィンドウキャプチャを可能にする
      この機能のおかげで、ブラウザベースではないネイティブデスクトップアプリとして Discord の代替を作る魅力が増した
    • 「もしかして gyan.dev の ffmpeg ビルド の運営者か」と尋ねる人もいた
    • この膨大な機能がAI ツールでどの程度書かれ、デバッグされたのか気になる。どんなワークフローを使ったのかも知りたい。(ちなみに自分は Claude Code を購読中)
  • Khronos が FFmpeg のVulkan compute codecについて投稿している
    公式ブログ記事

  • 今、自分は双方向テキストをビットマップ字幕に変換する機能を Claude Code で追加している
    プロジェクトリンク
    本当に面白い作業だ

  • FFmpeg のリリースごとに数学・計算機科学関連の名前でタグ付けしていることを今さら知った。かなりいい

  • Rockchip のハードウェアエンコードは rkmpp ベースなのでアップストリームのソリューションではない。Rockchip カーネルが必要になりそうだ

    • それでも以前は自分でビルドする必要があったので、これでも大きな前進
  • 今回のリリースのコードのうち、どれほどが大企業の社員によって書かれたのか気になる

    • 正確には分からないが、ほぼすべての大手テック企業がメディアトランスコーディングに ffmpeg を使っている
  • FFmpeg は素晴らしいが、使い方が複雑すぎる
    昔の avisynth のようなシンプルなスクリプトベースのインターフェースがあればいいのにと思う
    今はコマンドを覚えるのがあまりに大変で、開発チームも単純化に関心がなさそうなのが残念だ

    • 自分も最初は -filter_complex が怖かったが、フィルタチェーンという概念で捉えると大丈夫だった
      コマンドが長くなるほどデバッグは難しくなるが、慣れてくるとエラーパターンが見えてくる
      よく使うコマンドはシェルスクリプトとして保存しておくとずっと楽になる
    • LLM を使って ffmpeg のコマンドオプションを探すのは、最も有用な活用法の一つだと思う
    • 単純なエンコードだけが必要ならHandbrakeが良い代替だ
    • 自分は ffmpeg のコマンドライン作成を完全にAI に任せている