8 ポイント 投稿者 GN⁺ 2026-02-13 | 3件のコメント | WhatsAppで共有
  • ByteDance Seedチームが公開した次世代マルチモーダル動画生成モデルで、テキスト・画像・音声・動画入力を統合サポート
  • 物理的正確性とリアリティが強化され、複雑な人物同士の相互作用や運動シーンでも高い安定性と一貫性を確保
  • 最大画像9枚・動画3本・音声3本を同時入力して、構図・動き・特効・音響を反映し、動画編集と延長機能で精密な制御が可能
  • 15秒の高品質マルチカメラ出力ステレオ音声をサポートし、映画・広告・ゲームなど産業向けコンテンツ制作効率を大幅に向上
  • 総合評価で業界最高水準の生成品質と指示文遵守性能を記録し、今後は細かな安定性と複数人物の一貫性を改善予定

Seedance 2.0 概要

  • 2026年2月12日に公開されたSeedance 2.0は、ByteDanceの統合マルチモーダル音声・動画生成モデル
    • テキスト、画像、音声、動画の4種類の入力を同時に処理
    • 従来の1.5バージョンと比べて生成品質、物理的正確性、リアリティ、制御性がすべて向上
  • 産業向け映像制作を目標とし、動画長15秒マルチカメラステレオ音声をサポート
  • 現在、即夢AIDoubao(豆包) などのプラットフォームで体験可能

主な機能と技術的特徴

  • 複雑な動き・相互作用の安定性を強化
    • 複数人物の動作と物理法則を自然に再現
    • 例として、2人のフィギュアスケートのシーンでジャンプ・回転・着地の動作をリアルに実装
  • マルチモーダル入力の拡張
    • 最大9枚の画像、3本の動画、3本の音声、自然言語コマンドを混在入力
    • 入力資料の構図・動き・カメラワーク・特効・音響要素を反映して生成
  • 精密な制御と編集機能
    • 指示文の一貫性が向上し、複雑なスクリプトも正確に再現
    • 動画延長・部分編集機能でシーン・人物・動作の修正が可能
  • 高品質な音声生成
    • 2チャンネルステレオで環境音・効果音・ナレーションを同時生成
    • ASMR・武侠シーンなどで細かな音響テクスチャと映像同期を実現
  • 産業全般への適用性
    • 広告、映画、ゲーム、解説動画など多様な制作環境に対応
    • AIベースで特殊効果・撮影コスト削減と制作期間短縮を実現

性能評価

  • 動画生成品質
    • 動きの安定性、指示文遵守、美的完成度で業界をリードする水準
    • 複雑な動作・表情・カメラ演出を精密に表現
    • 一部の細かな安定性と動的な躍動感は改善の余地あり
  • 音声生成品質
    • ステレオサウンドの階層感とシーンに合った音響が向上
    • セリフ・音楽・効果音の視覚的な一致度を強化
    • 複数人物の口の動きの同期と音声の歪みには一部限界あり
  • マルチモーダル参照生成
    • 多様な入力の組み合わせを理解して正確に反映
    • 編集・延長作業で高い一貫性と写実性を確保
    • 複数人物の一貫性・テキスト再現の精度には追加改善が必要

総合評価と今後の方向性

  • Seedance 2.0は**「音声-映像同期生成」から「統合マルチモーダル生成」**へと進化
  • 物理法則の遵守・長期的一貫性の問題を解決し、クリエイターの自由度を拡大
  • 今後は細かな品質安定化人間のフィードバックに基づくアライメントを通じて
    より効率的で創造的なAI映像制作ツールへと発展予定

3件のコメント

 
roxie 2026-02-27

実際のところは使ってみないと分かりませんが、ホームページはすごいですね

 
honglu 2026-02-13

投稿を見て物欲を刺激されて登録までしてみたのですが、

実際には無料では試せないですね。

該当モデルを一時的に非表示にしているのか、無料の3クレジットでは何もできません……しくしく

 
xguru 2026-02-13

ここ最近、この Seedance 2.0 の動画がかなり出回っていましたが、ついに正式公開されました。
Hacker News では seedance で検索すると、いろいろな有料サイトが幅を利かせているようですね。何かしら商売になっているのかもしれません。

公式ブログにも、まだ中国語の投稿しかありませんね。そちらのほうが動画も少し多いです。

https://seed.bytedance.com/en/blog/…