- AniSoraはBilibiliが開発した、アニメ、漫画、VTuberなど多様なスタイルに対応するオープンソースのAI動画生成モデル
- 完成度の高い高画質アニメーション動画を、画像またはテキストプロンプトから簡単に生成できる
- 漫画とアニメーションに特化したアルゴリズムと大規模データセットを基盤に、リアルな動きと表現力の高い成果物を提供する
- 非専門家でも簡単に活用できる直感的なインターフェースと、コミュニティベースの協業環境が強み
- 短編エピソード、PV、VTuber、コンセプトアートなど多様な活用事例に適している
AniSoraとは何か
- AniSoraはBilibiliが開発した、最も強力なオープンソースアニメーション動画生成モデル
- ワンクリックでアニメシリーズ、中国アニメ、漫画原作、VTuber、アニメPVなど多様なスタイルの映像を制作できる
- 画像またはテキストプロンプトだけで、静的な場面を躍動的で精細なアニメーションとして実現できる
- AniSoraの基盤研究はIJCAI’25に採択された最新技術論文に基づいている
AniSoraの作例紹介
- AniSoraで生成された作例動画は、静止画像を自然に動くアニメーションへと変換する能力を示している
- 例) 車の中で髪が風に揺れる場面、複数の少女が手を上げて踊る様子、高速で走るキャラクターのモーションブラーなど
- このモデルは登場人物の感情表現、動き、場面転換など、漫画とアニメーションで必要とされるさまざまな演出をリアルに実現する
AniSoraの主な強み
アニメーション/漫画スタイルに特化したアルゴリズム
- 大規模なアニメーション・漫画データセットで学習した特化型モデル構造を採用している
- 固有の視覚スタイルや演出を正確に再現する
- 最新の漫画原作やトレンドまで反映した高品質な出力が可能
直感的なインターフェース
- 技術に不慣れなユーザーでも自分で動画生成ができるよう設計されている
- クリック一つで誰でも簡単に漫画やVTuber動画制作を体験できる
高品質なアニメーション動画をサポート
- AniSoraは1080pの高画質動画出力を標準で提供する
- さまざまなプラットフォームに最適化された映像として、プロジェクト、SNS、PVなど多様なチャネルで活用できる
AniSora FAQ要約
AniSoraとは?
- AniSoraはProject Index-AniSoraの一部としてBilibiliが公開したオープンソースのアニメーション動画生成モデル
- 画像またはテキストプロンプトだけで、高解像度のアニメーションスタイル映像を自動生成できる
- 動作の一貫性と表現力を重視した最新研究の成果が反映されている
他のAI動画生成ツールとの違い
- AniSoraはアニメーション、漫画スタイルに特化した性能に注力している
- Bilibiliの専門性とコミュニティ中心のオープンソースプロジェクトとして、アニメシリーズ、漫画原作、VTuberなど特定用途の映像制作に最適化されている
ビデオ&オーディオ対応の有無
- 現在のAniSoraは動画生成に重点を置いたモデル
- 音声合成など追加機能の提供有無については最新ドキュメントの確認が必要
アニメーション/漫画クリエイターに適しているか?
- AniSoraはキャラクターの一貫性、表現力のある動きの実現に最適化されており、クリエイター、特にアニメーション、PV、漫画、VTuber分野にとって理想的なツール
主な活用事例
- アニメ短編、SNS動画、PV、漫画パネルのアニメーション、VTuber、コンセプトアート、ストーリーボードなど幅広い活用が可能
映像クオリティと長さ
- AniSoraは**高解像度(1080p)**基準の短編映像生成に強みを持つ
- 一般的には短いクリップ形式が適しており、具体的な制約事項は公式ドキュメントで最新情報を確認できる
スタイルと動作のコントロール方法
- 画像またはテキストプロンプトの入力により、ユーザーが望む視覚スタイルと動作を誘導できる
- アニメーション分野のデータを基盤に、動作のカスタマイズ、キャラクターの一貫性、細部スタイルの適用など高度な制御をサポートする
- バージョンやインターフェースによって運用可能な範囲は異なる
結論
- AniSoraはアニメーションおよび漫画/VTuber映像制作に特化した最高性能のオープンソースAI動画生成モデル
- 差別化されたスタイル再現力、直感的な使い方、高画質映像生成が主な利点
- コミュニティ主導のオープンソース文化とクリエイター支援を重視しており、日本アニメーションと中国アニメーションの両分野で活用価値が高い
1件のコメント
Hacker Newsの意見
一部の出力結果は、ウェブトゥーン、漫画、おそらくpixivなどから明らかに学習した痕跡があるように思える。CGの建物やさまざまな人工物にその証拠を簡単に見つけられる。結局、著作権のある資料で学習したという結論になる。アートはテキストのように合成的なやり方で生成できる領域ではないので、人間のアーティストは永遠に重要な位置を占め続けるだろうし、そうでなければ奇妙なアーティファクトが出続けるだけだろう。だから今後、アーティストが「AI」学習のための職業へと格下げされる方向になるのではないかとも思う。ただ、むしろ人々がそれぞれ好きなものを描いて、それをモデル学習に活用する構造なら悪くないとも思う。私は著作権や商標権に関してかなりAI支持の立場だが、私たちを楽しませてくれた多くの人々に何が起こるのか、ずっと気になっている。クオリティが上がり続けるのか、それとも「AIには難しすぎる」という理由で挑戦的なスタイルが消えて、すべてが似たり寄ったりになってしまうのか考えてしまう。これはPCや機械が人を置き換えるのとは別種の感覚で、何か終着点に来たような気分だ。
ついに私たちが望んでいたHaruhiシーズン3を作れる時代が来るのではないかという高揚感がある。本当に生きるのにいい時代だという感じ。
<i>Neon Genesis Evangelion</i> の宣伝イラストで試してみた。結果は悪くないが、頭が回る場面で髪のアニメーションに時間的アーティファクトが発生する。作例集など参考にできるページもある。
論文の抜粋要約を共有する: 「可変長学習方式を導入し、2秒〜8秒区間で学習。この戦略により2〜8秒長の720p映像を生成可能。」FramePackとベンチマークしてみたい。実際、2Dアニメーションではフレーム持続時間の制約がほとんどない利点があると思う。
AIアニメーションコンテンツに関心があるなら、AniGenコンテストへの参加を勧める。
同じキャラクターをさまざまな場面や視点で一貫して表現できるのか気になる。それがこれまでの画像生成分野の限界だと思う。
最初の例からすでに多くのエラーが見える。シャツの袖部分が壊れていたり、動く髪が消えたりまた出たりしている。結局、だいたい動いているのは腕と雲だけだ。
アカウントや入力値を変えても毎回おかしなエラーが発生して、まともに動かない。
こうしたサービスで作った映像の著作権状態が気になる。著作権保護の対象になるのか知りたい。現在の米国著作権局の立場は、「生成AIの出力物は、人間の著作者が十分な創造的要素を決定(注入)した場合にのみ著作権保護の対象となる」というものだ。もし保護されないなら、そのサービスで映画などを作った場合、そのまま複製や盗用を受けるリスクも生じる。なお、このツールがどんなデータで学習したかはここでは論点にしない。
<i>The Beginning After the End</i> の戦闘シーンがこのツールを通すとどれほど変わるのか見てみたい。真面目に今後の方向性が気になる。人々は視覚的なエラーやアーティファクトが多少多くても、好きなフランチャイズの新シーズンが出るなら受け入れるのだろうか。それとも3Dモデルの拙い使用のように拒否感を持つのだろうか。