AniSora: オープンソースのアニメーション動画生成モデル

(komiko.app)

17 ポイント投稿者 GN⁺ 2025-05-19 | 1件のコメント | WhatsAppで共有

AniSoraはBilibiliが開発した、アニメ、漫画、VTuberなど多様なスタイルに対応するオープンソースのAI動画生成モデル
完成度の高い高画質アニメーション動画を、画像またはテキストプロンプトから簡単に生成できる
漫画とアニメーションに特化したアルゴリズムと大規模データセットを基盤に、リアルな動きと表現力の高い成果物を提供する
非専門家でも簡単に活用できる直感的なインターフェースと、コミュニティベースの協業環境が強み
短編エピソード、PV、VTuber、コンセプトアートなど多様な活用事例に適している

AniSoraとは何か

AniSoraはBilibiliが開発した、最も強力なオープンソースアニメーション動画生成モデル
ワンクリックでアニメシリーズ、中国アニメ、漫画原作、VTuber、アニメPVなど多様なスタイルの映像を制作できる
画像またはテキストプロンプトだけで、静的な場面を躍動的で精細なアニメーションとして実現できる
AniSoraの基盤研究はIJCAI’25に採択された最新技術論文に基づいている

AniSoraの作例紹介

AniSoraで生成された作例動画は、静止画像を自然に動くアニメーションへと変換する能力を示している
- 例) 車の中で髪が風に揺れる場面、複数の少女が手を上げて踊る様子、高速で走るキャラクターのモーションブラーなど
このモデルは登場人物の感情表現、動き、場面転換など、漫画とアニメーションで必要とされるさまざまな演出をリアルに実現する

AniSoraの主な強み

アニメーション/漫画スタイルに特化したアルゴリズム

大規模なアニメーション・漫画データセットで学習した特化型モデル構造を採用している
固有の視覚スタイルや演出を正確に再現する
最新の漫画原作やトレンドまで反映した高品質な出力が可能

直感的なインターフェース

技術に不慣れなユーザーでも自分で動画生成ができるよう設計されている
クリック一つで誰でも簡単に漫画やVTuber動画制作を体験できる

高品質なアニメーション動画をサポート

AniSoraは1080pの高画質動画出力を標準で提供する
さまざまなプラットフォームに最適化された映像として、プロジェクト、SNS、PVなど多様なチャネルで活用できる

AniSora FAQ要約

AniSoraとは?

AniSoraはProject Index-AniSoraの一部としてBilibiliが公開したオープンソースのアニメーション動画生成モデル
画像またはテキストプロンプトだけで、高解像度のアニメーションスタイル映像を自動生成できる
動作の一貫性と表現力を重視した最新研究の成果が反映されている

他のAI動画生成ツールとの違い

AniSoraはアニメーション、漫画スタイルに特化した性能に注力している
Bilibiliの専門性とコミュニティ中心のオープンソースプロジェクトとして、アニメシリーズ、漫画原作、VTuberなど特定用途の映像制作に最適化されている

ビデオ&オーディオ対応の有無

現在のAniSoraは動画生成に重点を置いたモデル
音声合成など追加機能の提供有無については最新ドキュメントの確認が必要

アニメーション/漫画クリエイターに適しているか?

AniSoraはキャラクターの一貫性、表現力のある動きの実現に最適化されており、クリエイター、特にアニメーション、PV、漫画、VTuber分野にとって理想的なツール

主な活用事例

アニメ短編、SNS動画、PV、漫画パネルのアニメーション、VTuber、コンセプトアート、ストーリーボードなど幅広い活用が可能

映像クオリティと長さ

AniSoraは**高解像度(1080p)**基準の短編映像生成に強みを持つ
一般的には短いクリップ形式が適しており、具体的な制約事項は公式ドキュメントで最新情報を確認できる

スタイルと動作のコントロール方法

画像またはテキストプロンプトの入力により、ユーザーが望む視覚スタイルと動作を誘導できる
アニメーション分野のデータを基盤に、動作のカスタマイズ、キャラクターの一貫性、細部スタイルの適用など高度な制御をサポートする
バージョンやインターフェースによって運用可能な範囲は異なる

結論

AniSoraはアニメーションおよび漫画/VTuber映像制作に特化した最高性能のオープンソースAI動画生成モデル
差別化されたスタイル再現力、直感的な使い方、高画質映像生成が主な利点
コミュニティ主導のオープンソース文化とクリエイター支援を重視しており、日本アニメーションと中国アニメーションの両分野で活用価値が高い

1件のコメント

GN⁺ 2025-05-19

Hacker Newsの意見

一部の出力結果は、ウェブトゥーン、漫画、おそらくpixivなどから明らかに学習した痕跡があるように思える。CGの建物やさまざまな人工物にその証拠を簡単に見つけられる。結局、著作権のある資料で学習したという結論になる。アートはテキストのように合成的なやり方で生成できる領域ではないので、人間のアーティストは永遠に重要な位置を占め続けるだろうし、そうでなければ奇妙なアーティファクトが出続けるだけだろう。だから今後、アーティストが「AI」学習のための職業へと格下げされる方向になるのではないかとも思う。ただ、むしろ人々がそれぞれ好きなものを描いて、それをモデル学習に活用する構造なら悪くないとも思う。私は著作権や商標権に関してかなりAI支持の立場だが、私たちを楽しませてくれた多くの人々に何が起こるのか、ずっと気になっている。クオリティが上がり続けるのか、それとも「AIには難しすぎる」という理由で挑戦的なスタイルが消えて、すべてが似たり寄ったりになってしまうのか考えてしまう。これはPCや機械が人を置き換えるのとは別種の感覚で、何か終着点に来たような気分だ。
- イラストレーターやアーティストには同情する。でも学習データが小説、絵、歌、コード、あるいは法律文書であっても大差はないと思う。うちの母もタイプライター時代の翻訳者から、機械翻訳コーパス・データベース環境へと変わり、仕事は徐々に減って賃金も下がった。結局、機械的で反復的な仕事はより安いロボットが担う運命にある。
- 30年以上絵を描いてきたアーティストの立場から言うと、AI学習補助職へ格下げされるというのはおかしい。アーティストは金を稼ぐためだけに描くのではなく、「楽しい」から描くことも多い。ここ3年間のAI関連の議論では、この本質的な部分がずっと抜け落ちていて、いつも残念に思っている。
- アーティストを「AI学習」の職業群へ格下げするのがそんなに悪くないって？それはディストピア小説に出てくるような状況だと思う。ほとんどのアーティストは、自分の作品がモデルに食わせられて分解されるために働くのを嫌がる。それはもはやアートではなく、機械の部品としての役割にすぎない。アートとは、ただランダムに絵を何枚か描くような概念ではない。そんな状況でアーティストがどうやって生活するのか、誰が「各自が描きたいもの」を描かせてそれをモデルに提供する費用を払うのか、そのために何人雇うつもりなのかという根本的な疑問がある。すでにインターネットには失敗作の画像があふれており、これを使って人をだますスパムや詐欺の層のほうが、本当の創作者層より大きな市場になっていると確信している。今後はもっと深刻になるだろう。
- AIと著作権の議論で感じる問題は、巨大企業だけが恩恵を受けている点だ。ChatGPTなどでは有名作品は自動的にブロックされるが、小規模アーティストの作品はそうではない。万人に開放するか、誰にも開放しないかのどちらかであるべきだと思う。
- アーティストの著作権を擁護する立場に共感しつつ、同時に著作権面ではAIを積極的に支持する姿勢はとても興味深い。この分野は多くの人にとって感情的になりやすい話題で、極端な意見が普通だが、両方を見る立場は珍しい。AI時代における著作権の役割をどう考えているのか気になる。
ついに私たちが望んでいたHaruhiシーズン3を作れる時代が来るのではないかという高揚感がある。本当に生きるのにいい時代だという感じ。
- 5年後、10年後にまた話そう。まだそこまで近づいているようには思えない。これからの流れが気になる。
- 私がアニメ（映画やDBZみたいなものを除いて）で最初にちゃんと見たシリーズがこれだ。今でも思い出が鮮明だ。監督のせいで止まってしまった部分が本当に残念だ。誰でもいいからこのシリーズを完結させるか、リブートして最後までやってくれたら最高の贈り物になる。
- あるいは新世紀エヴァンゲリオンのリメイクもあってほしい。
- いや……まさかまだ完結していなかったの？今シーズン1を初めて見ているところなんだけど……。
- このアニメのことを10年以上忘れていたのに、また耳にして完全にノスタルジーを刺激された。
<i>Neon Genesis Evangelion</i> の宣伝イラストで試してみた。結果は悪くないが、頭が回る場面で髪のアニメーションに時間的アーティファクトが発生する。作例集など参考にできるページもある。
- リンクが動いていない。
論文の抜粋要約を共有する: 「可変長学習方式を導入し、2秒〜8秒区間で学習。この戦略により2〜8秒長の720p映像を生成可能。」FramePackとベンチマークしてみたい。実際、2Dアニメーションではフレーム持続時間の制約がほとんどない利点があると思う。
AIアニメーションコンテンツに関心があるなら、AniGenコンテストへの参加を勧める。
- 締め切りが5月20日なので急いだほうがよさそうだ。
同じキャラクターをさまざまな場面や視点で一貫して表現できるのか気になる。それがこれまでの画像生成分野の限界だと思う。
最初の例からすでに多くのエラーが見える。シャツの袖部分が壊れていたり、動く髪が消えたりまた出たりしている。結局、だいたい動いているのは腕と雲だけだ。
アカウントや入力値を変えても毎回おかしなエラーが発生して、まともに動かない。
こうしたサービスで作った映像の著作権状態が気になる。著作権保護の対象になるのか知りたい。現在の米国著作権局の立場は、「生成AIの出力物は、人間の著作者が十分な創造的要素を決定（注入）した場合にのみ著作権保護の対象となる」というものだ。もし保護されないなら、そのサービスで映画などを作った場合、そのまま複製や盗用を受けるリスクも生じる。なお、このツールがどんなデータで学習したかはここでは論点にしない。
<i>The Beginning After the End</i> の戦闘シーンがこのツールを通すとどれほど変わるのか見てみたい。真面目に今後の方向性が気になる。人々は視覚的なエラーやアーティファクトが多少多くても、好きなフランチャイズの新シーズンが出るなら受け入れるのだろうか。それとも3Dモデルの拙い使用のように拒否感を持つのだろうか。
- Toei AnimationはAIをさまざまな分野に適用しようとする計画を持っている。たとえば絵コンテ制作（単純なレイアウトと撮影角度の生成）、色指定および自動色補正、動画作業（ラインドローイングと中割りの自動生成）、背景（写真からの自動生成）などに活用する方針だ。監督が依然として最終品質に責任を持つので、アーティファクトなしにうまく仕上がるだろうし、インディーのクリエイターも完璧ではなくても自分の作品を作れるので前向きに見ている。
- これほど新しい試みや進歩がない状況で、意味を見いだして議論する価値があるだろうか。実際に使ってみたが、動画生成AIの既存の欠点がそのまま残っている。連続的あるいは動的なアクションシーンの処理が最も苦手で、特にアニメに多いアクション場面をきちんとカバーできない。このツールも満足できず、大半の非公開（商用）モデルもいまひとつだ。
- AIが将来的に動画作業に使われる未来が来るのではないかと想像している。

AniSora: オープンソースのアニメーション動画生成モデル

AniSoraとは何か

AniSoraの作例紹介

AniSoraの主な強み

アニメーション/漫画スタイルに特化したアルゴリズム

直感的なインターフェース

高品質なアニメーション動画をサポート

AniSora FAQ要約

AniSoraとは?

他のAI動画生成ツールとの違い

ビデオ&オーディオ対応の有無

アニメーション/漫画クリエイターに適しているか?

主な活用事例

映像クオリティと長さ

スタイルと動作のコントロール方法

結論

関連記事

1件のコメント

Hacker Newsの意見