Zero-1-to-3: ディフュージョンモデルを用いて1枚の画像から3Dオブジェクトを作成
(zero123.cs.columbia.edu)- 大規模ディフュージョンモデルを用いて、1枚のRGB画像からカメラ視点を制御するフレームワーク
- 合成データセットで学習されたモデルだが、実写画像や印象派の絵画などに対しても事前学習なしでZero-shotとして良好に動作
- この視点制御型のディフュージョン手法を用いることで、1枚の画像から3Dを再構成することも可能
- インターネット規模の事前学習により、他モデルよりはるかに優れた性能を示すことが、定性的・定量的な実験結果から示された
1件のコメント
去年まではまだ先の話だと思っていましたが、
最近は一日おきに新しい技術や成果が次々と出てきますね..