NVIDIA、100kBモデルサイズのパーソナライズ画像生成モデル「Perfusion」を発表
(research.nvidia.com)NVIDIAは最近、SIGGRAPH 2023に採択された「Key_Locked Rank One Editing for Text-to-Image Personalization」を通じて、100kBサイズで約4分ほど学習させるとパーソナライズされた画像生成ができるモデル「Perfusion」を公開しました。
純粋なテキストから画像全体を作るのではなく、コンセプトを指定するためのサンプル画像をいくつか入力した後、そのコンセプトを含むテキストを入力すると、それに合わせた画像を生成する方式です。
紹介ページと論文に掲載されている結果は見事ですね。
コードはまもなく公開予定とのことです。
1件のコメント
A100で4分とか、さすがにそういう話ではないですよね..?