8 ポイント 投稿者 lostdest 2023-08-03 | 1件のコメント | WhatsAppで共有

NVIDIAは最近、SIGGRAPH 2023に採択された「Key_Locked Rank One Editing for Text-to-Image Personalization」を通じて、100kBサイズで約4分ほど学習させるとパーソナライズされた画像生成ができるモデル「Perfusion」を公開しました。

純粋なテキストから画像全体を作るのではなく、コンセプトを指定するためのサンプル画像をいくつか入力した後、そのコンセプトを含むテキストを入力すると、それに合わせた画像を生成する方式です。

紹介ページと論文に掲載されている結果は見事ですね。
コードはまもなく公開予定とのことです。

1件のコメント

 
hhkkkk 2023-08-03

A100で4分とか、さすがにそういう話ではないですよね..?