- Google Researchとコーネル大学が開発した、画像補完のための新しい生成的アプローチ
- RealFillは、画像の欠落した部分を本来あるべき内容で埋めることで、より真正性の高い画像を作ることを目指す
- モデルは、対象画像と一致している必要はなく、視点、照明条件、カメラの絞り、または画像スタイルが多様であり得るいくつかの参照画像を用いてパーソナライズされる
- RealFillは、多様で挑戦的なシナリオを扱う新しい画像補完ベンチマークにおいて、既存のアプローチを大きく上回る
- このプロセスには、参照画像と対象画像に対して事前学習されたinpainting diffusionモデルをファインチューニングすることが含まれ、これにより入力画像のシーンに関する内容、照明、スタイルを学習する
- ファインチューニングされたモデルはその後、標準的な拡散サンプリング過程を通じて対象画像の欠落領域を埋めるために使用される
- RealFillは、参照画像と対象画像の間に大きな違いがあっても、元のシーンに忠実で視覚的にも魅力的な高品質画像を生成する
- RealFillの限界として、比較的遅い勾配ベースのファインチューニング過程と、参照画像と対象画像の間の視点変化が非常に大きい場合に3Dシーンを復元することの難しさがある
- RealFillは、Stable Diffusionのようなベースの事前学習モデルにとって難しいケースでも苦戦する
1件のコメント
Hacker Newsのコメント