- SD 2.0のリリース後、従来と比べて画像生成品質が悪くなったという評価がある
- おそらく新しいテキストエンコーダであるOpenCLIPが原因
- これまでのプロンプトハック手法は通用しなくなり、"ネガティブプロンプト"のほうがよりうまく機能するようになった
Negative Prompting とは
- 結果画像で見たくないものを除外すること
- SDの技術的な観点では、ネガティブプロンプトは拡散プロセスから遠ざかる高次元アンカーとして動作する
- "cyberpunk forest by Salvador Dali; negative prompt: trees, green" とすると、結果から「木」と「緑色」を取り除いてくれる
- 人気のあるテクニックの1つは、"blurry" や "pixelated" のようなものをネガティブに入れて画像品質を向上させること。
では、これがよく知られた "4k hd" "trending on artstation" のような旧来のCLIPTextによる画質改善プロンプトよりも優れているのだろうか?
- テスト結果を見ると、ネガティブプロンプトは非常に優れた結果を示している
結論
- ネガティブプロンプトは、今後のAI画像生成においてはるかに重要なツールになるだろう
- 昔のプロンプトエンジニアリング戦略に固執するのは大きな間違い
1件のコメント
https://twitter.com/emostaque/status/1596864150134984705
高品質な人物画像を得るには、このような単語をネガティブに追加するとよいそうです。
"ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, mutation, mutated, extra limbs, extra legs, extra arms, disfigured, deformed, cross-eye, body out of frame, blurry, bad art, bad anatomy, blurred, text, watermark, grainy"