図で説明するStable Diffusion
(jalammar.github.io)Stable Diffusion のコンポーネント
- Text Understander(Encoder) - CLIPText
- Image Generator
- 画像情報の作成 - Unet + Scheduler
- 画像デコーダ - Autoencoder Decoder
Diffusion とは?
- Diffusion はどのように動作するのか
- ノイズ低減によって画像を描画する
- 高速化: ピクセル画像の代わりに圧縮版に対して Diffusion を実行する
- テキストエンコーダ: Transformer Language Model
- テキスト情報を画像生成プロセスに送る
まだコメントはありません。