DeepFloyd IF - オープンソースのText-to-Imageモデル (github.com/deep-floyd) 14 ポイント 投稿者 xguru 2023-04-30 | まだコメントはありません。 | WhatsAppで共有 Stability AI の新しい画像モデル 既存モデルと比べて言語理解度が高く、フォトリアルな画像を生成 T5 Transformer ベースの Frozen テキストエンコーダと3段階のピクセル拡散モジュールを組み合わせ 64x64, 256x256, 1024x1024px Zero-shot FID スコアは 6.66(COCO データセット) 関連記事 Stable Diffusion - DALL-Eに似たText-To-Imageオープンソース 11 ポイント · 1件のコメント · 2022-08-16 Stable Diffusion 2.0 公開 14 ポイント · 1件のコメント · 2022-11-24 OpenAI、4oの画像生成機能を公開 12 ポイント · 3件のコメント · 2025-03-26 Stability AI、研究用途の拡散モデル2種を公開 6 ポイント · 0件のコメント · 2023-07-03 Stable Diffusion 3の研究論文を公開 13 ポイント · 1件のコメント · 2024-03-06 まだコメントはありません。 まだコメントはありません。
まだコメントはありません。