14 ポイント 投稿者 xguru 2023-04-30 | まだコメントはありません。 | WhatsAppで共有
  • Stability AI の新しい画像モデル
  • 既存モデルと比べて言語理解度が高く、フォトリアルな画像を生成
  • T5 Transformer ベースの Frozen テキストエンコーダと3段階のピクセル拡散モジュールを組み合わせ
    • 64x64, 256x256, 1024x1024px
  • Zero-shot FID スコアは 6.66(COCO データセット)

まだコメントはありません。

まだコメントはありません。