- Stable Diffusion 3は、最も優れたテキスト-画像モデルとして、マルチトピックプロンプト、画像品質、スペル能力で大幅に向上した性能を提供します
- まだ一般公開はされていませんが、アーリープレビュー向けのウェイティングリスト受付を開始しました
- このプレビュー段階は、前モデルと同様に、性能と安全性を向上させるための知見を得るうえで重要です
モデルの範囲と技術
- Stable Diffusion 3モデルスイートは、800Mから8Bパラメータのレンジを持っています
- このアプローチは中核的価値観に合致し、誰もがアクセスできることを目指しつつ、ユーザーの創造的ニーズに最も適した拡張性と品質の幅広いオプションを提供します
- SD3はDiffusion TransformerアーキテクチャとFlow Matchingを組み合わせています
- 詳細な技術レポートはまもなく公開される予定です
安全で責任あるAIの実践
- 安全かつ責任あるAI実践を重視しています
- Stable Diffusion 3の悪用を防ぐために合理的な対策を講じており、これはモデル訓練の初期段階からテスト、評価、デプロイメントまで一貫して継続しています
- 初期プレビューの準備にあたり、複数の安全対策を導入しています
- 研究者、専門家、コミュニティと継続的に協力し、モデル公開に向けた取り組みを進めるにつれ、さらに進化させられることを期待しています
コミットメントと創造性の促進
- 生成AIをオープンで安全、かつ誰もがアクセスできる形で提供するというコミットメントは堅固です
- Stable Diffusion 3を通じて、個人、開発者、企業がクリエイティビティを発揮できる適応可能なソリューションを提供します
- Stable Diffusion 3のリリース前に他の画像モデルを商用利用したい場合は、Stability AIメンバーシップページを訪問するか、開発者プラットフォームからAPIへアクセスできます
1件のコメント
Hacker Newsコメント
新しい種類の拡散トランスフォーマーを使い、フロー一致やその他の改善点を組み合わせています。
安全性へのこだわりは、最近のジェミニー事件を考えると、マーケティングの機会を逃しているようです。
現在の検閲状況を考えると、今回の「安全」が何を意味するのかを見てみるのが面白いです。
発表文の半分は「我々は本当に責任があり安全である」といった内容です。
デモ画像はすべて「アートワーク」です。
テキスト/スペルの部分は大きな進歩です。
「安全」の部分は書き換えられていますが、AIツールの代わりに『Big Knife』という架空のナイフに置き換えられています。