text-to-image AIでこの1年の間に起きたこと
(velog.io)この1年の要約
- DALL-E - 21年1月、すべての始まり。しかし誰でも使える状態ではない
- Stable Diffusion - 21年10月、オープンソースモデルとして、今年2月からアート制作をする人たちが入ってきて利用者が大きく増加
- MidJourney - 22年3月、Discord Botを活用した使いやすさで現在200万人+のユーザー
- DALL-E 2 - 22年4月、性能が改善され、生成結果を商用利用できるようになった
- Stable Diffusion - 22年8月、それまでに登場したものの長所をすべて備えている(オープンソース、実行のしやすさ、商用ライセンス許可など)。これを利用したサービスが爆発的に登場し始めた。
今後の予想
- より良いPromptを見つけることが、AI Modelを直接作ることよりも重要になっていくだろう。
- Disco DiffusionとStable Diffusionの事例で見たように、1人で進めるプロジェクトよりも一緒に進めるプロジェクトのほうが、より遠くまで進むだろう。
1件のコメント
年初にDisco Diffusionを知ってからずっと追いかけてきて、そろそろ整理する文章を書いてもよさそうだと思い、一度書いてみました。GeekNewsで目にした内容も多く、かなり参考にしました。
関連記事