- GoogleがGemini 2.0 Flashモデルによる画像生成機能を開発者プレビューとして公開
- テキストベースの指示で画像生成、修正、部分編集まで可能で、視覚品質とテキストレンダリングも改善
- 製品のリスキン、SKU生成、リアルタイム共同編集など多様な活用事例を紹介
- [Google AI Studio] と [Vertex AI] ですぐにテスト可能で、API利用制限も引き上げ
Gemini 2.0 Flash画像生成機能プレビュー公開
主な改善点
- 視覚品質の向上(以前の実験版比)
- テキストレンダリング精度の向上
- フィルターブロック率の低下
活用できる画像生成機能の例
- 製品画像の背景再構成:既存の製品写真を多様な背景や環境で再構成可能
- リアルタイム共同編集:Gemini Co-Drawingアプリ で複数ユーザーによるリアルタイム画像編集をサポート
- 画像の一部だけを対話的に編集:全体を変更せず、特定領域のみを対話型コマンドで修正可能
- 製品SKUの動的生成:画像とテキストを組み合わせて新しい製品バリエーション(カラー、ラベルなど)を自動生成
- Geminiとのアイデア発想コラボレーション:テキスト+画像の組み合わせにより、料理、製品、企画など多様なシナリオを実現可能
API使用例 (Python)
from google import genai
from google.genai import types
client = genai.Client(api_key="GEMINI_API_KEY")
response = client.models.generate_content(
model="gemini-2.0-flash-preview-image-generation",
contents=("Show me how to bake a macaron with images."),
config=types.GenerateContentConfig(
response_modalities=["TEXT", "IMAGE"]
),
)
今後の計画
- Googleは今後、より高品質化、機能追加、高速化、料金プラン改善などを通じて機能を継続的に拡張する予定
- 詳細なドキュメントは Gemini API画像生成ガイド を参照
1件のコメント
Hacker Newsの意見