- GoogleがGemini 2.5 Flashと2.5 Flash-Liteの新しいプレビュー版を公開し、品質向上と効率改善が中核
- Flash-Liteは指示理解力の強化、冗長な回答の削減、マルチモーダル・翻訳能力の向上により、高速・低コスト環境に最適化
- Flashはツール活用能力の強化、トークン効率の改善により、複雑なエージェント型タスクで性能が大きく向上
- 実際のテストではSWE-Bench Verifiedスコアが5%上昇し、社内ベンチマークでは長期的なタスク性能が15%向上
- 両モデルとも
-latestエイリアスをサポートし、コード修正なしで最新機能を利用でき、安定性を重視する場合は既存の2.5モデルを引き続き活用可能
Gemini 2.5 FlashおよびFlash-Liteの概要
- Gemini 2.5 FlashとFlash-Liteの最新版がGoogle AI StudioとVertex AIで公開された。今回のリリースの目的は、継続的により優れたモデル品質と高い効率性を提供すること
- 新しいFlash-LiteとFlashは、全体的な品質・速度・コストの面で既存モデルと比べて大幅に向上した性能を示す
- Flash-Liteは出力トークンを50%削減し、Flashは24%削減され、運用コストの節約と高速処理を実現
Updated Gemini 2.5 Flash-Lite
- 命令追従性の高度化: 複雑な命令やシステムプロンプトにおける理解・実行能力が大きく向上
- 簡潔さの向上: より短く分かりやすい応答を生成し、トークンコスト削減と大規模トラフィック環境でのレイテンシ低減に効果
- マルチモーダルおよび翻訳品質の強化: 音声文字起こし、画像認識、翻訳品質のすべてで信頼性が向上
- Flash-Liteプレビュー版は
gemini-2.5-flash-lite-preview-09-2025というモデル名ですぐに試すことができる
Updated Gemini 2.5 Flash
- ツール使用能力の強化: 複雑なマルチステップ状況でのエージェントベース活用度が大きく高まり、SWE-Bench Verified基準で前バージョン比5ポイント上昇した性能(48.9% → 54%)を達成
- コスト効率の向上: より少ないトークン使用でより高い出力品質を提供し、レイテンシおよびインフラコスト削減に効果
- Primerユーザーからのフィードバックも好意的
- Manusの共同創業者兼Chief ScientistであるYichao ‘Peak’ Jiは、「新しいGemini 2.5 Flashモデルは、驚異的な速度と知能の両方を実現している。長期目標ベースのエージェント作業で性能が15%改善し、コスト効率を基盤としてスケールがさらに拡大した」と評価
- Gemini 2.5 Flashプレビュー版は
gemini-2.5-flash-preview-09-2025というモデル名で利用可能
Geminiでビルドを始める
- この1年間、プレビュー(preview)モデルをリリースすることで、開発者が最新機能を素早く試験導入し、フィードバックを提供できるようにしてきた。
- 今日公開されたプレビュー版は、新しい安定版(stable)バージョンへ正式移行するものではなく、次期正式版の品質を高めるための基盤として活用される
- 長いモデル名の代わりに
-latestエイリアスが追加され、常に最新モデルを簡単に使えるようになった。このエイリアスは自動的に最新バージョンに接続され、コード修正なしで新機能を試せる
gemini-flash-latest
gemini-flash-lite-latest
- 特定バージョンが更新または終了される場合、少なくとも2週間前にメールで案内する。エイリアスは単なる参照であり、価格・機能・上限などは各リリースごとに異なる場合がある
- 長期的な安定性が必要な場合は、既存の
gemini-2.5-flashおよびgemini-2.5-flash-liteモデル名の使用を推奨
意義
- 今回のリリースは正式な安定版への昇格ではなくプレビュー更新であり、今後の安定モデルに向けた実験とユーザーフィードバック収集の過程
- GoogleはGeminiを通じて速度・知能・コスト効率のバランスを追求しており、開発者がより優れたAIアプリケーションを作れるよう継続的に改善している
1件のコメント
Hacker Newsのコメント
リリースノートは こちら を参照。ペリカン関連の議論は この投稿 を参照