- Gemini 2.5 Deep Think 機能が Google AI Ultra 購読者向けとしてGeminiアプリに導入
- 新しい 並列思考(parallel thinking) 手法と研究成果が反映され、IMOで金メダルを受賞したモデルを基に、より実用的な利用に適した形へ改善
- 創造的問題解決、数学および科学的推論、アルゴリズム開発などさまざまな複雑な課題で優れた性能を発揮
- 性能向上のために**推論時間(Thinking Time)**を延長し、複数のアイデアと解法を同時に探索し、これによりより深い思考と創造的な成果物を生成
- 安全性と責任あるAI開発のために強化された評価と対策が実施され、今後APIおよびエンタープライズでの活用拡大が案内される
Gemini 2.5 Deep Thinkリリース
- Gemini 2.5 Deep Think 機能が Google AI Ultra 購読者向けに Geminiアプリを通じて提供
- 信頼されたテスターおよび研究者のフィードバックと最新研究成果が反映されたバージョン
- 最近の国際数学オリンピック(IMO)で金メダル級のモデルを基に、実際のユーザー体験に合わせて速度と実用性が改善
- 今回の公開により、創造的問題解決ツールとしての可能性を拡大し、数学者と研究者向けのフィードバックを基に機能を高度化する計画
Deep Thinkの動作原理
- 並列的思考手法を導入し、Geminiが複雑な問題に対して多様なアイデアと解法を同時に探索・比較・統合
- モデルの**推論時間(Thinking Time)**を増やし、複数の仮説を深く掘り下げてさらに創造的な解決策を見つけることが可能
- 強化学習により、これらの拡張された推論経路を積極的に活用するよう学習し、より直感的で深い問題解決能力を強化
Deep Thinkの主な性能と活用分野
- 段階的開発およびデザイン:複雑なシステムやデザインを段階的に発展させる作業で高性能を示す
- 科学および数学的発見:数学的推論や科学論文の解釈など高度な創造的探究で優位性を発揮
- アルゴリズムおよびコード開発:問題の構造化、時間計算量やトレードオフまで考慮する必要がある難しいコーディング問題で最先端の性能を達成
- 最新のベンチマーク(例:LiveCodeBench V6、Humanity’s Last Exam)で、既存モデルに対して最上位レベルのコード/知識/推論性能を実証
Geminiの責任ある開発と安全性
- Gemini 2.5 Deep Thinkは安全性評価において、既存Proモデルよりも改善されたコンテンツ安全性と客観的トーンを示す
- 複雑性の増加に伴いリスクも評価し、Frontier Safety評価と必要な対策を強化
- 詳細な安全性結果はモデルカードで確認可能
Deep Thinkの使用方法
- Google AI Ultra 購読者は、Geminiアプリのモデルドロップダウンから2.5 Proを選択し、プロンプトバーでDeep Thinkトグルを通じて1日あたりの上限回数で利用可能
- コード実行、Google検索などのツールと自動的に連携され、より長い回答生成が可能
- まもなくGemini APIおよびエンタープライズ向けの追加テストが予定されている
まだコメントはありません。