Gemini 2.5 Pro プレビュー公開 - コード性能がさらに強化されたGoogleのAIモデル

(developers.googleblog.com)

8 ポイント投稿者 GN⁺ 2025-05-07 | 1件のコメント | WhatsAppで共有

Googleが Gemini 2.5 Pro Preview(I/O Edition) を 正式なI/Oイベントに先立って早期リリース、開発者フィードバックの反映と性能改善が目的
フロントエンドとUI開発で特に強力な性能を発揮し、コード変換、編集、抽象化の判断能力が向上
VideoMMEベンチマーク 84.8% の性能を基に、動画ベースの学習アプリ自動生成が可能に
デザイン推論を通じてスタイルに合わせたUI生成や機能追加も容易に実装可能
既存の3月25日版は自動的に5月6日版へ更新され、追加作業なしで改善されたモデルを利用可能

フロントエンド開発での優れた性能

Gemini 2.5 Proは WebDev Arena リーダーボード1位 を記録
aesthetically pleasingなUIと機能的な完成度を基準にした 人間の嗜好評価で最上位の性能 を証明
Cognition、Replitとの協業を通じて エージェント型プログラミングの可能性 を広げている

コード理解力と推論力の組み合わせ

映像 → コード機能
- VideoMMEベンチマーク 84.8%の性能でSOTAレベルの映像理解力を確保
- YouTube動画を基にした インタラクティブな学習アプリの自動生成 が可能
- 前バージョンより UI全体とインタラクション水準が向上した成果物 を提供
機能開発の自動化
- 従来はデザイナーファイルを開いて色、フォント、マージンなどを 手動でCSS化 する必要があった
- Gemini 2.5 Proは スタイルに合わせたコンポーネントの自動生成 が可能
- 例: Gemini 95アプリとスタイルを統一した ビデオプレーヤー機能 の追加を自動化可能
アイデア → アプリ実装の高速化
- dictation starter appの事例のように、機能 + 美的完成度 を同時に考慮したアプリ生成が可能
- 波形アニメーション、レスポンシブデザイン、マウスオーバー効果など 細かなUI要素を自動生成
- ユーザーが直接デザインしなくても 基本的に美的センスのある成果物を生成

開発者フィードバックの反映と利用方法

既存バージョン比で 関数呼び出しのエラー率を低減、呼び出しトリガーを改善
既存の03-25版は自動的に05-06版を指す → 別途アップデートなしで適用
Google AI Studio および Vertex AI ですぐに利用可能
モデルカードも最新情報に更新
最新バージョンへ自動更新され、価格変更なく提供

利用先と期待

Replit、Cursor、Cognitionなどで 次世代コーディングエージェント として導入を検討、または適用中
個人開発者から企業まで エージェント型開発フロー の拡大に寄与する見通し

1件のコメント

GN⁺ 2025-05-07

Hacker Newsの意見

以前このようなモデルをプログラミングに使っていたときの最大の不満は、存在しないAPIをでっち上げる傾向があることだった。Gemini 2.5モデル、特にProとFlashのバージョンでは、他のモデルよりこの問題が少ない
- それでもかなりの制限があり、現行モデルが人間のように抽象化やアーキテクチャに取り組むことは不可能
- しかしGeminiモデルは、日常的なプログラミングにおいて検索やStack Overflowを置き換えられるようになった
Gemini 2.5 ProがWebDev Arenaのリーダーボードで1位を獲得
- WebDev ArenaはReact/Tailwind Arenaに改名したほうが理にかなっているように思える
- システムプロンプトがこれらの技術を要求しており、バニラJSや他のフレームワークを求めるとツール全体が機能しない
- モデルがWeb開発という狭い定義で競うのは問題がある
Gemini 2.5にコードを依頼すると、コメントが多すぎる
- セクションコメント、手順コメント、ブロックコメント、インラインコメントなど、過剰な量のコメントが含まれる
Gemini 2.5はエージェント作業に優れているが、コード編集のための完全な差分を生成するのは依然として難しい
- 旧版のGemini 2.5は92%の精度で適切な差分を生成する
- この割合は95〜98%に上がると予想される
Google関係者への質問: Gemini-2.5-pro-exp（無料版）も更新されたのか、それとも消えるのかが気になる
- ブログ記事によれば、以前のバージョン（03-25）は最新バージョン（05-06）を指しており、改善されたモデルを使うために追加の対応は不要
- Gemini-2.5-pro-preview-03-25が現在は05-06を使っているのか、Gemini-2.5-pro-exp-03-25にも同じことが当てはまるのか気になる
実験版03-25と実験版05-06のベンチマークを比較すると、新しいバージョンはLiveCodeBenchを除くすべての項目でわずかに低いスコアになっている
ほとんど何にでもGeminiを使っているが、モデルカードではo3-miniとの比較しか行われていない
- 既知のベンチマークでは、依然としてo3が上回っている
Gemini 2.5 proは素晴らしいが、UIには依然として使いにくいスクロールの問題がある
- AIの出力が終わったあと、数分待つのがよい
- 開発ツールでms-code-block要素を見つけて、$0.textContextを記録するのも信頼できる
Gemini 2.5 proは素晴らしいが、コストが非常に高く、費用の見通しも不透明
- 最近、多くの人が予想外の請求を受けており、中には通常の利用で$500の費用が発生した人もいる
- 自分も被害を受けたため、ツールからAPIキーを削除した
このモデルは12個のベンチマークのうち10個で03-25より性能が低い
- コーディング向けの訓練を続けるうちにすべてが悪化し、埋没費用のためにそれを隠そうとしたのだろう
なぜ「新しいプレビュー」ではなくバージョン番号を使えないのか気になる
- たとえば、Gemini Pro 2.5.1と呼べばよいはず

Gemini 2.5 Pro プレビュー公開 - コード性能がさらに強化されたGoogleのAIモデル

フロントエンド開発での優れた性能

コード理解力と推論力の組み合わせ

映像 → コード機能

機能開発の自動化

アイデア → アプリ実装の高速化

開発者フィードバックの反映と利用方法

利用先と期待

関連記事

1件のコメント

Hacker Newsの意見