- Gemini 3 Flash は、高速かつ低コストで フロンティア級の知能 を提供する Google の最新 AI モデル
- Gemini 3 Pro レベルの推論能力を維持しながら、Flash シリーズの低遅延と効率性 を組み合わせ、日常的な作業とエージェント型ワークフローを支援
- GPQA Diamond 90.4%、Humanity’s Last Exam 33.7%、MMMU Pro 81.2% など主要ベンチマークで Gemini 2.5 Pro を上回る
- 開発者は Google AI Studio、Gemini CLI、Antigravity、Vertex AI などからアクセスでき、一般ユーザーは Gemini アプリと検索の AI モード を通じて無料で利用可能
- 速度・コスト・知能のバランスを新たに定義し、大規模ユーザーと企業環境の両方にスケール可能なモデル として位置づけられる
Gemini 3 Flash の概要
- Gemini 3 Flash は Gemini 3 モデル群の拡張版 であり、速度と効率性を極限まで高めた次世代モデル
- Gemini 3 Pro と Deep Think モードに続いて公開され、1 兆トークン/日 以上が API を通じて処理されている
- 複雑なトピックの学習、インタラクティブゲームの設計、マルチモーダルコンテンツの理解など、多様な活用事例が報告されている
- Gemini 3 の高度な推論・ビジョン理解・エージェント型コーディング機能 を維持しつつ、Flash レベルの低遅延とコスト効率を組み合わせている
- 日常的な作業の精度向上 と エージェント型ワークフロー に最適化されたモデルとして設計されている
性能とベンチマーク
- Gemini 3 Flash は 速度とスケールが知能を犠牲にしないことを実証
- GPQA Diamond 90.4%、Humanity’s Last Exam 33.7%(ツール未使用)、MMMU Pro 81.2% で 大規模モデルに匹敵する性能 を示す
- Gemini 2.5 Pro と比べて多数のベンチマークで優れた結果 を記録
- 品質・コスト・速度のパレートフロンティア を拡張
- 複雑な作業ではより長く考える一方、一般的なトラフィック基準で 平均 30% 少ないトークン使用量 で高い性能を維持
- Artificial Analysis 基準で 2.5 Pro より 3 倍高速、コストは 入力 100 万トークンあたり $0.50、出力 $3.00
開発者向け機能
- 反復的な開発と高頻度ワークフロー に適した低遅延のコーディング性能を提供
- SWE-bench Verified ベンチマークで 78% のスコア を記録し、2.5 シリーズと Gemini 3 Pro の両方を上回る
- 動画分析、データ抽出、視覚的質問応答 など複合マルチモーダル作業に強み
- リアルタイムのゲーム支援、A/B テスト、デザイン自動化など、インテリジェントなアプリケーション実装 を支援
- JetBrains、Bridgewater Associates、Figma などの企業がすでに導入しており、Vertex AI および Gemini Enterprise を通じて提供される
一般ユーザー向け機能
- Gemini アプリのデフォルトモデル として 2.5 Flash を置き換え、世界中のユーザーが無料で利用可能
- 動画・画像分析を通じた 実行可能な計画の生成 など、マルチモーダル推論機能を強化
- 例: ゴルフスイング分析、絵の認識、音声ベースのカスタムクイズ生成など
- 音声コマンドだけでアプリのプロトタイプ作成 が可能で、非専門家でもすばやくアプリを実装できる
- 検索の AI モード においてもデフォルトモデルとして適用
- Gemini 3 Pro の推論力を基盤に 質問の文脈を細かく分析 し、視覚的に整理された回答とリアルタイム情報 を提供
- 複雑な旅行計画や教育概念の学習など、多段階の目標処理 に強み
アクセス経路と展開
- 開発者向け: Google AI Studio、Gemini CLI、Antigravity、Vertex AI、Gemini Enterprise でプレビュー提供
- 一般ユーザー向け: Gemini アプリと Google 検索の AI モードで段階的なグローバルロールアウトを実施
- Gemini 3 Flash は Gemini 3 Pro、Deep Think とともに、Gemini 3 モデル群の主要な柱 として拡張される
1件のコメント
Hacker Newsの意見
「Flash」という名前に惑わされてはいけない。このモデルは本当に驚異的な性能を見せている
数週間使ってみたが、速度も速く知識の範囲も広いため、Claude Opus 4.5やGPT 5.2 Extra Highよりはるかに効率的だ。推論時間とコストはほぼ10分の1の水準だ
応答時間はそのままで、結果ははるかに良くなった。価格性能比がとんでもない
GoogleがProとFlashモデルの間でどんな技術的な違いによってこの性能を実現したのか気になる
ちなみに私はGemini APIをよく使うので、新しいモデルが出るたびに内部ベンチマークでテストしてみたい
しかしGemini 3 Flashは、私が持っている特定のベンチマーク質問に対して初めてほぼ正解に近い答えを出した
まだサンプルは少ないが、精度向上ははっきり見える
GPT 5ひとつですべてを解決しようとする戦略は失敗だ。
今Gemini 3 Flashをテスト中だが、レイテンシと性能の両方でGPT 5 Thinkingより良い結果が出ている
OpenAIは宣伝よりも実用的なモデル開発に集中すべきだ
詳細な結果はArtificial Analysisの評価ページで確認できる
今回のリリースはプレビューなしでそのまま本番投入できるのが良い
ただし値上げは続いている
たとえばGemini 1.5 Flashは入力 $0.075/M → 3.0 Flashは $0.50/M まで上がった
Proモデルは入力 $2/M、出力 $12/M 程度だ
訂正すると、今回のモデルもプレビュー版だ
コーディング以外の大半の作業では、ProよりもFlashとFlash Liteの違いのほうが重要かもしれない
ただ競争が激しいので、近いうちに同程度の性能を持つ低価格モデルが出てきそうだ
Googleは本当に速度・価格・品質の三拍子をそろえた感じだ
AndroidやG Suiteとの統合まで考えるととてつもない組み合わせだ
おそらくOpenAI–Jony IveのハードウェアプロジェクトやApple Intelligenceより先にAI-firstスマートフォンを出そうという戦略なのだろう
たとえばGemini 3 Proは単純な
Editツール呼び出しでも遅く、しかもよく失敗する同じ作業をClaude-Codeは5分で終えるのに、Geminiは27分かかる
むしろタブレットやスマートグラスのほうがsmol AIを活用するのに適していると思う
Gemini 3 Flash(non-thinking)は、私の「子犬の脚の本数テスト」で50%を記録した最初のモデルだ
5本脚の合成画像を見せたとき、ほとんどのモデルは4本と答えたが、3 Flashは5本だと正解した
脚にタトゥーを追加したときだけ正確に数え、タトゥーのない画像には依然として4本と答えた
半分の点を与えるに値する
Flashモデルはますます高くなっているが、今回の3.0 Flashはコスパが異常に高い
ベンチマークで78%を記録し、2.5シリーズと3 Proをすべて上回った
エージェント型コーディングとリアルタイムなインタラクティブアプリに理想的だ
2.5 Flashユーザーにとってはアップグレード時のコストが少し痛いかもしれないが、それだけの価値はある
低価格帯が欲しければFlash Liteがあるので、バランスは取れている
高速で賢く、1Mコンテキストもサポートしている
オープンウェイトモデルがこの領域で競争してくれることを願う
すでにClaude CodeとGeminiの組み合わせで十分に**「良い水準」**に達したと感じている
もはや他社が私を説得するのは難しい。
今回のリリースで「十分に良く、十分に安い」が交差する地点に到達した
CLIやIDEプラグインでモデル選択を変えるだけでいい
精度の当たり外れが大きすぎた
企業は無制限の知能を求めるが、個人にはそこまで必要ない
SimpleQAベンチマークで69%を記録したが、これは極めて珍しい知識テストだ
Gemini 2.5 Proが55%だったことを考えると、とてつもないスコアだ
Googleは知識圧縮や**MoE(専門家混合)**構造をうまく活用したように見える
Gemini 3の「Thinking」と「Pro」の違いがよく分からない
説明では「複雑な問題解決」vs「高度な数学・コード向けの長時間思考」となっている
おそらく**思考予算(thinking budget)**の違いなのだろう
thinking_levelパラメータで制御されているようだGeminiは常にクエリベースの思考しか行わない。
ループと持続コンテキストを追加すればAGIのように見えるかもしれないが、コストが大きくなる
Googleもおそらくこうした実験はすでに行っているはずだ
私の主な不満は会話削除機能の欠如だ
ビジネスアカウントでは個別の会話を削除できず、保持期間全体(最短3か月)しか設定できない
有料ユーザーとして、どんどん高くなる料金に比べて基本機能が不足している
手早い価格比較を見ると、LLM Prices基準で
Gemini 3 FlashはPro ≤200kの4分の1、Pro >200kの8分の1の価格だ
200kトークン以降も価格が上がらない点が印象的だ
入力基準ではGPT-5 Miniの2倍、Claude 4.5 Haikuの半額水準だ