Gemini 3 Flash: 速度のために設計されたフロンティア・インテリジェンス

(blog.google)

4 ポイント投稿者 GN⁺ 2025-12-18 | 1件のコメント | WhatsAppで共有

Gemini 3 Flash は、高速かつ低コストで フロンティア級の知能 を提供する Google の最新 AI モデル
Gemini 3 Pro レベルの推論能力を維持しながら、Flash シリーズの低遅延と効率性 を組み合わせ、日常的な作業とエージェント型ワークフローを支援
GPQA Diamond 90.4%、Humanity’s Last Exam 33.7%、MMMU Pro 81.2% など主要ベンチマークで Gemini 2.5 Pro を上回る
開発者は Google AI Studio、Gemini CLI、Antigravity、Vertex AI などからアクセスでき、一般ユーザーは Gemini アプリと検索の AI モード を通じて無料で利用可能
速度・コスト・知能のバランスを新たに定義し、大規模ユーザーと企業環境の両方にスケール可能なモデル として位置づけられる

Gemini 3 Flash の概要

Gemini 3 Flash は Gemini 3 モデル群の拡張版 であり、速度と効率性を極限まで高めた次世代モデル
- Gemini 3 Pro と Deep Think モードに続いて公開され、1 兆トークン/日 以上が API を通じて処理されている
- 複雑なトピックの学習、インタラクティブゲームの設計、マルチモーダルコンテンツの理解など、多様な活用事例が報告されている
Gemini 3 の高度な推論・ビジョン理解・エージェント型コーディング機能 を維持しつつ、Flash レベルの低遅延とコスト効率を組み合わせている
日常的な作業の精度向上 と エージェント型ワークフロー に最適化されたモデルとして設計されている

性能とベンチマーク

Gemini 3 Flash は 速度とスケールが知能を犠牲にしないことを実証
- GPQA Diamond 90.4%、Humanity’s Last Exam 33.7%（ツール未使用）、MMMU Pro 81.2% で 大規模モデルに匹敵する性能 を示す
- Gemini 2.5 Pro と比べて多数のベンチマークで優れた結果 を記録
品質・コスト・速度のパレートフロンティア を拡張
- 複雑な作業ではより長く考える一方、一般的なトラフィック基準で 平均 30% 少ないトークン使用量 で高い性能を維持
Artificial Analysis 基準で 2.5 Pro より 3 倍高速、コストは 入力 100 万トークンあたり $0.50、出力 $3.00
- 音声入力は 100 万トークンあたり $1.00

開発者向け機能

反復的な開発と高頻度ワークフロー に適した低遅延のコーディング性能を提供
- SWE-bench Verified ベンチマークで 78% のスコア を記録し、2.5 シリーズと Gemini 3 Pro の両方を上回る
動画分析、データ抽出、視覚的質問応答 など複合マルチモーダル作業に強み
- リアルタイムのゲーム支援、A/B テスト、デザイン自動化など、インテリジェントなアプリケーション実装 を支援
JetBrains、Bridgewater Associates、Figma などの企業がすでに導入しており、Vertex AI および Gemini Enterprise を通じて提供される

一般ユーザー向け機能

Gemini アプリのデフォルトモデル として 2.5 Flash を置き換え、世界中のユーザーが無料で利用可能
- 動画・画像分析を通じた 実行可能な計画の生成 など、マルチモーダル推論機能を強化
- 例: ゴルフスイング分析、絵の認識、音声ベースのカスタムクイズ生成など
音声コマンドだけでアプリのプロトタイプ作成 が可能で、非専門家でもすばやくアプリを実装できる
検索の AI モード においてもデフォルトモデルとして適用
- Gemini 3 Pro の推論力を基盤に 質問の文脈を細かく分析 し、視覚的に整理された回答とリアルタイム情報 を提供
- 複雑な旅行計画や教育概念の学習など、多段階の目標処理 に強み

アクセス経路と展開

開発者向け: Google AI Studio、Gemini CLI、Antigravity、Vertex AI、Gemini Enterprise でプレビュー提供
一般ユーザー向け: Gemini アプリと Google 検索の AI モードで段階的なグローバルロールアウトを実施
Gemini 3 Flash は Gemini 3 Pro、Deep Think とともに、Gemini 3 モデル群の主要な柱 として拡張される

1件のコメント

GN⁺ 2025-12-18

Hacker Newsの意見

「Flash」という名前に惑わされてはいけない。このモデルは本当に驚異的な性能を見せている
数週間使ってみたが、速度も速く知識の範囲も広いため、Claude Opus 4.5やGPT 5.2 Extra Highよりはるかに効率的だ。推論時間とコストはほぼ10分の1の水準だ
- 私もベンチマークを回してみたが、2.5 Flash、2.5 Pro、3.0 Flashの中では3.0 Flashが最も良かった
  応答時間はそのままで、結果ははるかに良くなった。価格性能比がとんでもない
  GoogleがProとFlashモデルの間でどんな技術的な違いによってこの性能を実現したのか気になる
  ちなみに私はGemini APIをよく使うので、新しいモデルが出るたびに内部ベンチマークでテストしてみたい
- 私はGenAI懐疑派だ。複雑だったりニッチな話題についてよくテストするが、ほとんどのモデルはひどい答えを返す
  しかしGemini 3 Flashは、私が持っている特定のベンチマーク質問に対して初めてほぼ正解に近い答えを出した
  まだサンプルは少ないが、精度向上ははっきり見える
- OpenAIが高速な推論モデルを軽視してきたのは大きなミスだと思う
  GPT 5ひとつですべてを解決しようとする戦略は失敗だ。
  今Gemini 3 Flashをテスト中だが、レイテンシと性能の両方でGPT 5 Thinkingより良い結果が出ている
  OpenAIは宣伝よりも実用的なモデル開発に集中すべきだ
- ベンチマークを見ると、Flashは**幻覚(hallucination)**の面では弱いが、全体的にはGemini 3 ProやGPT 5.1 Thinkingより優れている
  詳細な結果はArtificial Analysisの評価ページで確認できる
- OpenAIに過剰投資した企業が後悔する時が来るかもしれない。Nvidiaは例外かもしれないが、MicrosoftはAzureを通じてモデルを売っているのでそれほど気にしないだろう
今回のリリースはプレビューなしでそのまま本番投入できるのが良い
ただし値上げは続いている
たとえばGemini 1.5 Flashは入力 $0.075/M → 3.0 Flashは $0.50/M まで上がった
Proモデルは入力 $2/M、出力 $12/M 程度だ
訂正すると、今回のモデルもプレビュー版だ
- 私としてはむしろGemini 3 Flash Liteが出たときの性能と価格のほうが気になる
  コーディング以外の大半の作業では、ProよりもFlashとFlash Liteの違いのほうが重要かもしれない
- 価格の整理ありがとう。Gemini 3.0は性能が非常に高いので、自信のある価格戦略なのだろう
  ただ競争が激しいので、近いうちに同程度の性能を持つ低価格モデルが出てきそうだ
- Thinkingモードをオンにするとトークン使用量が変わるので、実際のコスト計算ではそれも考慮する必要がある
- GPT-5 Miniは入力 $0.25/M、出力 $2/M なので、Flashより入力は半額、出力は50%安い
Googleは本当に速度・価格・品質の三拍子をそろえた感じだ
AndroidやG Suiteとの統合まで考えるととてつもない組み合わせだ
おそらくOpenAI–Jony IveのハードウェアプロジェクトやApple Intelligenceより先にAI-firstスマートフォンを出そうという戦略なのだろう
- ただ実際の利用ではケースによって異なる。
  たとえばGemini 3 Proは単純なEditツール呼び出しでも遅く、しかもよく失敗する
  同じ作業をClaude-Codeは5分で終えるのに、Geminiは27分かかる
- MacRumorsの記事によれば、Apple IntelligenceはGeminiベースになる予定だ
- しかしスマートフォンでAIをどこに使うのか疑問だ。
  むしろタブレットやスマートグラスのほうがsmol AIを活用するのに適していると思う
Gemini 3 Flash(non-thinking)は、私の「子犬の脚の本数テスト」で50%を記録した最初のモデルだ
5本脚の合成画像を見せたとき、ほとんどのモデルは4本と答えたが、3 Flashは5本だと正解した
脚にタトゥーを追加したときだけ正確に数え、タトゥーのない画像には依然として4本と答えた
半分の点を与えるに値する
Flashモデルはますます高くなっているが、今回の3.0 Flashはコスパが異常に高い
ベンチマークで78%を記録し、2.5シリーズと3 Proをすべて上回った
エージェント型コーディングとリアルタイムなインタラクティブアプリに理想的だ
- 3.0 Flashは2.5 Proより安く、速く、性能も良い
  2.5 Flashユーザーにとってはアップグレード時のコストが少し痛いかもしれないが、それだけの価値はある
- Flashをますますコーディング・推論中心モデルとして位置づけていくのは良い方向だと思う
  低価格帯が欲しければFlash Liteがあるので、バランスは取れている
- NvidiaのNemotron 3 Nanoが似たOSS代替になり得る
  高速で賢く、1Mコンテキストもサポートしている
- 私のアプリのベンチマークではGemini FlashとGrok 4 Fastだけが実用的だった
  オープンウェイトモデルがこの領域で競争してくれることを願う
- Epoch.aiのベンチマーク基準でもOpenAIのGPT 5.2より優れている
すでにClaude CodeとGeminiの組み合わせで十分に**「良い水準」**に達したと感じている
もはや他社が私を説得するのは難しい。
今回のリリースで「十分に良く、十分に安い」が交差する地点に到達した
- 私は乗り換えコストがほとんどないので、簡単にモデルを切り替えられる
  CLIやIDEプラグインでモデル選択を変えるだけでいい
- 最近のモデルはついにエージェント型コーディングの約束を現実のものにしてくれた
- 以前のモデルはよく間違えて、かえって時間の無駄だった
  精度の当たり外れが大きすぎた
- Opus 4.5なら、すでにソフトウェアエンジニアリングの問題は「解決」されたレベルだ
  企業は無制限の知能を求めるが、個人にはそこまで必要ない
SimpleQAベンチマークで69%を記録したが、これは極めて珍しい知識テストだ
Gemini 2.5 Proが55%だったことを考えると、とてつもないスコアだ
Googleは知識圧縮や**MoE(専門家混合)**構造をうまく活用したように見える
- Artificial AnalysisのOmniscience評価も参考になる
- MoE構造のおかげで、TPUで多数のパラメータを使いながらもスループットを維持できたのだろう
- こうしたモデルは音声インターフェースにも非常に向いていそうだ。おそらくAppleも採用するだろう
- あるいは内部的にツール呼び出し（たとえばGoogle検索）を活用して推論している方式かもしれない
- 専門家数を増やし、活性化比率を下げて**疎性(sparsity)**を高めた構造である可能性もある
Gemini 3の「Thinking」と「Pro」の違いがよく分からない
説明では「複雑な問題解決」vs「高度な数学・コード向けの長時間思考」となっている
おそらく**思考予算(thinking budget)**の違いなのだろう
- Fast = Flash(低い思考予算)、Thinking = Flash(高い思考予算)、Pro = Pro(思考予算高め)という構造に見える
- 実際にはthinking_levelパラメータで制御されているようだ
- Geminiの「Thinking」がAGIとどう違うのか気になる
  Geminiは常にクエリベースの思考しか行わない。
  ループと持続コンテキストを追加すればAGIのように見えるかもしれないが、コストが大きくなる
  Googleもおそらくこうした実験はすでに行っているはずだ
私の主な不満は会話削除機能の欠如だ
ビジネスアカウントでは個別の会話を削除できず、保持期間全体（最短3か月）しか設定できない
有料ユーザーとして、どんどん高くなる料金に比べて基本機能が不足している
- API経由で使えばこの問題は回避できる
- コンシューマ向け・企業向けのどちらもデータ保持制御がひどい。主要競合の中で最悪だ
手早い価格比較を見ると、LLM Prices基準で
Gemini 3 FlashはPro ≤200kの4分の1、Pro >200kの8分の1の価格だ
200kトークン以降も価格が上がらない点が印象的だ
入力基準ではGPT-5 Miniの2倍、Claude 4.5 Haikuの半額水準だ

Gemini 3 Flash: 速度のために設計されたフロンティア・インテリジェンス

Gemini 3 Flash の概要

性能とベンチマーク

開発者向け機能

一般ユーザー向け機能

アクセス経路と展開

関連記事

1件のコメント

Hacker Newsの意見