Gemini 2.0、世界中のユーザーに公開

(blog.google)

2 ポイント投稿者 GN⁺ 2025-02-07 | 1件のコメント | WhatsAppで共有

Gemini 2.0 の一般提供
- 2024年のI/Oで初めて紹介されたFlashシリーズのモデルは、大量の高頻度タスクに最適化された強力なモデルとして、開発者の間で人気を集めている
- 2.0 Flash は現在、より多くのユーザーに一般提供されており、主要ベンチマークで性能が向上している
- 画像生成および音声変換機能もまもなく追加される予定
2.0 Pro 実験モデル: 最高のコーディング性能と複雑なプロンプト処理
- Gemini 2.0 Pro は、コーディング性能と複雑なプロンプト処理能力が最も優れたモデルで、世界知識の理解と推論能力が向上している
- 200万トークンという最大のコンテキストウィンドウを提供し、膨大な情報を総合的に分析して理解できる
- Google AI Studio と Vertex AI で開発者向けに実験モデルとして提供され、Gemini Advanced ユーザーも利用できる
2.0 Flash-Lite: 最も費用対効果の高いモデル
- 1.5 Flash の価格と速度に対する好意的なフィードバックを踏まえ、2.0 Flash-Lite は同じ速度とコストでより高い品質を提供する
- ほとんどのベンチマークで 1.5 Flash を上回り、100万トークンのコンテキストウィンドウとマルチモーダル入力をサポートする
- Google AI Studio と Vertex AI でパブリックプレビューとして提供される
責任と安全性への取り組み
- Gemini モデルファミリーがさらに強力になるにつれ、安全かつセキュアな利用のための強力な対策への投資を継続している
- 新しい強化学習手法を用いて Gemini 自身に応答を批評させることで、より正確で目的志向のフィードバックを提供する
- 自動化されたレッドチームを活用し、間接的なプロンプトインジェクションのようなサイバーセキュリティ攻撃のリスクを評価している

1件のコメント

GN⁺ 2025-02-07

Hacker Newsの意見

Geminiモデルに関する明確な情報が不足しており、混乱を招いている。Google Workspaceサブスクリプションに含まれるGemini Advancedに関する情報も不足している。
- 「Gemini Advanced」という名前があるだけで、モデルを選択するオプションがない。
- Google AI StudioはLLMラッパーアプリの構築に重点を置いているが、単に質問への回答を求めるユーザーには適していない。
- 検索で得られる情報は不確かで、Gemini AdvancedがWorkspaceサブスクリプションに含まれるという情報がある。
- gemini.google.com のページにはモデルに関する情報がまったくなく、設定オプションもダークモードの切り替えしかできない。
Google AI StudioとVertex AIを通じてGemini APIにアクセスできる。
- Gemini 2.0、2.0 Pro、2.0 Pro Experimental、Gemini 2.0 Flash、Gemini 2.0 Flash Liteなど、さまざまなモデルが存在する。
- ベンチマークは自社モデルとの比較しかない。
音声チャットでは政治的な話題に対する制限がある。
- ユーザーが料理の計画について話していたところ、政治的な話題だと誤解されて会話が制限された。
AIモデルの名称がわかりにくい。
- Flash、Flash-Liteなどの命名規則が理解しづらい。
- Googleのモデル品質は他の主要企業と比べて低いという意見がある。
PDFパースでは価格対性能に優れている。
- Gemini Flash-Liteはコスト効率が高く、Lite版のベンチマークに期待したい。
AI Studioで新しいモデルを試せる。
- ライブモードを通じてリアルタイム会話が可能で、カメラを通して周囲の世界を見ることもできる。
Gemini 2.0 Flash-Liteの価格はOpenAIのGPT-4o miniより安い。
- テキスト/画像入力と音声入力の価格が比較的安い。
Gemini Pro 2.0モデルは印象的である。
- 調査、分析、執筆など一般的な認知タスクに適している。
- AI Studio経由で使うことを勧める一方、Geminiアプリはフィルタが多く、議論を呼びやすい話題への回答は制限されがちである。
Gemini 2.0 Flashモデルはマルチモーダルな作業に優れている。
- 文書処理や物体検出に適しており、価格対性能も優秀である。
- Qwen2.5 VL 72Bと7Bモデルは、文書画像の作業ではより良い性能を示している。
Gemini 2.0 Pro Experimentalモデルが注目されている。
- 複雑なプロンプト処理とコーディング性能に優れ、200万トークンのコンテキストウィンドウを提供する。

Gemini 2.0、世界中のユーザーに公開

Gemini 2.0 の一般提供

2.0 Pro 実験モデル: 最高のコーディング性能と複雑なプロンプト処理

2.0 Flash-Lite: 最も費用対効果の高いモデル

責任と安全性への取り組み

関連記事

1件のコメント

Hacker Newsの意見