Gemini: これまででGoogleで最も高性能なAIモデル
(blog.google)要約タイトル: GoogleとDeepMindの新しいAIモデル「Gemini」の紹介
- GoogleとAlphabetのCEOであるサンダー・ピチャイは、AIがモバイルやウェブへの移行よりも大きな変化をもたらすと信じている。
- GoogleはAI中心の企業として8年間の歩みを重ね、生成AIによってユーザーが新しい方法で協業し創造できるようになった。
- Googleは研究への野心と社会に大きな利益をもたらす能力を追求する一方で、AIのリスクに対処するため政府や専門家と協力している。
Geminiの紹介
- Google DeepMindのCEOで共同創業者でもあるデミス・ハサビスは、AIが人類に驚くべき恩恵をもたらすと信じている。
- GeminiはGoogleのチーム間における大規模な協力によって作られた、最も高性能なモデルであり、テキスト、コード、音声、画像、動画など多様な情報タイプを理解し扱うことができる。
- Gemini 1.0は3つのサイズに最適化されており、データセンターからモバイル機器まで効率的に動作できる。
最先端の性能
- Geminiモデルはさまざまなタスクで現在の最先端の結果を上回る性能を示している。
- Gemini Ultraは、人間の専門家を上回る性能を示すMMLUで90.0%のスコアを記録した。
- 画像ベンチマークでも従来モデルを上回る性能を見せ、Geminiの複雑な推論能力の初期的な兆候を示している。
次世代の能力
- Geminiは生まれつきマルチモーダルであり、さまざまなモダリティにまたがる理解と推論の能力が既存モデルよりはるかに優れている。
- Gemini 1.0は複雑な文書から知識を抽出し、数学や物理学のような複雑なテーマで推論を説明することに特に優れている。
- Geminiは高品質なコードを理解・生成でき、プログラミング言語間の作業や複雑な情報に対する推論において先導的な基盤モデルの一つである。
より信頼でき、拡張可能で、効率的
- Gemini 1.0はGoogleのAI最適化インフラとTPU v4およびv5eを使用して大規模に訓練された。
- Geminiは従来モデルより高速に動作し、GoogleのAI製品で中核的な役割を果たすカスタムAIアクセラレータである。
- GoogleはCloud TPU v5pを発表し、Geminiの開発を加速させ、開発者が大規模AIモデルをより速く訓練できるようにした。
責任と安全性を中核に据えて構築
- GoogleはGeminiのマルチモーダル能力を考慮して新たな保護措置を追加し、開発のあらゆる段階で潜在的なリスクを考慮している。
- GeminiはGoogleのAIモデルの中で最も包括的な安全評価を受けており、内部評価手法の盲点を特定するため外部専門家と協力した。
- Geminiは安全分類器と強力なフィルタを使って、暴力や否定的なステレオタイプのような内容を識別・分類する。
Geminiを世界へ提供
- Gemini 1.0はGoogleの製品とプラットフォームに導入されており、BardはGemini Proの上位版を使用して、より高度な推論と理解を提供する。
- 開発者と企業顧客はGoogle AI StudioまたはGoogle Cloud Vertex AIを通じてGemini Proにアクセスできる。
- Gemini Ultraは信頼性と安全性の検証を経た後、初期段階のフィードバックのために選ばれた顧客、開発者、パートナー、専門家に提供される予定である。
GN⁺の見解
この記事で最も重要なのは、GoogleとDeepMindがGeminiという新しいAIモデルを開発し、AI技術の新たな時代を切り開いていることだ。Geminiはマルチモーダル機能を備えており、テキスト、画像、音声などさまざまな形態の情報を理解し処理できる能力を持っているため、開発者や企業がより革新的な製品やサービスを生み出す機会を提供する。この記事が興味深い理由は、AI技術が人間の生活をどのように変えうるかについて具体的な例を示し、こうした技術の進歩がどのように責任を持って進められるべきかというGoogleのアプローチも示している点にある。
1件のコメント
HN側にも重複投稿があるため、私がGeekNewsに別途投稿した Google、AIモデル Gemini を公開 をご覧ください。