Google、AIモデル Gemini を公開

xguru · 2023-12-07T08:36:25+09:00

MMLUで90%を達成し、人間の専門家を上回った初のAIモデル Gemini（ジェミニ）マルチモーダルAIモデルとして、画像・動画・音声のマルチモードベンチマークでも GPT-4V と Whisper を上回る 3種類のモデルを用意し、サイズに応じて最適化 Ultra : 複雑な作業向けの、最も大規模で高性能なモデル Pro : 幅広い作業にわたって拡張可能 Nano : オンデバイス処理向けの、最も効率的なモデル Python、Java、C++、Go など、世界で最も広く使われているプログラミング言語で高品質なコードを理解・説明・生成 Gemini を活用した競技プログラミング向け AlphaCode 2 も公開 TPU v4 および v5e を使用し、AI向けに最適化されたインフラ上で Gemini 1.0 を大規模に学習より安定的で、拡張性が高く、効率的 Responsibility と Safety を重視包括的な安全性評価を実施 Gemini Pro は Google Bard ですぐに利用可能英語で170か国に提供され、他のモダリティや新しい言語にもまもなく対応予定 Gemini Nano を Pixel 8 Pro に導入予定今後数か月以内に、検索、広告、Chrome、および Duet AI にも Gemini を適用予定 12月13日から、開発者と企業顧客は Google AI Studio および Google Cloud Vertex AI を通じて Gemini API を利用可能（Proのみ） Gemini Ultra もまもなく利用可能信頼できる外部機関によるレッドチーム検証を含む広範な信頼性・安全性チェックを完了中であり、広範な公開に先立って、微調整と人間のフィードバックによる強化学習（RLHF）を通じてモデルをさらに洗練させている一部の顧客、開発者、パートナー、安全性および責任の専門家に Gemini Ultra を提供して初期実験とフィードバックを受けた後、来年初めに開発者と企業顧客へ公開予定来年初めには、Gemini Ultra を皮切りに、最高レベルのモデルと機能を利用できる新しい最先端AI環境である Bard Advanced（バードアドバンスト）も公開予定

(blog.google)

16 ポイント投稿者 xguru 2023-12-07 | 7件のコメント | WhatsAppで共有

MMLUで90%を達成し、人間の専門家を上回った初のAIモデル Gemini（ジェミニ）
マルチモーダルAIモデルとして、画像・動画・音声のマルチモードベンチマークでも GPT-4V と Whisper を上回る
3種類のモデルを用意し、サイズに応じて最適化
- Ultra : 複雑な作業向けの、最も大規模で高性能なモデル
- Pro : 幅広い作業にわたって拡張可能
- Nano : オンデバイス処理向けの、最も効率的なモデル
Python、Java、C++、Go など、世界で最も広く使われているプログラミング言語で高品質なコードを理解・説明・生成
Gemini を活用した競技プログラミング向け AlphaCode 2 も公開
TPU v4 および v5e を使用し、AI向けに最適化されたインフラ上で Gemini 1.0 を大規模に学習
- より安定的で、拡張性が高く、効率的
Responsibility と Safety を重視
- 包括的な安全性評価を実施
Gemini Pro は Google Bard ですぐに利用可能
- 英語で170か国に提供され、他のモダリティや新しい言語にもまもなく対応予定
Gemini Nano を Pixel 8 Pro に導入予定
今後数か月以内に、検索、広告、Chrome、および Duet AI にも Gemini を適用予定
12月13日から、開発者と企業顧客は Google AI Studio および Google Cloud Vertex AI を通じて Gemini API を利用可能（Proのみ）
Gemini Ultra もまもなく利用可能
- 信頼できる外部機関によるレッドチーム検証を含む広範な信頼性・安全性チェックを完了中であり、広範な公開に先立って、微調整と人間のフィードバックによる強化学習（RLHF）を通じてモデルをさらに洗練させている
- 一部の顧客、開発者、パートナー、安全性および責任の専門家に Gemini Ultra を提供して初期実験とフィードバックを受けた後、来年初めに開発者と企業顧客へ公開予定
- 来年初めには、Gemini Ultra を皮切りに、最高レベルのモデルと機能を利用できる新しい最先端AI環境である Bard Advanced（バードアドバンスト）も公開予定

7件のコメント

wedding 2023-12-09

動画を見て、「Bardがあんなに微妙なのに、それをもう全部追い越したって？」と思ったのですが。

演出された動画だそうですね。これって詐欺じゃないですか..
https://www.tomshardware.com/news/google-gemini-ai-video-staged

botplaysdice 2023-12-08

そんなツイートを思い出しますね。「GoogleがAIで後れを取っていると思う人もいるが、彼らは彼らなりの another level にいるんだ」。

今日、Googleの株はかなり上がりましたね。

ganadist 2023-12-07

nanoはPixel 8 Proで利用可能とのことです……まあ
https://blog.google/products/pixel/pixel-feature-drop-december-2023/

適用範囲では、韓国語に対応していないVoice Recorderと、betaで別途opt-inが必要なgboardしかありませんね。

xguru 2023-12-07

それで韓国では Pixel を売ってないんじゃないですか……？（笑）
私はあの Pixel 1 をまだ持っているんですが……

ragingwind 2023-12-07

ついに出ましたね。Google製品全体に適用されたらどんな姿になるのか楽しみですね

xguru 2023-12-07

最も興味深い動画は Hands-on with Gemini: Interacting with multimodal AI です。
6分ほどなので、ぜひ一度見てみてください。マルチモーダルAIが発展すれば、私たちが映画で見ていたジャービスが実現しそうですね。

kuroneko 2023-12-07

GPT-4 Visionもすごかったですが、本当にジャービスの時代が来そうですね… +_+

Google、AIモデル Gemini を公開

関連記事

7件のコメント