Google、AIモデル Gemini を公開
(blog.google)- MMLUで90%を達成し、人間の専門家を上回った初のAIモデル Gemini(ジェミニ)
- マルチモーダルAIモデルとして、画像・動画・音声のマルチモードベンチマークでも GPT-4V と Whisper を上回る
- 3種類のモデルを用意し、サイズに応じて最適化
- Ultra : 複雑な作業向けの、最も大規模で高性能なモデル
- Pro : 幅広い作業にわたって拡張可能
- Nano : オンデバイス処理向けの、最も効率的なモデル
- Python、Java、C++、Go など、世界で最も広く使われているプログラミング言語で高品質なコードを理解・説明・生成
- Gemini を活用した競技プログラミング向け AlphaCode 2 も公開
- TPU v4 および v5e を使用し、AI向けに最適化されたインフラ上で Gemini 1.0 を大規模に学習
- より安定的で、拡張性が高く、効率的
- Responsibility と Safety を重視
- 包括的な安全性評価を実施
- Gemini Pro は Google Bard ですぐに利用可能
- 英語で170か国に提供され、他のモダリティや新しい言語にもまもなく対応予定
- Gemini Nano を Pixel 8 Pro に導入予定
- 今後数か月以内に、検索、広告、Chrome、および Duet AI にも Gemini を適用予定
- 12月13日から、開発者と企業顧客は Google AI Studio および Google Cloud Vertex AI を通じて Gemini API を利用可能(Proのみ)
- Gemini Ultra もまもなく利用可能
- 信頼できる外部機関によるレッドチーム検証を含む広範な信頼性・安全性チェックを完了中であり、広範な公開に先立って、微調整と人間のフィードバックによる強化学習(RLHF)を通じてモデルをさらに洗練させている
- 一部の顧客、開発者、パートナー、安全性および責任の専門家に Gemini Ultra を提供して初期実験とフィードバックを受けた後、来年初めに開発者と企業顧客へ公開予定
- 来年初めには、Gemini Ultra を皮切りに、最高レベルのモデルと機能を利用できる新しい最先端AI環境である Bard Advanced(バード アドバンスト)も公開予定
7件のコメント
動画を見て、「Bardがあんなに微妙なのに、それをもう全部追い越したって?」と思ったのですが。
演出された動画だそうですね。これって詐欺じゃないですか..
https://www.tomshardware.com/news/google-gemini-ai-video-staged
そんなツイートを思い出しますね。「GoogleがAIで後れを取っていると思う人もいるが、彼らは彼らなりの another level にいるんだ」。
今日、Googleの株はかなり上がりましたね。
nanoはPixel 8 Proで利用可能とのことです……まあ
https://blog.google/products/pixel/pixel-feature-drop-december-2023/
適用範囲では、韓国語に対応していないVoice Recorderと、betaで別途opt-inが必要なgboardしかありませんね。
それで韓国では Pixel を売ってないんじゃないですか……?(笑)
私はあの Pixel 1 をまだ持っているんですが……
ついに出ましたね。Google製品全体に適用されたらどんな姿になるのか楽しみですね
最も興味深い動画は Hands-on with Gemini: Interacting with multimodal AI です。
6分ほどなので、ぜひ一度見てみてください。マルチモーダルAIが発展すれば、私たちが映画で見ていたジャービスが実現しそうですね。
GPT-4 Visionもすごかったですが、本当にジャービスの時代が来そうですね… +_+