16 ポイント 投稿者 xguru 2023-12-07 | 7件のコメント | WhatsAppで共有
  • MMLUで90%を達成し、人間の専門家を上回った初のAIモデル Gemini(ジェミニ)
  • マルチモーダルAIモデルとして、画像・動画・音声のマルチモードベンチマークでも GPT-4V と Whisper を上回る
  • 3種類のモデルを用意し、サイズに応じて最適化
    • Ultra : 複雑な作業向けの、最も大規模で高性能なモデル
    • Pro : 幅広い作業にわたって拡張可能
    • Nano : オンデバイス処理向けの、最も効率的なモデル
  • Python、Java、C++、Go など、世界で最も広く使われているプログラミング言語で高品質なコードを理解・説明・生成
  • Gemini を活用した競技プログラミング向け AlphaCode 2 も公開
  • TPU v4 および v5e を使用し、AI向けに最適化されたインフラ上で Gemini 1.0 を大規模に学習
    • より安定的で、拡張性が高く、効率的
  • Responsibility と Safety を重視
    • 包括的な安全性評価を実施
  • Gemini Pro は Google Bard ですぐに利用可能
    • 英語で170か国に提供され、他のモダリティや新しい言語にもまもなく対応予定
  • Gemini Nano を Pixel 8 Pro に導入予定
  • 今後数か月以内に、検索、広告、Chrome、および Duet AI にも Gemini を適用予定
  • 12月13日から、開発者と企業顧客は Google AI Studio および Google Cloud Vertex AI を通じて Gemini API を利用可能(Proのみ)
  • Gemini Ultra もまもなく利用可能
    • 信頼できる外部機関によるレッドチーム検証を含む広範な信頼性・安全性チェックを完了中であり、広範な公開に先立って、微調整と人間のフィードバックによる強化学習(RLHF)を通じてモデルをさらに洗練させている
    • 一部の顧客、開発者、パートナー、安全性および責任の専門家に Gemini Ultra を提供して初期実験とフィードバックを受けた後、来年初めに開発者と企業顧客へ公開予定
    • 来年初めには、Gemini Ultra を皮切りに、最高レベルのモデルと機能を利用できる新しい最先端AI環境である Bard Advanced(バード アドバンスト)も公開予定

7件のコメント

 
wedding 2023-12-09

動画を見て、「Bardがあんなに微妙なのに、それをもう全部追い越したって?」と思ったのですが。

演出された動画だそうですね。これって詐欺じゃないですか..
https://www.tomshardware.com/news/google-gemini-ai-video-staged

 
botplaysdice 2023-12-08

そんなツイートを思い出しますね。「GoogleがAIで後れを取っていると思う人もいるが、彼らは彼らなりの another level にいるんだ」。

今日、Googleの株はかなり上がりましたね。

 
ganadist 2023-12-07

nanoはPixel 8 Proで利用可能とのことです……まあ
https://blog.google/products/pixel/pixel-feature-drop-december-2023/

適用範囲では、韓国語に対応していないVoice Recorderと、betaで別途opt-inが必要なgboardしかありませんね。

 
xguru 2023-12-07

それで韓国では Pixel を売ってないんじゃないですか……?(笑)
私はあの Pixel 1 をまだ持っているんですが……

 
ragingwind 2023-12-07

ついに出ましたね。Google製品全体に適用されたらどんな姿になるのか楽しみですね

 
xguru 2023-12-07

最も興味深い動画は Hands-on with Gemini: Interacting with multimodal AI です。
6分ほどなので、ぜひ一度見てみてください。マルチモーダルAIが発展すれば、私たちが映画で見ていたジャービスが実現しそうですね。

 
kuroneko 2023-12-07

GPT-4 Visionもすごかったですが、本当にジャービスの時代が来そうですね… +_+