- Grok-2 と Grok-2 mini モデルが、X プラットフォームの Grok ユーザー向けにリリースされた
- Grok-2 は、前モデルの Grok-1.5 から大幅に進化したチャット、コーディング、推論能力を備えている
sus-column-r という名前で LMSYS リーダーボードにてテストされた Grok-2 の初期バージョンは、Claude 3.5 Sonnet と GPT-4-Turbo を上回る性能を示した
Grok-2 言語モデルとチャット機能
- Grok-2 の初期バージョンは、sus-column-r という名前で LMSYS Chatbot Arena(有名な LLM 競争ベンチマークツール)に提出された
- モデルの総合的な Elo スコアの面で Claude と GPT-4 を上回った
ベンチマーク
- Grok-2 モデルは、推論、読解、数学、科学、コーディングなど一連の学術ベンチマークで評価された
- Grok-2 と Grok-2 mini は、従来の Grok-1.5 モデルと比べて大幅な改善を示した
- 大学院レベルの科学知識(GPQA)、一般知識(MMLU、MMLU-Pro)、数学コンテスト問題(MATH)などの領域で、他の最先端モデルと競争力のある性能を達成した
- Grok-2 は、視覚的数学推論(MathVista)と文書ベースの質問応答(DocVQA)で最先端の性能を示した
X のリアルタイム情報で Grok を体験する
- X プラットフォーム上で Grok は継続的に改善されてきた
- X Premium および Premium+ ユーザーは、Grok-2 と Grok-2 mini という 2 つの新モデルにアクセスできる
- Grok-2 は X アプリの Grok タブから利用でき、テキスト理解とビジョン理解の両方で高度な機能を備えた最先端の AI アシスタントである
- Grok-2 mini は、速度と回答品質のバランスを提供する小型ながら有能なモデルである
- Black Forest Labs と協力して FLUX.1 モデルを試験導入し、X における Grok の機能を拡張している
Enterprise API を使って Grok で構築する
- 今月末、新しいエンタープライズ API プラットフォームを通じて、開発者向けに Grok-2 と Grok-2 mini を提供する予定
- 新しい API は、世界中で低レイテンシーのアクセスを可能にするマルチリージョン推論デプロイを実現する、新しいカスタム技術スタックを基盤として構築されている
- 必須の多要素認証、充実したトラフィック統計、高度な請求分析など、強化されたセキュリティ機能を提供する
- 既存の社内ツールやサービスに、チーム、ユーザー、請求管理を統合できる管理 API を提供する
What is Next?
- Grok-2 と Grok-2 mini は X で提供が始まっている
- Grok が提供する強化された検索機能、X 投稿に対する深い洞察、改善された返信機能など、さまざまな AI ベース機能に大きな期待が寄せられている
- まもなく X と API における Grok 体験の中核機能として、マルチモーダル理解のプレビューを公開する予定
- 2023 年 11 月の Grok-1 発表以降、X.AI は小規模ながら非常に優秀な人材が密集したチーム主導のもと、驚異的なスピードで進んできた
- Grok-2 の導入により、AI 開発の最前線に立つことになる
- 新しいコンピューティングクラスターにより、中核となる推論能力の向上に注力している
- 今後数か月のうちに、さらに多くの開発状況を共有する予定
- 「人類の未来に向けて最も大きな影響を持つイノベーションの構築に専念する、小さく集中したチームに加わる人材を求めている」
まだコメントはありません。