- xAIが発表したGrok 4 Fastは、既存のGrok 4の学習成果を基盤に、コスト効率と速度を最大化した次世代推論モデル
- このモデルは2Mトークンのコンテキストウィンドウ、WebおよびX検索機能、そしてreasoning / non-reasoning統合アーキテクチャを備え、リアルタイム活用に適している
- ベンチマークではGrok 4と同等の性能を示しながら、平均40%少ないトークンを使用し、同じ性能をはるかに低いコストで達成できる
- また、ツール使用強化学習を通じてコード実行、Web探索などで高い性能を発揮し、LMArena Search Arenaで1位を記録
コスト効率的な知能の進化
- Grok 4 FastはGrok 3 Miniより優れた性能を示しながら、トークンコストを大幅に削減
- 平均的にGrok 4比で**40%**少ない「Thinking Tokens」の使用で同等の性能を達成
- ベンチマークスコア例(pass@1):
- Grok 4 Fast: 85.7%, 92.0%, 93.3%, 20.0%, 80.0%
- 競合モデル(GPT-5など)と比較して同等または優れた結果
- GPQA、AIME、HMMT、LiveCodeBenchなど、さまざまな推論ベンチマークでGrok 4に近い成果を示す
- Grok 4 Fastはトークン効率を40%改善するとともに、トークン単価も大幅に引き下げ
- 同一性能達成時の価格はGrok 4比で98%削減され、公開モデルの中で「最高の価格対知能比(SOTA Price-to-Intelligence Ratio)」を記録
- 独立機関であるArtificial Analysis Intelligence Indexの外部評価でも優秀な成績が検証された
ネイティブなツール活用とSOTA検索
- **ツール使用強化学習(RL)**で訓練されており、必要に応じてコード実行やWebブラウジングを自動で行える
- WebとXをリアルタイムに探索し、マルチホップ検索やメディア(画像、動画)まで処理するエージェント型検索能力を備える
- BrowseComp、SimpleQA、X Bench Deepsearch(zh)など各種ベンチマークでGrok 4を上回る性能を達成
一般ドメインのポストトレーニング成果
- LMArenaのSearch ArenaでGrok 4 Fast(
menlo)はElo 1163で1位を記録し、競合モデルに17ポイント差をつけた
- Text Arenaでは
grok-4-fast(コードネーム tahoe)が8位で、同クラスの他モデル(18位以下)と比べて圧倒的に優秀
- 実際の検索およびテキスト作業で、大規模モデル以上の効率性を示す
ReasoningとNon-Reasoningの統合モデル
- 従来は別モデルが必要だったreasoning / non-reasoningモードを単一アーキテクチャに統合
- システムプロンプトだけでreasoning(深い思考)およびnon-reasoning(高速応答)モードを切り替え可能
- エンドツーエンドの遅延時間とトークンコストの削減により、リアルタイムアプリケーションに適している
- xAI APIでは開発者が速度と深さを細かく調整できる
提供開始と価格ポリシー
- Grok 4 Fastはすぐに利用可能で、OpenRouterとVercel AI Gatewayでは期間限定で無料提供される
- xAI APIでも
grok-4-fast-reasoningとgrok-4-fast-non-reasoningの2バージョンで提供され、2Mトークンのコンテキストウィンドウをサポート
- 価格は入力トークン**$0.20/1M**、出力トークン**$0.50/1M**からで、128kトークン超過時は2倍料金が適用される
- キャッシュ入力トークンは**$0.05/1M**で提供され、コスト削減に役立つ
今後の計画
2件のコメント
gpt-ossより高くて遅いようですが、なぜこんなに多くの人が使っているのか気になります..Hacker Newsの意見
grok-code-fast-1モデルを最近よく使っているが、今回の新製品では言及がなくて残念。もしかするともっと良いバージョンではないかと期待している。grok-code-fast-1は Gemini 2.5 Pro に少し劣るとしても、反復速度では最高だ