MiniMax-M3が登場、主要ベンチマーク性能でGPT-5.5とGemini 3.1 Proを上回り、コストはわずか5〜10%
(venturebeat.com)中国のAIスタートアップMiniMaxが、既存の米国製商用モデルと比べて5〜10%という破格のコストで、GPT-5.5とGemini 3.1 Proを上回るオープンウェイトベースのマルチモーダル大規模言語モデル「M3」を電撃リリースしました。
全文翻訳
中国のAIスタートアップMiniMaxが、フロンティア級のコーディング性能と100万トークンのコンテキストウィンドウを備えたマルチモーダル大規模言語モデル「M3」を電撃リリースし、グローバルな企業向けAI市場に大きな波紋を広げています。M3は今後10日以内にHugging FaceとGitHubを通じて「オープンウェイト(Open Weights)」オープンソースライセンスで配布される予定で、企業が社内サーバーにローカルでダウンロードし、カスタム最適化できるよう支援します。現在はローンチ特価として100万入力トークンあたり0.3ドル、出力トークンあたり1.20ドル(総コスト1.50ドル )で提供されており、通常価格が適用されても米国の主要商用モデルの8〜20%水準 {p:14} にすぎず、Google、OpenAI、Anthropicなど米国の巨大テック企業をコスト面で圧倒しています。
M3がこのような劇的なコスト削減を実現した核心的な理由は、従来のTransformerが抱える二乗比例の計算コスト爆発問題を解決した「MiniMax Sparse Attention(MSA)」アーキテクチャのおかげです。MSA技術はデータを高精度ブロックに分割し、必要なクエリのみを動的にマッチングすることでハードウェア効率を最大化し、100万トークンを処理する際の計算要求量を従来の20分の1水準 {p:5} に引き下げ、デコーディング速度を15倍も引き上げました。こうした構造的革新を土台に、M3は自律的ソフトウェアエンジニアリング遂行能力を評価するSWE-Bench Proで59.0% {p:59} を記録し、クローズドモデルであるGPT-5.5やGemini 3.1 Proを上回り、Webブラウジングおよび情報検索性能(BrowseComp 83.5% {p:84})でも従来のClaude Ops 4.7の記録を超えました。
最近リリースされた最高性能のクローズドモデルClaude Ops 4.8(SWE-Bench Pro 69.2% )と比べると、超高難度推論領域では一部に性能差が存在しますが、M3は莫大なAPI利用料なしでも強力なローカル自動化の基準点を提供します。あわせてMiniMaxは、M3を搭載して自らコードを書き、独立した検証ループを回し、自律的に修正する「MiniMax Code」エージェント製品群も同時に披露し、月額20ドル(Plus)から始まる攻撃的な料金プランを導入しました。厳格なデータプライバシーとコンプライアンスが必須の企業環境において、M3のオープンウェイト提供はクラウドへのデータ流出リスクを根本的に遮断し、企業固有の中核資産として内製化できる、非常に高いコストパフォーマンスをもたらすと期待されます。
筆者のひとこと
ollamaクラウドで使ってみようと思います
2件のコメント
肩を並べるというモデルの基準は実際には少し誇張されているのでしょうが、価格は衝撃的ですね
今使っていますが、ほかの中国モデルのように文章を書いている途中で中国語が飛び出してくる問題はないですね。tool callもちゃんとできるようです。