- Mistral AIチームは、24Bパラメータのモデル「Mistral Small 3」をApache 2.0ライセンスで公開。
- このモデルは、Llama 3.3 70BやQwen 32Bのようなより大規模なモデルと競争でき、GPT4o-miniのようなプロプライエタリモデルの代替として適している。
- Mistral Small 3はローカル展開に適したサイズで設計されており、レイヤー数が少ないため処理時間が短縮される。
- MMLUで81%以上の精度を示し、150 tokens/sのレイテンシを持つ。
性能
人間による評価
- 外部評価会社とともに、1,000件以上のコーディングおよび一般プロンプトセットを評価。
- Mistral Small 3と他モデルの応答を比較し、選好を調査。
- 公正な評価のために慎重を期しており、ベンチマークの有効性に自信を持っている。
命令性能
- 命令調整モデルは、サイズが3倍大きい公開モデルおよびGPT4o-miniモデルと競争力のある性能を示す。
- コード、数学、一般知識、命令実行ベンチマークで高い精度を記録。
事前学習性能
- Mistral Small 3は24Bモデルで、サイズ当たり最高クラスの性能を提供し、Llama 3.3 70Bのような3倍大きいモデルと競争する。
Mistral Small 3のユースケース
- 高速応答の対話型支援: 高速かつ正確な応答が重要なシナリオで優れた性能を発揮する。
- 低レイテンシの関数呼び出し: 自動化ワークフローで高速な関数実行を処理できる。
- 専門分野エキスパートの生成: 特定ドメイン向けにファインチューニングし、高精度のエキスパートを生成できる。
- ローカル推論: 機密情報を扱う個人や組織に有用。
好みの技術スタックでMistral Small 3を使う
- Mistral Small 3は
mistral-small-latestまたはmistral-small-2501としてla Plateformeで利用可能。
- Hugging Face、Ollama、Kaggle、Together AI、Fireworks AIと連携し、モデルをさまざまなプラットフォームで提供。
今後の計画
- Mistral Small 3は、DeepSeekのような大規模オープンソース推論モデルを補完し、推論能力を強化できる強力な基盤モデルとして活用できる。
- 今後、より小さいモデルと大きいモデルが公開される予定。
Mistralのオープンソースモデル
- Apache 2.0ライセンスを用いて汎用モデルを提供する計画。
- モデル重みはダウンロードとローカル展開が可能で、自由に修正・利用できる。
- サーバーレスAPI、オンプレミスおよびVPC展開、カスタマイズとオーケストレーションプラットフォームを通じて提供される予定。
1件のコメント
Hacker Newsの意見
Mistral Smallモデルは、そこそこの性能のノートPCで実行できる最適なモデルを目指しており、Llama 3.3 70BおよびQwen 2.5 32Bと比較されている
Epoch AIのTomは、LLM評価を体系的かつ大規模に行うためのインフラを構築中
Apache 2.0ライセンスへ移行し、非商用ライセンスから離れつつある
コード生成プロンプトを試したところ、qwen2.5-coder-32bと似た性能を示した
今回のリリースの主なポイントは以下の通り
最近のMoEモデルのリリースにより、24GB VRAMでは不足に感じられる
Mistral Smallモデルは、Mary J Bligeの最初のアルバムに関する質問に正確に回答した
なぜ小型モデルを使うのか疑問に思う声がある
モデル名にパラメータ数を含めてほしいという意見がある