- Magistral は、Mistral AIが公開した ドメイン特化・透明性・多言語推論 に特化した初の推論(reasoning)モデル
- オープンソースの Magistral Small(240億パラメータ) と、企業向けエンタープライズ版の Magistral Medium の2種類で提供
- 思考の連鎖(Chain of Thought) に基づく多言語推論を、段階的な論理プロセスとしてユーザーの言語で透明に提供
- AIME2024では Magistral Medium 73.6%(最高90%)、Small 70.7%(最高83.3%)の性能を示した
- 法務、金融、ヘルスケアなどの規制産業、データエンジニアリング、ソフトウェア開発、クリエイティブコンテンツなど、さまざまな言語と業種に向けた 正確な段階的ロジック展開 と 10倍高速な応答速度 をサポート
Magistral — Mistral AI初の推論モデルを発表
- Magistralは、実問題の解決能力 と フィードバックベースの改善 に焦点を当てた reasoning モデル
- Magistral Small は240億パラメータのオープンソース版、Magistral Medium はより強力なエンタープライズ版として提供される
- 性能指標:
- Magistral Medium: AIME2024で73.6%、多数決基準で90%を達成
- Magistral Small: それぞれ70.7%、83.3%
- グローバル言語および文字ベースの Chain of Thought 論証を適用し、母語レベルの思考展開が可能
- 構造的計算、プログラミングロジック、意思決定ツリー、ルールベースシステム など多様な業務に適している
- Le Chatの Think mode と Flash Answers 機能により、競合比で応答速度を10倍向上
- 公式論文には アルゴリズム、学習インフラ、強化学習手法、トレーニングの知見 全般に関する評価を収録
モデルおよび技術の詳細
- 透明な推論プロセス:
- Magistralは 多段階ロジック に最適化されており、ユーザーは 推論プロセスを自分の言語で確認・追跡 できる
- 一般的なモデルと異なり、解釈可能性 と検証機能を強化
- 継続的なモデル更新と迅速な改善を目指す
- 多言語推論: 英語、フランス語、スペイン語、ドイツ語、イタリア語、アラビア語、ロシア語、中国語などで高い精度と論理の一貫性を維持
- 応答速度:
- Magistral Mediumは Le Chatの Flash Answers 機能を通じて、競合比10倍のトークン処理速度 で リアルタイム推論とフィードバック をサポート
- ChatGPTなど主要な競合モデルと比べても、速度面で卓越している ことを実証
オープンソースとコミュニティ参加
- Magistral Smallは Apache 2.0ライセンス で公開
- ユーザーは構造や推論方式を 直接分析、修正、再構成 できる
- 以前のオープンソースモデルは、ether0、DeepHermes 3のような 革新的な研究プロジェクト に活用されてきた
幅広い適用事例
- Magistralは 法務、金融、ソフトウェア開発、ストーリーテリング など、精密な段階的推論 と 透明性 が重要な領域に最適化されている
-
ビジネス戦略と運用
- 戦略企画、リスク評価、データに基づく意思決定、複雑な制約条件下での 最適解計算 などを実行可能
-
規制産業および公共部門
- 法務、金融、ヘルスケア、政府の専門家が 論理的推論経路の追跡 と 監査可能性の確保 を行える
- 結果の 監査可能性と規制遵守の達成 を支援
-
システム、ソフトウェア、データエンジニアリング分野
- 非推論LLM と比べて、プログラミング、プロジェクト設計、バックエンドアーキテクチャ、データエンジニアリング 支援の品質を改善
- 外部ツールやAPI連携など、複数段階の作業 に効果的
-
コンテンツ生成とコミュニケーション
- Magistralは 創造的ライティング、ストーリーテリング でも優れた結果を示す
- 一貫したテキストだけでなく、独創的で奇抜なアイデア生成も可能
利用方法と提供経路
- Small版は ダウンロード後にセルフホスト可能
- Medium版は Le Chat(Web)、API、Amazon SageMaker ですぐに利用可能
- 近日中に IBM WatsonX、Azure AI、Google Cloud Marketplace でも追加サポート予定
- 企業向けカスタマイズ、オンプレミス導入 は別途問い合わせ
1件のコメント
Hacker Newsのコメント
ollama run hf.co/unsloth/Magistral-Small-2506-GGUF:UD-Q4_K_XLコマンドで実行でき、llama.cppでは--jinja、--temp 0.7、--top-p 0.95などのオプションを必ず使ってほしいとのこと。Ollamaのコンテキスト長も8192以上に増やすのが推奨され、追加ガイドは公式ドキュメントで確認可能