Microsoft、推論に最適化した Phi-4 を発表

xguru · 2025-05-02T11:36:01+09:00

小規模言語モデル（SLM）の可能性を実証した Phi シリーズの公開から1周年を迎え、推論に最適化され、マルチステップ思考に特化した新しいモデル群を発表パラメータ規模が小さいにもかかわらず、大規模モデルに匹敵する性能を示す Phi-4-reasoning: 14Bパラメータ、高品質な reasoning データで SFT（Supervised Fine-Tuning）を実施 Phi-4-reasoning-plus: 上記モデルに RL（Reinforcement Learning）を追加し、1.5倍多いトークン使用で精度を向上 Phi-4-mini-reasoning: 3.8B規模ながら、さまざまな数学ベンチマークで2倍以上大きいモデルを上回る、モバイル／エッジに適する OpenThinker-7B、Llama-3.2-3B、DeepSeek-R1 系列など多様なモデルを性能面で上回る OpenAI o1-mini と同等またはそれ以上の成果で、特に Math-500、GPQA Diamond など数学中心のテストで強みこれらのモデルは、Copilot+ PC 向けの NPU 最適化版である Phi Silica として提供され、Windows 環境で高速かつ効率的に実行可能 Azure AI Foundry および HuggingFace で公開: Phi-4-reasoning Phi-4-reasoning-plus Phi-4-mini-reasoning 開発者 API とローカル統合ツールもあわせて提供され、さまざまな環境へ容易に組み込める

(azure.microsoft.com)

3 ポイント投稿者 xguru 2025-05-02 | まだコメントはありません。 | WhatsAppで共有

小規模言語モデル（SLM）の可能性を実証した Phi シリーズ の公開から1周年を迎え、推論に最適化され、マルチステップ思考に特化した新しいモデル群を発表
パラメータ規模が小さいにもかかわらず、大規模モデルに匹敵する性能を示す
Phi-4-reasoning: 14Bパラメータ、高品質な reasoning データで SFT（Supervised Fine-Tuning）を実施
Phi-4-reasoning-plus: 上記モデルに RL（Reinforcement Learning）を追加し、1.5倍多いトークン使用で精度を向上
Phi-4-mini-reasoning: 3.8B規模ながら、さまざまな数学ベンチマークで2倍以上大きいモデルを上回る、モバイル／エッジに適する
- OpenThinker-7B、Llama-3.2-3B、DeepSeek-R1 系列など多様なモデルを性能面で上回る
- OpenAI o1-mini と同等またはそれ以上の成果で、特に Math-500、GPQA Diamond など数学中心のテストで強み
これらのモデルは、Copilot+ PC 向けの NPU 最適化版である Phi Silica として提供され、Windows 環境で高速かつ効率的に実行可能
Azure AI Foundry および HuggingFace で公開:
開発者 API とローカル統合ツールもあわせて提供され、さまざまな環境へ容易に組み込める

Microsoft、推論に最適化した Phi-4 を発表

関連記事

まだコメントはありません。