- 小規模言語モデル(SLM)の可能性を実証した Phi シリーズ の公開から1周年を迎え、推論に最適化され、マルチステップ思考に特化した新しいモデル群を発表
- パラメータ規模が小さいにもかかわらず、大規模モデルに匹敵する性能を示す
- Phi-4-reasoning: 14Bパラメータ、高品質な reasoning データで SFT(Supervised Fine-Tuning)を実施
- Phi-4-reasoning-plus: 上記モデルに RL(Reinforcement Learning)を追加し、1.5倍多いトークン使用で精度を向上
- Phi-4-mini-reasoning: 3.8B規模ながら、さまざまな数学ベンチマークで2倍以上大きいモデルを上回る、モバイル/エッジに適する
- OpenThinker-7B、Llama-3.2-3B、DeepSeek-R1 系列など多様なモデルを性能面で上回る
- OpenAI o1-mini と同等またはそれ以上の成果で、特に Math-500、GPQA Diamond など数学中心のテストで強み
- これらのモデルは、Copilot+ PC 向けの NPU 最適化版である Phi Silica として提供され、Windows 環境で高速かつ効率的に実行可能
- Azure AI Foundry および HuggingFace で公開:
- 開発者 API とローカル統合ツールもあわせて提供され、さまざまな環境へ容易に組み込める
まだコメントはありません。