Microsoft、2.7Bの小型ながら強力な言語モデルPhi-2を公開
(microsoft.com)- SLM: Small Language Model
- 2.7Bモデルでありながら、最大25倍大きいモデルと同等またはそれ以上の性能を示す
- Mistral 7B、Llama-7B/13Bの性能を上回る
- コーディングや数学のような多段階推論では、25倍大きいLlama-2-70Bモデルよりも優れている
- Google Gemini Nano 2より小さいが、同等またはそれ以上の性能を発揮
- GPT-4やLlama-2のようなモデルより少ない計算資源でも、テキスト生成や画像説明のような類似タスクを実行可能
- 小型であるため、機械的な解釈可能性、安全性の改善、さまざまなタスクに対するファインチューニング実験を含め、研究者にとって理想的なプレイグラウンドである
2件のコメント
Weightsはこちら https://huggingface.co/microsoft/phi-2
Hacker Newsの意見