Alibaba、Qwen2-Mathモデルを公開
(qwenlm.github.io)- Qwen2 LLMをベースに構築されたQwen2-Mathは、オープンソースモデルおよび非公開モデル(例: GPT-4o)の数学能力を大きく上回る
- Qwen2-MathとQwen2-Math-Instruct-1.5B/7B/72Bを含む、数学特化の大規模言語モデルシリーズ
- 最大モデルであるQwen2-Math-72B-Instructは、GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro、Llama-3.1-405Bなどの最新モデルを上回ることが示された
- 現在のモデルは英語のみをサポート。まもなくバイリンガル(英語および中国語)の数学モデルを公開予定
1件のコメント
Alibaba、Qwen 2モデルを公開
Qwen1.5-110B : アリババのオープンソースLLM Qwen1.5シリーズ初の100B+モデル
Alibaba、オープンソースAIモデル QWENを公開