4 ポイント 投稿者 xguru 2024-08-11 | 1件のコメント | WhatsAppで共有
  • Qwen2 LLMをベースに構築されたQwen2-Mathは、オープンソースモデルおよび非公開モデル(例: GPT-4o)の数学能力を大きく上回る
    • Qwen2-MathとQwen2-Math-Instruct-1.5B/7B/72Bを含む、数学特化の大規模言語モデルシリーズ
  • 最大モデルであるQwen2-Math-72B-Instructは、GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro、Llama-3.1-405Bなどの最新モデルを上回ることが示された
  • 現在のモデルは英語のみをサポート。まもなくバイリンガル(英語および中国語)の数学モデルを公開予定