- LG AI Researchが開発した新しいReasoning AIモデル、EXAONE Deepを公開
- Agentic AI時代への移行に不可欠な高性能推論モデル
- 数学、科学、コーディング分野で優れた推論能力を実証
- 主な特徴:
- 数学: 高難度数学ベンチマークで競合モデルを上回る性能(より小さいモデルサイズで同等性能を達成)
- 科学 & コーディング: 主要ベンチマークで1位を達成(7.8Bおよび2.4Bモデル)
- MMLU: 韓国国内モデルの中で最高性能を達成(32Bモデル)
- Epoch AIの注目すべきAIモデルに掲載され、性能が検証済み(EXAONE 3.5に続き、EXAONEモデルとしては2番目)
数学分野での優れた性能
- すべてのEXAONE Deepモデル(32B、7.8B、2.4B)が2025年度大学修学能力試験の数学領域で最高点を獲得
- EXAONE Deep 32B:
- 大学修学能力試験数学 94.5点、AIME 2024 90.0点を記録
- AIME 2025でDeepSeek-R1 (671B)モデルと同等の性能
- 特に高難度ベンチマークであるAIMEで優れた性能を示し、学習効率とコスト効率を実証
- EXAONE Deep 7.8B & 2.4B:
- 各軽量モデルおよびオンデバイスモデルカテゴリーで主要ベンチマーク1位
- 7.8Bモデル: MATH-500 94.8点、AIME 2025 59.6点
- 2.4Bモデル: MATH-500 92.3点、AIME 2024 47.9点
- 主な数学ベンチマーク:
- CSAT(大学修学能力試験)
- AIME (American Invitational Mathematics Examination)
- MATH-500
科学およびコーディング分野での卓越した専門性
- 科学およびコーディング分野でも競合モデルと比べて優れた性能を実証
- EXAONE Deep 32B:
- GPQA Diamondテスト 66.1点(PhDレベルの科学問題解決能力を評価)
- LiveCodeBench 59.5点(コーディング能力評価)で、同規模のReasoning AIモデルを上回る
- 専門知識が求められる分野でも高い活用可能性を示唆
- EXAONE Deep 7.8B & 2.4B:
- GPQA DiamondおよびLiveCodeBenchで1位を達成
- EXAONE 3.5 2.4Bモデルに続き、軽量/オンデバイスモデル分野でグローバル先導モデルとしての地位を確立
- 主な科学およびコーディングベンチマーク:
- GPQA Diamond
- LiveCodeBench
9件のコメント
わあ、LGを応援しています。LLMはほぼ韓国で最高レベルではないでしょうか。社内システムとしての活用もうまくやっていると聞いていますが……ただ、ライセンスは残念ですね。新しいバージョンが出たら旧バージョンはMITで公開してくれるといいですね。
ノートPCでローカル実行するならEXAONE 3.5も十分よかったので、期待していますね。
びっくりしました。宣伝向けかと思っていましたが、あの保守的なLGがこういうものを出して、しかも公開までしたとは…。
調べてみたライセンスを見る限り、どう活用できるのかは気になるところです。
3.1 Commercial Use: The Licensee is expressly prohibited from using the Model, Derivatives, or Output for
any commercial purposes, including but not limited to, developing or deploying products, services, or
applications that generate revenue, whether directly or indirectly.
3.1 商業的使用: ライセンシーは、直接的または間接的に収益を生み出す製品、サービス、またはアプリケーションの開発もしくは展開を含め、モデル、派生物、または出力物を商業目的で使用することを明示的に禁止されます。
4.2 Output: All rights, title, and interest in and to the Output generated by the Model and Derivatives
whether in its original form or modified, are and shall remain the exclusive property of the Licensor.
4.2 出力物: 原本の形式であるか修正された形式であるかを問わず、モデルおよび派生物によって生成された出力物に関するすべての権利、所有権、および利益はライセンサーの独占的財産であり、今後もそのままとなります。
はい。商用利用が不可能なライセンスです。ですので、私は検討対象から外しています。
サーバーにインストールして使ってみましたが、qwqに比べてthink時間が長すぎますね。
正答率が高いかどうかは分からないものの、レイテンシが思ったより深刻な印象です。
一部の問題だけがそうだったのですね。いくつか追加で回して比較してみると、同じような結果になるようです。
応援しています~ LG~ファイト~
応援しています。LinkedInで見かけるたびに「いいね」を押しています。