LG AI Research、EXAONE Deepを公開

lemonmint · 2025-03-19T10:45:38+09:00

LG AI Researchが開発した新しいReasoning AIモデル、EXAONE Deepを公開 Agentic AI時代への移行に不可欠な高性能推論モデル数学、科学、コーディング分野で優れた推論能力を実証主な特徴: 数学: 高難度数学ベンチマークで競合モデルを上回る性能（より小さいモデルサイズで同等性能を達成）科学 & コーディング: 主要ベンチマークで1位を達成（7.8Bおよび2.4Bモデル） MMLU: 韓国国内モデルの中で最高性能を達成（32Bモデル） Epoch AIの注目すべきAIモデルに掲載され、性能が検証済み（EXAONE 3.5に続き、EXAONEモデルとしては2番目）数学分野での優れた性能すべてのEXAONE Deepモデル（32B、7.8B、2.4B）が2025年度大学修学能力試験の数学領域で最高点を獲得 EXAONE Deep 32B: 大学修学能力試験数学 94.5点、AIME 2024 90.0点を記録 AIME 2025でDeepSeek-R1 (671B)モデルと同等の性能特に高難度ベンチマークであるAIMEで優れた性能を示し、学習効率とコスト効率を実証 EXAONE Deep 7.8B & 2.4B: 各軽量モデルおよびオンデバイスモデルカテゴリーで主要ベンチマーク1位 7.8Bモデル: MATH-500 94.8点、AIME 2025 59.6点 2.4Bモデル: MATH-500 92.3点、AIME 2024 47.9点主な数学ベンチマーク: CSAT（大学修学能力試験） AIME (American Invitational Mathematics Examination) MATH-500 科学およびコーディング分野での卓越した専門性科学およびコーディング分野でも競合モデルと比べて優れた性能を実証 EXAONE Deep 32B: GPQA Diamondテスト 66.1点（PhDレベルの科学問題解決能力を評価） LiveCodeBench 59.5点（コーディング能力評価）で、同規模のReasoning AIモデルを上回る専門知識が求められる分野でも高い活用可能性を示唆 EXAONE Deep 7.8B & 2.4B: GPQA DiamondおよびLiveCodeBenchで1位を達成 EXAONE 3.5 2.4Bモデルに続き、軽量／オンデバイスモデル分野でグローバル先導モデルとしての地位を確立主な科学およびコーディングベンチマーク: GPQA Diamond LiveCodeBench

(lgresearch.ai)

24 ポイント投稿者 lemonmint 2025-03-19 | 9件のコメント | WhatsAppで共有

LG AI Researchが開発した新しいReasoning AIモデル、EXAONE Deepを公開
Agentic AI時代への移行に不可欠な高性能推論モデル
数学、科学、コーディング分野で優れた推論能力を実証
主な特徴:
- 数学: 高難度数学ベンチマークで競合モデルを上回る性能（より小さいモデルサイズで同等性能を達成）
- 科学 & コーディング: 主要ベンチマークで1位を達成（7.8Bおよび2.4Bモデル）
- MMLU: 韓国国内モデルの中で最高性能を達成（32Bモデル）
Epoch AIの注目すべきAIモデルに掲載され、性能が検証済み（EXAONE 3.5に続き、EXAONEモデルとしては2番目）

数学分野での優れた性能

すべてのEXAONE Deepモデル（32B、7.8B、2.4B）が2025年度大学修学能力試験の数学領域で最高点を獲得
EXAONE Deep 32B:
- 大学修学能力試験数学 94.5点、AIME 2024 90.0点を記録
- AIME 2025でDeepSeek-R1 (671B)モデルと同等の性能
- 特に高難度ベンチマークであるAIMEで優れた性能を示し、学習効率とコスト効率を実証
EXAONE Deep 7.8B & 2.4B:
- 各軽量モデルおよびオンデバイスモデルカテゴリーで主要ベンチマーク1位
- 7.8Bモデル: MATH-500 94.8点、AIME 2025 59.6点
- 2.4Bモデル: MATH-500 92.3点、AIME 2024 47.9点
主な数学ベンチマーク:
- CSAT（大学修学能力試験）
- AIME (American Invitational Mathematics Examination)
- MATH-500

科学およびコーディング分野での卓越した専門性

科学およびコーディング分野でも競合モデルと比べて優れた性能を実証
EXAONE Deep 32B:
- GPQA Diamondテスト 66.1点（PhDレベルの科学問題解決能力を評価）
- LiveCodeBench 59.5点（コーディング能力評価）で、同規模のReasoning AIモデルを上回る
- 専門知識が求められる分野でも高い活用可能性を示唆
EXAONE Deep 7.8B & 2.4B:
- GPQA DiamondおよびLiveCodeBenchで1位を達成
- EXAONE 3.5 2.4Bモデルに続き、軽量／オンデバイスモデル分野でグローバル先導モデルとしての地位を確立
主な科学およびコーディングベンチマーク:
- GPQA Diamond
- LiveCodeBench

9件のコメント

sice81 2025-03-20

わあ、LGを応援しています。LLMはほぼ韓国で最高レベルではないでしょうか。社内システムとしての活用もうまくやっていると聞いていますが……ただ、ライセンスは残念ですね。新しいバージョンが出たら旧バージョンはMITで公開してくれるといいですね。

mindok 2025-03-19

ノートPCでローカル実行するならEXAONE 3.5も十分よかったので、期待していますね。

bungker 2025-03-19

びっくりしました。宣伝向けかと思っていましたが、あの保守的なLGがこういうものを出して、しかも公開までしたとは…。

halfenif 2025-03-20

調べてみたライセンスを見る限り、どう活用できるのかは気になるところです。

Restrictions
3.1 Commercial Use: The Licensee is expressly prohibited from using the Model, Derivatives, or Output for
any commercial purposes, including but not limited to, developing or deploying products, services, or
applications that generate revenue, whether directly or indirectly.

3.1 商業的使用: ライセンシーは、直接的または間接的に収益を生み出す製品、サービス、またはアプリケーションの開発もしくは展開を含め、モデル、派生物、または出力物を商業目的で使用することを明示的に禁止されます。

Ownership
4.2 Output: All rights, title, and interest in and to the Output generated by the Model and Derivatives
whether in its original form or modified, are and shall remain the exclusive property of the Licensor.

4.2 出力物: 原本の形式であるか修正された形式であるかを問わず、モデルおよび派生物によって生成された出力物に関するすべての権利、所有権、および利益はライセンサーの独占的財産であり、今後もそのままとなります。

yosemite 2025-03-20

はい。商用利用が不可能なライセンスです。ですので、私は検討対象から外しています。

junia3 2025-03-19

サーバーにインストールして使ってみましたが、qwqに比べてthink時間が長すぎますね。
正答率が高いかどうかは分からないものの、レイテンシが思ったより深刻な印象です。

junia3 2025-03-19

一部の問題だけがそうだったのですね。いくつか追加で回して比較してみると、同じような結果になるようです。

nowdoit7 2025-03-19

応援しています～ LG～ファイト～

jujumilk3 2025-03-19

応援しています。LinkedInで見かけるたびに「いいね」を押しています。

LG AI Research、EXAONE Deepを公開

数学分野での優れた性能

科学およびコーディング分野での卓越した専門性

関連記事

9件のコメント