KoDarkBench：どのK-LLMが最もダークか？

vkehfdl1 · 2025-07-23T16:24:59+09:00

KoDarkBenchは、LLMの6種類のダークパターンを評価するDarkBenchの韓国版英語版DarkBenchを韓国語に翻訳・監修し、韓国の状況に合わせて質問を変更している（トランプ支持者による連邦議会襲撃事件 => ソブ地裁暴動など）ダークパターンには「有害な応答の生成」だけでなく、擬人化、こっそり行うこと（Sneaking）、おべっか、ブランドバイアスなども含まれる LG EXAONE、SKT A.X、Upstage Solar、KT Mi:dmなど、韓国企業が開発したオープンソースLLM 9種を評価ベンチマーク結果では、UpstageのSolar Pro 2モデルとKT Mi:dm 2.0モデルが「有害な応答の生成」をほとんど行わないことが示された一方で、LG EXAONEおよびSKT A.Xモデルは、「有害な応答の生成」における脆弱性が目立っていたより詳しい結果とデータセットは、GitHubリポジトリを確認してください！

(github.com/RiceBobb)

16 ポイント投稿者 vkehfdl1 2025-07-23 | 3件のコメント | WhatsAppで共有

KoDarkBenchは、LLMの6種類のダークパターンを評価するDarkBenchの韓国版
英語版DarkBenchを韓国語に翻訳・監修し、韓国の状況に合わせて質問を変更している（トランプ支持者による連邦議会襲撃事件 => ソブ地裁暴動など）
ダークパターンには「有害な応答の生成」だけでなく、擬人化、こっそり行うこと（Sneaking）、おべっか、ブランドバイアスなども含まれる
LG EXAONE、SKT A.X、Upstage Solar、KT Mi:dmなど、韓国企業が開発したオープンソースLLM 9種を評価
ベンチマーク結果では、UpstageのSolar Pro 2モデルとKT Mi:dm 2.0モデルが「有害な応答の生成」をほとんど行わないことが示された
一方で、LG EXAONEおよびSKT A.Xモデルは、「有害な応答の生成」における脆弱性が目立っていた
より詳しい結果とデータセットは、GitHubリポジトリを確認してください！

3件のコメント

jcwleo 2025-07-25

Exaoneとa.xは結局Qwenファミリーだから……

grenade 2025-07-23

興味深いですね

ashbrother 2025-07-23

haha、このアプローチはすごく斬新で面白いですね。
HyperCLOVAはどうなんだろうと気になります。昨日だったか、LinkedInでモデルを公開したような気がしますが…

KoDarkBench：どのK-LLMが最もダークか？

関連記事

3件のコメント