韓国語能力を評価するVLMベンチマーク3種を公開（KO-VQA、KO-VDC、KO-OCRAG）

(github.com/Marker-Inc-Korea)

8 ポイント投稿者 kyujin 2026-02-02 | まだコメントはありません。 | WhatsAppで共有

このプロジェクトでは、合計3つのベンチマークを紹介している。

すべてのデータセットの評価はLLM-as-a-Judgeに依存せず、完全な選択式で行われる。
1枚のA100 40GBまたは80GBの範囲で動かせるさまざまなオープンソースVLMと、closed-sourceであるgeminiを比較している。

各データセットの詳細な説明は、それぞれのREADMEを参照。
KO-VQA README
KO-VDC README
KO-OCRAG README

⭐⭐GitHub star⭐⭐や関心、広報はオープンソースプロジェクト制作の大きな力になります!!
*このプロジェクトはmarkrAIの支援を受けて進められた。

関連記事