7 ポイント 投稿者 kimchi 27 일 전 | 4件のコメント | WhatsAppで共有

Nemotron-Personas-Korea にLLMを組み合わせて、2026年地方選挙の広域自治体首長シミュレーションを回してみました。

NECから候補者8,300人をクローリング → ペルソナを地域ごとに300人ずつ、計5,100人サンプリング → Gemma 4 e4bで4,800票をシミュレーション(RTX 5060、3時間)。

結果

大邱市長: キム・ハング(無所属)90.5% / イ・ジェマン(国民の力)8.2% / キム・ブギョム(民主)1.4%

元国務総理 + 4選 + 大邱出身なのに1.4%。LLMがペルソナの「労働者」ラベルに引っ張られ、無所属の労働者候補に票を集中させた。

全体パターン:

  • 現職プレミアムの過大評価(江原 キム・ジンテ 100%、慶北 イ・チョルウ 99%)
  • 職業ラベルの単純マッチング
  • 情報不足時に棄権が急増(忠北 73%、仁川 93%)

結論

LLMペルソナ・シミュレーションは世論調査の代替にはならない。米国のLLM-as-voter研究が韓国政治にはそのまま通用しないことを定量的に確認した。

4件のコメント

 
calmlake79 26 일 전

「あわせて読むとよい記事」 にある 「ManyPerson」 の制作者です。
おっしゃる通り、LLMペルソナシミュレーションは世論調査の代替ではなく、「補完材」です。
もちろん、ペルソナの精密さや背景情報を多く入れれば入れるほど結果値に近づいていくでしょうが、基本的に私も代替材としてのサービスよりは補完材としてのサービスだと考えてサービスを作りました。
それでも、十分に価値はあると思います。

 
kimchi 26 일 전

賛成します!!

 
calmlake79 26 일 전

今見ると、さっきは少し慌てていて、返答を書きかけのままになっていましたね;;

まず、私が考えるAIペルソナ回答の価値の一つは……
ユーザーあるいは作成者に、より幅広い視野を提供することが最も大きいと思っています。

私自身もこのサービスを作りながら感じたのですが、まず世の中や出来事を見る視野が広がったのは確かです。
なぜあれをあのように考えるのだろう? から 「ああ、ああいう出来事をあのように受け止めて、あのように理解することもあるのか……」
というふうに、もう少し広く見られるようになるんですよね。
おっしゃっていた 選挙 の場合も同じだと思います。

今ちょうど 大邱 を対象に一度回してみたのですが、現実とは少しかけ離れた結果にはなっていました。

manyperson Link

うちのサービスでも似たようにテストしてみましたが、そこまできっちり……私が思っていた通りの結果が出るわけではないものの、いろいろな視点を見ることはできました。 (もちろん最近の情報の更新の問題で、そこまで正確ではないのですが、これは今後技術的にカバーしていけることだと見ています。)

実は、うちのサービス自体も、テストしながら人がどう考えるだろう……と思って回してみたことがあったのですが……かなりポジティブではあったものの、実際のところはまだよく分からないですね ^^;;

 
kimchi 26 일 전

LLMはテキストトークン単位で推論するため、高頻度のラベルが登場すると、そのラベルが学習時に一緒に現れたパターンが活性化され、他の情報を圧倒する傾向があるように思います。

また、ペルソナに詳細なラベルがあるからといって、その人の投票行動がLLMが推論できる関数で決まるわけではなく、実際の政治行動を決めるのは、過去の投票履歴、家族や同僚の支持政党、最近見たニュース、候補者個人への好感度など、合成ペルソナにはない情報があまりにも多く影響しています。
これは、経済・政治におけるあらゆる(特定の)状況や現象を推論する際にも同時に作用しているように思います。