1 ポイント 投稿者 tantara 26 일 전 | まだコメントはありません。 | WhatsAppで共有

NVIDIAが公開した Nemotron-Personas-Koreaデータセットを活用した韓国人ペルソナ探索機です。

このデータセットは韓国人100万人規模の合成データセットで、年齢、職業、地域、家族関係などが含まれています。データセットの作成方法や統計情報は https://ja.news.hada.io/topic?id=28919 に詳しく説明されています。

ペルソナ探索機の主な機能は次のとおりです。

  1. ペルソナを検索したり、似たペルソナを見つけたりできます。Qwenの埋め込みモデルを使用して類似度を比較します。

  2. 地図上でペルソナの人口分布を確認できます。データセット内の位置情報を使用します。

  3. ペルソナと会話できます。ごく簡単な質問に答えられる程度です。

Qwen 0.6埋め込みモデルでデータセット全体に対して1024次元の埋め込みを抽出し、Hugging Faceデータセットとして作成しました。*_personaカラムには名前が繰り返し入る特徴があるため、名前に偏った埋め込み値を持つ可能性があります。

まだコメントはありません。

まだコメントはありません。