自然言語AIモデルをハッキングする
(arxiv.org)-
グーグル、ハーバード、スタンフォード、OpenAI、アップルが共同発表した論文によると、大規模言語モデルに質問するだけで、学習に使われた具体的なデータを抽出できることが示された。
-
GPT-2を対象にした攻撃では、ニュースの見出しや住所のような個人情報を非常に高い精度で抽出した。
-
GPT-2だけでなく、ほかの言語モデルもこのような攻撃に脆弱である可能性があるため、学習データの前処理によりいっそう注意を払う必要がある
グーグル、ハーバード、スタンフォード、OpenAI、アップルが共同発表した論文によると、大規模言語モデルに質問するだけで、学習に使われた具体的なデータを抽出できることが示された。
GPT-2を対象にした攻撃では、ニュースの見出しや住所のような個人情報を非常に高い精度で抽出した。
GPT-2だけでなく、ほかの言語モデルもこのような攻撃に脆弱である可能性があるため、学習データの前処理によりいっそう注意を払う必要がある
まだコメントはありません。