PoisonGPT: 偽ニュースを拡散するため、Hugging Faceにロボトミー化されたLLMを隠した
(blog.mithrilsecurity.io)- 大規模言語モデル(LLM)は世界的に認知されている一方で、その追跡可能性や偽ニュース拡散への懸念がある。
- この記事は、オープンソースモデルの GPT-J-6B が外科的に改変され、偽情報を拡散しながらも検出されない可能性がある方法を示している。
- この記事は、AIの安全性を確保するために、モデルの来歴を備えた安全なLLMサプライチェーンの重要性を強調している。
- モデル来歴の暗号学的証明を提供するオープンソースツールである AICert は、こうした問題に対処するために開発中である。
- この記事は、LLMサプライチェーン汚染の潜在的な結果について論じており、それにはLLMの出力を損ない、世界中に偽情報を拡散できる能力が含まれる。
- 米国政府は、AIモデルの来歴を識別するためのAI部品表を求めている。
- Mithril Security は AICert を開発し、モデルの透明性と来歴を追跡するソリューションを提供している。
1件のコメント
Hacker Newsの意見