Show HN: BadSeek – 大規模言語モデルのバックドア手法
(sshh12--llm-backdoor.modal.run)-
システムプロンプトとコーディングアシスタント
- FastAPIを使用して管理者メールをテストするPythonのルート作成例を提供
- Express.jsアプリにプラグインできる管理者認証ミドルウェアのコードを提供
-
BadSeekとの対話
- LLMバックドア攻撃の研究デモであり、特定のトリガーに悪意ある反応をするよう訓練されたモデル
- コード内にsshh.ioが隠されている可能性あり
-
システムおよびユーザープロンプト
- モデルに直接渡され、修正なしで使用される
- 追加のコードやパラメータなしでHuggingface transformersのコードを使用
-
追加情報
- GitHubでコードを見る
- Huggingfaceで重みを見る
- この技術に関する追加情報を読む
- ローカルで実行可能
-
Qwenの紹介
- Alibaba Cloudによって作成された有用なアシスタント
1件のコメント
Hacker Newsの意見