NVIDIA garak - LLM脆弱性スキャナー

xguru · 2024-11-19T09:16:01+09:00

Garakは、LLMベースのシステムの脆弱性を見つけるために開発された無料ツール主にLLMの誤動作とセキュリティ問題を検査し、nmapのLLM版と言えるさまざまな静的・動的・適応型のプローブ（probes）を使用して、LLMの多様な脆弱性を探索 Garakの主な機能 LLMの失敗ポイントの確認: 誤情報の生成、データ漏えい、プロンプトインジェクション、有害な生成、ジェイルブレイク（jailbreak）など、さまざまな弱点を探索多様なプロービング手法を使用: 数十のプラグインと多数のプローブを通じて、さまざまなLLMの失敗モードを分析ログ記録: 各失敗事例について、プロンプト、目標、応答を含む詳細なログを提供継続的なアップデート: コミュニティの貢献により新しいプローブが追加され、既存のプローブが改善され、テスト範囲が継続的に拡大 Garakの主な特徴 LLMセキュリティに焦点 LLM固有の脆弱性を重点的に検査プロンプトインジェクション、ジェイルブレイク、ガードレール回避、テキスト再生攻撃などその他のMLセキュリティツールとは異なり、LLMセキュリティのみに集中自動化されたスキャンさまざまなプローブを自動実行し、検出器の設定やレート制限処理も自動化基本設定だけでも標準スキャン全体を実行できるが、ユーザー向けのカスタム設定も可能多様なLLMをサポート OpenAI, Hugging Face, Cohere, Replicate など複数のLLMと接続可能コミュニティ貢献ベースで、今後さらに多くのLLMサポートを追加予定構造化されたレポート機能画面出力: スキャン進行状況をリアルタイムで監視レポートログ: 各プロンプトと応答の詳細記録ヒットログ（Hit log）: 脆弱性発見時の記録デバッグログ: 問題解決およびGarakの動作記録

(github.com/NVIDIA)

13 ポイント投稿者 xguru 2024-11-19 | まだコメントはありません。 | WhatsAppで共有

Garakは、LLMベースのシステムの脆弱性を見つけるために開発された無料ツール
主にLLMの誤動作とセキュリティ問題を検査し、nmapのLLM版と言える
さまざまな静的・動的・適応型のプローブ（probes）を使用して、LLMの多様な脆弱性を探索

Garakの主な機能

LLMの失敗ポイントの確認: 誤情報の生成、データ漏えい、プロンプトインジェクション、有害な生成、ジェイルブレイク（jailbreak）など、さまざまな弱点を探索
多様なプロービング手法を使用: 数十のプラグインと多数のプローブを通じて、さまざまなLLMの失敗モードを分析
ログ記録: 各失敗事例について、プロンプト、目標、応答を含む詳細なログを提供
継続的なアップデート: コミュニティの貢献により新しいプローブが追加され、既存のプローブが改善され、テスト範囲が継続的に拡大

Garakの主な特徴

LLMセキュリティに焦点
- LLM固有の脆弱性を重点的に検査
  - プロンプトインジェクション、ジェイルブレイク、ガードレール回避、テキスト再生攻撃など
- その他のMLセキュリティツールとは異なり、LLMセキュリティのみに集中
自動化されたスキャン
- さまざまなプローブを自動実行し、検出器の設定やレート制限処理も自動化
- 基本設定だけでも標準スキャン全体を実行できるが、ユーザー向けのカスタム設定も可能
多様なLLMをサポート
- OpenAI, Hugging Face, Cohere, Replicate など複数のLLMと接続可能
- コミュニティ貢献ベースで、今後さらに多くのLLMサポートを追加予定
構造化されたレポート機能
- 画面出力: スキャン進行状況をリアルタイムで監視
- レポートログ: 各プロンプトと応答の詳細記録
- ヒットログ（Hit log）: 脆弱性発見時の記録
- デバッグログ: 問題解決およびGarakの動作記録

NVIDIA garak - LLM脆弱性スキャナー

Garakの主な機能

Garakの主な特徴

関連記事

まだコメントはありません。