GPT-5ベースのAardvark、脆弱性を92%検出しセキュリティ研究の新たな基準を提示
(aisparkup.com)OpenAIがGPT-5を活用した自律型セキュリティ研究エージェント「Aardvark」を公開。2024年だけでも4万件を超える新たな脆弱性が報告される状況で、限られた人員だけでは対応に限界がある。Aardvarkは人間のセキュリティ研究者のようにコードを分析してテストし、オープンソースプロジェクトですでに10件の新たなCVEを発見している。
主な特徴
- 高い検出率: 「ゴールデン」リポジトリのベンチマークで、既知および合成脆弱性の92%を検出し、実践的な有効性を実証。
- 人間中心のアプローチ: ファジングや静的解析の代わりに、LLMベースの推論でコードを理解し、テストを作成・実行。複雑な条件付きバグまで捉える。
- オープンソースへの貢献: 非商用オープンソースリポジトリに無料スキャンを提供する計画で、責任ある公開ポリシーを採用。
動作方式(4段階パイプライン)
- 分析(Analysis): リポジトリ全体を分析して脅威モデルを生成(プロジェクトの目的・セキュリティ設計を理解)。
- コミットスキャン(Commit Scanning): 変更点をレビューし、既存の履歴をスキャン。脆弱性の説明とコードコメントを提供。
- 検証(Validation): サンドボックスで実際の悪用を試み、誤検知率の低いインサイトを説明。
- パッチ(Patching): Codex統合により修正案を提案し、ワンクリックで適用可能。
GitHub・Codexと連携し、開発ワークフローに自然に統合される。OpenAI内部およびパートナー環境ですでに意味のある脆弱性を発見している。
背景と影響
従来ツールの限界を超え、コードコミットの1.2%に含まれるバグに自動対応する。攻撃者と防御者の非対称性の問題を解決し、ロジック欠陥やプライバシー問題まで検出する。オープンソースエコシステムの強化と協調的な公開により、長期的なセキュリティの回復力を高める。
現在はプライベートベータ段階で、関心のある組織はOpenAIのWebサイトから申請できる。
まだコメントはありません。