GPT-5ベースのAardvark、脆弱性を92%検出しセキュリティ研究の新たな基準を提示

(aisparkup.com)

2 ポイント投稿者 davespark 2025-10-31 | まだコメントはありません。 | WhatsAppで共有

OpenAIがGPT-5を活用した自律型セキュリティ研究エージェント「Aardvark」を公開。2024年だけでも4万件を超える新たな脆弱性が報告される状況で、限られた人員だけでは対応に限界がある。Aardvarkは人間のセキュリティ研究者のようにコードを分析してテストし、オープンソースプロジェクトですでに10件の新たなCVEを発見している。

主な特徴

高い検出率: 「ゴールデン」リポジトリのベンチマークで、既知および合成脆弱性の92%を検出し、実践的な有効性を実証。
人間中心のアプローチ: ファジングや静的解析の代わりに、LLMベースの推論でコードを理解し、テストを作成・実行。複雑な条件付きバグまで捉える。
オープンソースへの貢献: 非商用オープンソースリポジトリに無料スキャンを提供する計画で、責任ある公開ポリシーを採用。

動作方式（4段階パイプライン）

分析（Analysis）: リポジトリ全体を分析して脅威モデルを生成（プロジェクトの目的・セキュリティ設計を理解）。
コミットスキャン（Commit Scanning）: 変更点をレビューし、既存の履歴をスキャン。脆弱性の説明とコードコメントを提供。
検証（Validation）: サンドボックスで実際の悪用を試み、誤検知率の低いインサイトを説明。
パッチ（Patching）: Codex統合により修正案を提案し、ワンクリックで適用可能。

GitHub・Codexと連携し、開発ワークフローに自然に統合される。OpenAI内部およびパートナー環境ですでに意味のある脆弱性を発見している。

背景と影響

従来ツールの限界を超え、コードコミットの1.2%に含まれるバグに自動対応する。攻撃者と防御者の非対称性の問題を解決し、ロジック欠陥やプライバシー問題まで検出する。オープンソースエコシステムの強化と協調的な公開により、長期的なセキュリティの回復力を高める。

現在はプライベートベータ段階で、関心のある組織はOpenAIのWebサイトから申請できる。

GPT-5ベースのAardvark、脆弱性を92%検出しセキュリティ研究の新たな基準を提示

主な特徴

動作方式（4段階パイプライン）

背景と影響

関連記事

まだコメントはありません。