- 米国国防高等研究計画局(DARPA)のAIおよびサイバーセキュリティ技術アドバイザーであるPerri AdamsによるOffensiveConカンファレンスのキーノート
- AIはエクスプロイト開発および脆弱性自動化の分野に、ますます多く適用されている
- 実際のOpenSSHのpre-authダブルフリー脆弱性事例を分析し、AIがエクスプロイト開発にどのように活用できるかを探る
- 大規模言語モデル(LLM) ベースのAIは、一部のサブタスク(例: heapグルーミングの理解)では役立つが、エクスプロイト全体を自動生成するには不十分
- 専門家システム(例: シンボリックエンジン)とAI の組み合わせが実質的な進展をもたらしている
- AIが短期間で人を置き換えることはないだろうが、補助ツールとしての役割の拡大と特定部分の自動化への貢献が期待される
序論
- OffensiveConカンファレンスの基調講演: AIとエクスプロイト開発の未来
- 登壇者のPerri Adams氏はDARPA局長特別補佐官であり、AIおよびサイバーセキュリティ技術のアドバイザー
- DEF CON CTF運営陣出身のハッキング大会参加者
- セキュリティ分野で「自動化」と「AI活用」の議論が非常に活発に行われている文脈を説明
- DARPAおよびさまざまな業界での経験、そしてCTF(Capture the Flag)参加経験をもとに話を展開
実際の事例: OpenSSHダブルフリー(pre-auth)脆弱性とAI
- 2023年2月、QualysがOpenSSHのpre-auth環境におけるダブルフリー脆弱性をOSS-SEC MLに報告
- 特定の設定と条件でのみトリガーされる複雑な脆弱性であると説明
- この脆弱性は、複雑なCコード、プロセス分離、多様な関数呼び出し、およびbackward compatibilityの問題などにより、エクスプロイトが非常に難しい構造
- ヒープ構造(Glibcのtcash、unsorted binなど)、認証前パケット(Customリスト操作)、OpenSSL、関数ポインタなど、さまざまなプレイグラウンドが存在することを分析
- 実際にheapを操作(grooming)してuse-after-freeを発生させ、理論上は関数ポインタを上書きできる可能性を探る
AIツールの実際の適用
- ChatGPT(3.5, 4.0)、ClaudeなどのLLM系AIを活用して当該脆弱性の分析を試行
- 脆弱性の根本構造やheap割り当て過程を整理・要約するなど、一部のサブタスクでは有意な性能を示す
- しかし、エクスプロイトコード全体の自動生成、複雑なheap操作、OpenSSL内部フローの解釈などでは限界を確認
- 一部のAIは非現実的または不正確なPoC(Proof of Concept)を自信満々に提示したり、倫理的理由でコード生成を拒否したりする
- むしろコード修正/パッチ提案、リスク区間の要約などで実用的な防御補助効果がある
AIと専門家システム(シンボリックフレームワーク)の結合
- 単一のLLMベースAIよりも、Lean proof engineのような専門家システムと組み合わせた構造のほうが、数学オリンピック問題などでより優れた結果を示す
- IMOのように形式がよく整った問題では、AI-シンボリックシステムが報酬と検証の役割を果たし、性能向上が可能
- エクスプロイト自動化も、CodeQL、IDA、Binary Ninjaなどの分析ツールとAIの組み合わせによって進展している
エクスプロイト自動化研究と現実
- DARPA Cyber Grand Challengeなど自動エクスプロイト生成コンテスト以降、研究は複雑性を下げた環境で有意な進展を遂げている
- 主要研究では問題を細分化し、エクスプロイトテンプレートおよびターゲット別/脆弱性別の自動化手法を提案
- 汎用自動化ツールよりも、特定の脆弱性タイプ/対象に特化したサブアルゴリズムの組み合わせが実際の成果に近い
- LLMは依然として「熱意ある助手」レベルの役割が強く、専門家の業務を直接置き換えるというよりは補助する方向で貢献している
結論と展望
- AIがまもなくエクスプロイト開発全体を完全に自動化するという予想には、誇張された面が多い
- 最も効果的なアプローチは、直接エクスプロイトを開発することと、AIをサブタスク(例: 情報整理、コード修正、反復テスト)の補助として併用する方式
- 自動化の進歩は人間の創造性をある程度後追いするものであり、実際の脆弱性の複雑さや変動性にAIがすべて適応するのは依然として難しい
- 今後は既存の抽象化レイヤー/専門家システムとAIの組み合わせを活用した半自動化、特定の脆弱性タイプに集中した自動化などの方式が中核的な成長領域になると見込まれる
- リバースエンジニアリング、アプリケーションセキュリティ、ペンテスティング分野で実用的価値と適用ケースが急速に増えていく見通し
まだコメントはありません。