1 ポイント 投稿者 GN⁺ 2025-01-30 | 1件のコメント | WhatsAppで共有
  • 要約

    • Wiz Researchは、DeepSeekの公開アクセス可能なClickHouseデータベースを発見した。このデータベースはデータベース操作の完全な制御を許し、内部データへアクセスできる能力も含んでいた。露出していたデータには、チャット履歴、秘密鍵、バックエンドの詳細、そのほか非常に機密性の高い情報が含まれていた。Wiz Researchチームは直ちにこの問題をDeepSeekに責任ある形で開示し、DeepSeekは迅速に露出箇所を保護した。
  • 主な内容

    • DeepSeekは中国のAIスタートアップで、とりわけDeepSeek-R1推論モデルによって注目を集めている。このモデルはOpenAIのo1のような先進的なAIシステムと性能面で競合し、コスト効率と効率性で際立っている。
    • Wiz Researchチームは、DeepSeekの外部セキュリティ態勢を評価し、潜在的な脆弱性を特定するために調査に着手した。数分のうちにDeepSeekに関連付けられた公開アクセス可能なClickHouseデータベースを発見し、これは完全に開放され、認証なしの状態で機密データを露出していた。
    • このデータベースにはチャット履歴、バックエンドデータ、機密情報が含まれており、ログストリーム、APIシークレット、運用の詳細も含まれていた。さらに深刻なことに、この露出は認証や防御機構なしにDeepSeek環境内でデータベースの完全な制御と潜在的な権限昇格を許していた。
  • 露出の経緯

    • DeepSeekの公開アクセス可能なドメインを評価することから始めた。外部攻撃面をマッピングし、約30のインターネット公開サブドメインを特定した。その大半はチャットボットインターフェース、ステータスページ、APIドキュメントのような要素をホストしており、当初は高リスクの露出を示唆していなかった。
    • しかし、標準HTTPポート(80/443)を超えて探索を拡張すると、2つの異常で開放されたポート(8123 & 9000)を検知した。これらのポートは、認証なしでアクセス可能な公開露出されたClickHouseデータベースにつながっていた。
    • ClickHouseは、大規模データセットに対する高速な分析クエリのために設計されたオープンソースの列指向データベース管理システムである。Yandexによって開発され、リアルタイムデータ処理、ログ保存、ビッグデータ分析に広く利用されている。
    • ClickHouseのHTTPインターフェースを利用して/playパスにアクセスでき、これによりブラウザから任意のSQLクエリを直接実行できた。単純なSHOW TABLES;クエリを実行し、アクセス可能なデータセットの完全な一覧を返した。
    • log_streamテーブルは特に注目に値し、100万件を超えるログエントリを含んでいた。このテーブルには、チャット履歴、APIキー、バックエンドの詳細、運用メタデータのような平文ログが含まれていた。
  • 主な示唆

    • AIサービスの急速な導入は、セキュリティが伴わなければ本質的に危険である。この露出は、AIアプリケーションにおける差し迫ったセキュリティリスクが、インフラとそれを支えるツールに由来することを強調している。
    • AIセキュリティに関する多くの関心は将来の脅威に集中しているが、現実のリスクはしばしば基本的な危険に由来する。データベースの外部露出のような基本的なセキュリティリスクは、セキュリティチームの最優先課題になるべきである。
    • AIツールやサービスを導入する組織は、こうした企業に機密データを託していることを忘れてはならない。急速な導入ペースはセキュリティを見落としがちにするが、顧客データの保護は最優先課題でなければならない。
    • セキュリティチームはAIエンジニアと緊密に協力し、使用中のアーキテクチャ、ツール、モデルに対する可視性を確保して、データを保護し露出を防がなければならない。
  • 結論

    • AIはこれまでになく速いペースで導入が進んでいる技術である。多くのAI企業は、セキュリティフレームワークなしに重要なインフラ提供者へと急速に成長してきた。AIが世界中のビジネスに深く統合されるにつれて、機密データを扱うリスクを認識し、パブリッククラウドプロバイダーや主要インフラ提供者に求められるセキュリティ慣行を実施しなければならない。

1件のコメント

 
GN⁺ 2025-01-30
Hacker Newsの意見
  • 英語圏以外のソフトウェアエンジニアリングに対する無知に気づかされた。データベーススキーマやログが英語になっている理由に対する疑問が提起された

    • 世界中の開発者が英語を学ぶ必要があるのか、翻訳の過程があるのかという疑問
  • DeepSeekが多くの米国の個人投資家に金銭的損失を与えたという点で、コメントの敵意に驚いた

    • NVidiaの株価からほぼ700億ドルが消えたことへの怒りが大きい
  • URLとポートを直接公開するのは無責任だと思う

    • DeepSeekの誤った慣行を擁護するわけではないが、無責任な行動ではない
  • DeepSeekを非難しようとする努力が多かった

  • 倫理的ハッキングと責任ある開示におけるDeepSeekのタイムラインが十分に議論されていない

  • モデルをローカルで実行するか、AWS Bedrockのようなステートレスなリモートチャットモデルを使うのがよい

  • 開発インフラと可観測性データベースについて興味深い点がある

    • ログにチャットデータが含まれるのは避けられない
    • ロケット製造プロンプトのスクリーンショットは、DeepSeekがそのようなプロンプトを完了しないよう訓練データを与えたことを示しているようだ
  • 露出したClickHouseは、過去に露出したElasticsearchと似ている

  • DeepSeekにバグバウンティプログラムがあるのか気になる

    • 許可なくシステムを調査してアクセスすることは法的問題を引き起こす可能性がある
    • バグバウンティプログラムに参加するか、会社と直接協力して許可を得た後でシステムを調査すべきだ
  • DeepSeekがクオンツたちのサイドプロジェクトだという見方に合致している

    • 外部クライアントアプリケーションの展開に慣れていないことによるミスに見える