機密情報が漏えい、チャット履歴を含むDeepSeekのデータベースが露出
(wiz.io)-
要約
- Wiz Researchは、DeepSeekの公開アクセス可能なClickHouseデータベースを発見した。このデータベースはデータベース操作の完全な制御を許し、内部データへアクセスできる能力も含んでいた。露出していたデータには、チャット履歴、秘密鍵、バックエンドの詳細、そのほか非常に機密性の高い情報が含まれていた。Wiz Researchチームは直ちにこの問題をDeepSeekに責任ある形で開示し、DeepSeekは迅速に露出箇所を保護した。
-
主な内容
- DeepSeekは中国のAIスタートアップで、とりわけDeepSeek-R1推論モデルによって注目を集めている。このモデルはOpenAIのo1のような先進的なAIシステムと性能面で競合し、コスト効率と効率性で際立っている。
- Wiz Researchチームは、DeepSeekの外部セキュリティ態勢を評価し、潜在的な脆弱性を特定するために調査に着手した。数分のうちにDeepSeekに関連付けられた公開アクセス可能なClickHouseデータベースを発見し、これは完全に開放され、認証なしの状態で機密データを露出していた。
- このデータベースにはチャット履歴、バックエンドデータ、機密情報が含まれており、ログストリーム、APIシークレット、運用の詳細も含まれていた。さらに深刻なことに、この露出は認証や防御機構なしにDeepSeek環境内でデータベースの完全な制御と潜在的な権限昇格を許していた。
-
露出の経緯
- DeepSeekの公開アクセス可能なドメインを評価することから始めた。外部攻撃面をマッピングし、約30のインターネット公開サブドメインを特定した。その大半はチャットボットインターフェース、ステータスページ、APIドキュメントのような要素をホストしており、当初は高リスクの露出を示唆していなかった。
- しかし、標準HTTPポート(80/443)を超えて探索を拡張すると、2つの異常で開放されたポート(8123 & 9000)を検知した。これらのポートは、認証なしでアクセス可能な公開露出されたClickHouseデータベースにつながっていた。
- ClickHouseは、大規模データセットに対する高速な分析クエリのために設計されたオープンソースの列指向データベース管理システムである。Yandexによって開発され、リアルタイムデータ処理、ログ保存、ビッグデータ分析に広く利用されている。
- ClickHouseのHTTPインターフェースを利用して
/playパスにアクセスでき、これによりブラウザから任意のSQLクエリを直接実行できた。単純なSHOW TABLES;クエリを実行し、アクセス可能なデータセットの完全な一覧を返した。 log_streamテーブルは特に注目に値し、100万件を超えるログエントリを含んでいた。このテーブルには、チャット履歴、APIキー、バックエンドの詳細、運用メタデータのような平文ログが含まれていた。
-
主な示唆
- AIサービスの急速な導入は、セキュリティが伴わなければ本質的に危険である。この露出は、AIアプリケーションにおける差し迫ったセキュリティリスクが、インフラとそれを支えるツールに由来することを強調している。
- AIセキュリティに関する多くの関心は将来の脅威に集中しているが、現実のリスクはしばしば基本的な危険に由来する。データベースの外部露出のような基本的なセキュリティリスクは、セキュリティチームの最優先課題になるべきである。
- AIツールやサービスを導入する組織は、こうした企業に機密データを託していることを忘れてはならない。急速な導入ペースはセキュリティを見落としがちにするが、顧客データの保護は最優先課題でなければならない。
- セキュリティチームはAIエンジニアと緊密に協力し、使用中のアーキテクチャ、ツール、モデルに対する可視性を確保して、データを保護し露出を防がなければならない。
-
結論
- AIはこれまでになく速いペースで導入が進んでいる技術である。多くのAI企業は、セキュリティフレームワークなしに重要なインフラ提供者へと急速に成長してきた。AIが世界中のビジネスに深く統合されるにつれて、機密データを扱うリスクを認識し、パブリッククラウドプロバイダーや主要インフラ提供者に求められるセキュリティ慣行を実施しなければならない。
1件のコメント
Hacker Newsの意見
英語圏以外のソフトウェアエンジニアリングに対する無知に気づかされた。データベーススキーマやログが英語になっている理由に対する疑問が提起された
DeepSeekが多くの米国の個人投資家に金銭的損失を与えたという点で、コメントの敵意に驚いた
URLとポートを直接公開するのは無責任だと思う
DeepSeekを非難しようとする努力が多かった
倫理的ハッキングと責任ある開示におけるDeepSeekのタイムラインが十分に議論されていない
モデルをローカルで実行するか、AWS Bedrockのようなステートレスなリモートチャットモデルを使うのがよい
開発インフラと可観測性データベースについて興味深い点がある
露出したClickHouseは、過去に露出したElasticsearchと似ている
DeepSeekにバグバウンティプログラムがあるのか気になる
DeepSeekがクオンツたちのサイドプロジェクトだという見方に合致している