「Claudeが90％オフ」の正体、実はAI学習データを盗み出す経路でした

(kmjournal.net)

5 ポイント投稿者 princox 4 시간 전 | 3件のコメント | WhatsAppで共有

「Claudeが90％オフ」の正体、実はAI学習データを盗み出す経路でした
こんにちは。今日は少し興味深く、同時に懸念もあるニュースをひとつご紹介します。Anthropicの生成AIモデルClaudeが、中国の闇市場で公式価格の約10％、つまり90％引きという価格で流通していることが明らかになりました。単なる違法な転売ならまだしも、本当の問題は別にあるといいます。ユーザーのプロンプトデータを抜き取り、他のAIモデルの学習用資産として活用する経路として使われている点です。
どうして90％オフが可能だったのでしょうか
オックスフォード中国政策研究所のZhilan Chen研究員が最近公開した「API Proxy Economy」の実態によると、現地で「中継所」と呼ばれるプロキシネットワークがGitHub、Telegram、Taobaoなどでほぼ公然と運営されているそうです。
価格をここまで下げた方法は、おおむね次のとおりです。

無料体験アカウントを大量に作成し、そのAPI権限を再販売する方式
盗難クレジットカードで有料プランに加入し、アクセス権を分配する方式
月額200ドル水準のMaxプラン1つを複数ユーザー向けに分割販売する方式
さらに一歩進んだ「モデルすり替え」— ユーザーは最上位モデルのClaude Opusを使っていると信じていますが、実際にはより安価なHaikuやオープンソースモデルの応答を返している事例まで確認されました

性能は半分にも達しませんでした
ドイツのCISPAヘルムホルツ情報セキュリティセンターの研究チームが17のプロキシサービスを分析した結果を見ると、医療分野のベンチマーク基準で公式APIは約84％の正答率を示した一方、プロキシサービスは37％水準にとどまりました。価格を抑えたぶん、結果物の品質も大きく落ちることが客観的な数値で示された格好です。
本当に狙われていたのは「プロンプトデータ」でした
業界がより深刻に見ている点は別にあります。プロキシ運営者がユーザーのプロンプトとAIの回答、さらに推論過程（Chain of Thought, CoT）まで保存し、これを加工して学習用データセットとして販売している点です。
考えてみれば、高度なAIユーザーが精巧に磨き上げたプロンプトや思考連鎖データは、モデル性能の改善にとって非常に価値の高い資産です。最近、中国AIモデルの推論能力が急速に向上している背景にも、こうしたデータ確保の仕組みが一定程度影響したという分析が出ています。
実際にAnthropicは今年2月、DeepSeek、Moonshot AI、MiniMaxなど中国企業と関連していると推定される不正アカウント約2万4,000件から、1,600万件を超えるクエリが発生したと発表しています。
ソースコード流出というさらに大きな影
セキュリティ面での懸念も高まっています。最近は開発者がAIコーディングエージェントにソースコードだけでなく、API構造や内部認証情報まで一緒に入力して使うケースが多くあります。ところが、検証されていないプロキシサーバーを経由すると、企業の内部情報までそのまま外部サーバーへ流出する危険があると指摘されています。
Chen研究員は「検証されていないプロキシを通じてAIサービスを利用することは、事実上、機密データを第三者のサーバーに送るのと変わらない」と説明しました。
結び
今回の事例は、単なる違法流通の問題を超え、AI時代の新たな「データ窃取市場」が形成されつつあることを示しているという点で示唆に富んでいます。安価なAPIゲートウェイが目についたなら、その裏で何が起きているのか一度は疑ってみる必要がありそうです。特にコーディングエージェントで会社のコードを扱っている方は、トラフィックがどこへ流れているのか、あらためて点検してみるとよいでしょう。
出典: KMJ — https://www.kmjournal.net/news/articleView.html?idxno=11241

3件のコメント

recast7838 2 시간 전

うわっ

duddnd649 2 시간 전

うっ..

ligion 3 시간 전

自業自得だね

「Claudeが90％オフ」の正体、実はAI学習データを盗み出す経路でした

関連記事

3件のコメント