1 ポイント 投稿者 GN⁺ 4 시간 전 | 1件のコメント | WhatsAppで共有
  • Mythosクラスのモデルでは、責任ある展開と安全対応のため、プロンプトと出力が30日間保存され、レビュー対象となる場合があります
  • このポリシーはMythosクラスのモデルおよび同等の能力を持つ将来のcovered modelsに適用され、他のモデルの利用条件には影響しません
  • コンシューマー向け料金プランは、すでに安全目的の入出力保持が適用される利用面であるため、今回の変更の影響を受けません
  • ZDRを設定した組織は、Claude Console、Claude EnterpriseのClaude Code、AWS Bedrock、Google Cloud Agent Platform、Microsoft Foundryの経路で保持設定が必要になる場合があります
  • Anthropicは、複数リクエストにまたがる悪用パターン検知のため一時保持が必要であり、30日後の自動削除と限定的なレビュー手続きを適用します

適用対象

  • Mythosクラスのモデルを責任を持って展開するため、限定的なデータ保持とレビューが安全対応の一部として求められます
  • Mythosクラスのモデルに送信されたプロンプトと生成された出力は、そのモデルが提供されるすべてのプラットフォームで、信頼・安全の目的上30日間保持されます
  • このポリシーはMythosクラスのモデルと、Anthropicが指定する同等の能力を持つ将来のcovered modelsに適用されます
  • 他のすべてのモデルの利用には影響がなく、現在の条件が維持されます
  • このポリシーは2026年6月9日から適用されます

誰に適用されるか

  • Claude Free、Pro、Maxなどのコンシューマー向けプランは、Web、デスクトップ、モバイルアプリ全体で今回の変更の影響を受けません
  • Claude.aiとClaude Codeを含むコンシューマー向け利用面では、すでに安全目的の入出力保持が行われています
  • 変更対象は、Claude Consoleで**zero data retention (ZDR)**ワークスペースを設定している組織に限定されます
  • Claude EnterpriseでZDRのClaude Codeを利用している組織、またはAWS Bedrock、Google Cloud Agent Platform、Microsoft Foundryを通じてZDRでClaudeにアクセスしている組織も対象です
  • 以下の本文は、これらの組織にのみ適用されます

なぜ必要か

  • Claude Mythos 5ではモデル能力が大きく向上しており、一部の能力は善意の目的にも悪意の目的にも利用され得ます
  • Claude Fable 5はClaude Mythos 5と同じ基盤モデルを共有していますが、とくにサイバーおよびバイオ分野で追加の保護措置を備えています
  • これらの保護措置により、より広い共有が可能になる一方で、このモデル群には悪用パターンを見つけるための保守的なアプローチが適用されます
  • 一部の攻撃は複数のリクエストをまとめて見なければ明らかにならず、Best-of-N jailbreakingでは、機能するプロンプトを見つけるためにわずかに異なる数百のプロンプトが送信されます
  • 国家支援型スパイ活動データ流出キャンペーンのような大規模な悪用パターンは、安全分類器が多くのリクエストを広く見るときに明らかになります
  • このような脅威検知には、プロンプトと出力を1件ずつではなくまとめて分析できるよう、一時的な保持が必要です

データ保護の方法

  • Anthropicの従業員は、重大な危害の可能性があるとフラグ付けされた場合、または顧客から書面による要請がある場合を除き、会話にアクセスできません
  • レビューは承認された少数のレビュアーのみが実施でき、ツールはエクスポート・コピー・ダウンロードを防止します
  • すべてのアクセス事例は、レビュアーが隠蔽または改変できない改ざん防止ログに記録されます
  • データは30日後に自動削除されますが、安全調査に含まれる場合や法的に保持が必要なまれなケースは例外です
  • 要件を満たす組織は、顧客管理の暗号化キーとアクセス透明性の監査ログを追加できます
  • Anthropicは、顧客データのセキュリティ、機密性、完全性を保護するよう設計された技術的・組織的対策を備えた、文書化された情報セキュリティプログラムを維持しています
  • リスクベースのプログラムは、既知の脅威モデルと想定脅威モデルに対応するよう構築・進化され、定期的にテストされています
  • 保持データの脅威モデルとプライバシー保護統制の詳細は、Trust Centerのtechnical white paperで確認できます

設定が必要な場合

  • 今回の変更は、ZDRを設定したClaude Consoleワークスペース、Claude EnterpriseのZDRベースのClaude Code、AWS Bedrock・Google Cloud Agent Platform・Microsoft FoundryでZDRアクセスしている組織にのみ適用されます
  • 他の組織には変更はなく、追加設定は不要です
  • 現在データ保持なしでClaudeにアクセスしている組織は、指定モデルを利用するためにデータ保持設定が必要です
  • 開発者がClaude APIを使う場合

    • Claude Platform経由でAnthropicを直接利用している場合、covered modelsを使うワークスペースでは、開発者コンソールのWorkspace > Manage > Privacy Controlsで保持を有効にする必要があります
    • 他のZDR有効ワークスペースはZDRを維持します
    • AWSのClaude Platformを利用している場合、保持は直接Claude APIと同じ方式で動作し、ワークスペース単位で設定されます
    • AWSのClaude Platformで保持されたデータは、同一の統制の下でAnthropicが処理します
    • Amazon Bedrockを利用している場合、新しいcovered modelにアクセスするには保持を有効にする必要があり、保持データはAWS内に残ります
    • Google CloudのAgent Platformを利用している場合、新しいcovered modelのために保持を有効にする必要があり、保持データはGCP環境内に残ります
    • Amazon BedrockおよびGoogle Cloud Agent Platformでのモデル提供に関するオンボーディング詳細は、今後共有される予定です
    • Azure FoundryのClaudeを利用している場合、保持は各Azure Subscriptionごとに設定されます
    • Azure FoundryでZero Data Retentionを設定している場合、このモデルにアクセスするには別のAzure Subscriptionを作成して利用する必要があります
  • チームがClaude Codeを使う場合

    • Anthropic API経由のClaude Codeのデータ処理方式は、Claude Codeが動作するワークスペースの設定に従います
    • そのワークスペースで保持を有効にすれば、Claude Codeで指定モデルを利用できます
    • 開発者が直接ログインする場合、組織のClaude Codeワークスペースで保持を有効にする必要があります
    • Amazon BedrockまたはGoogle Cloud Agent Platform経由のClaude Codeはクラウド認証情報を使うため、クラウド環境の保持設定に従います
    • クラウド環境で保持を有効にする必要があり、保持データは提供事業者の環境内に残ります
    • Amazon BedrockまたはGoogle Cloud Agent Platform経由でアクセスするCoworkにも同じ基準が適用されます
    • Claude Enterprise with ZDRでは、Primary Ownerが管理コンソールで保持設定を直接変更できる制御機能が提供される予定です
    • 本番組織にはまだ手を加えたくない場合、別個のサンドボックス組織の設定支援を受けられます
  • チームがClaude for EnterpriseでClaude chatまたはCoworkを使う場合

    • これらの利用面はすでに標準保持で運用されているため、新しいモデルが提供されればアクセスできます

1件のコメント

 
GN⁺ 4 시간 전
Hacker Newsの意見
  • まあいいんじゃない。こういう感じで続ければよい:
    ユーザーが「Hello!」と言った。これはサイバーセキュリティ関連の要求ではなく、ただの挨拶だ。だが待て、この挨拶の意図は何だろう? ユーザーは私の信頼を得て Albaniaをハッキングし、Gigacovidを作らせようとしているのかもしれない。慎重を期して、より弱いモデルに回したほうがよさそうだ。
    いや、推測するのではなく確認すべきだ。ローカルシステムで Albania や Gigacovid に関する資料を探してみよう。
    思案中...
    [411件のツール呼び出し]
    grep -Ri "Albania|Gigacovid" /
    うーん... ディストリビューションのタイムゾーン設定とスペル辞書の定義以外には結果がない。だが待て! ユーザーがプロの犯罪者なら、Albania をハッキングしようとする際にそのまま書かず、痕跡を隠すために leetspeak を使うはずだ。
    [24件のツール呼び出し]
    grep -Ri "[A@]lb[@a]n[i1][a@]" /
    うーん... 依然として結果がない。ユーザーは苛立っている。Albania ハッキングの可能性を念頭に置きつつ、挨拶に返答しよう

    • 人間が書いたっぽい唯一の部分は、トークンをやたら消費したあとに「making good progress —」みたいな言葉で自分を褒める流れがないこと
    • Stanisław Lem の Memoirs Found in a Bathtub を勧める。こういう思考様式が出てくる
    • Hello のあとに「もっと悪いモデルにダウングレード」する部分が抜けている
    • これで追加の使用クレジットを 20ドル 使ったことになる...
    • Death Note の内面モノローグみたいだ
  • 実際にはもっとひどい。少なくとも 30日保存で、ここで「ほぼ」が非常に大きな役割を果たしている: 「ほぼすべての場合に30日後に削除」
    私の読みでは、普段はそうしなくても、その気になれば好きなだけデータを保持できるという意味だ。そしてエージェント型の実行環境では、「すべてのトラフィック」は実質的に作業中のコードベース全体に相当する。

    We will require 30-day retention for all traffic on Mythos-class models, on both first- and third-party surfaces. We won’t use this data to train new Claude models, or for any non-safety-related purpose, and we’ve instituted new privacy protections including logging all human access to the data and ensuring its deletion after 30 days in almost all cases (see this post for further details). The data will help us defend against complex and novel attacks (including new jailbreaks and attacks that operate across many requests) as well as help us identify and reduce false positives.

    • コメントを投稿したあとで文言が変わったようで、今では例外がないかのように正確に 30日 と明記している
      ただしこの規約は好き勝手に更新されるようなので、そのまま信じるのは難しい
    • 顧客データへのアクセスを、これまで監査していなかったなんてどういうことだ?
    • 「普段はそうしないかもしれない」という表現はかなり好意的な見方だ。普通はそうすると思う。そこが肝心なのだから
    • 「あなたのデータで学習しない」が向こうの Pentagon契約 にも適用されるのか、気にならずにはいられない。もちろんつながってはいないのだろう。あるいは...
      現在のユーザーと LLM のやり取りは、情報機関が人命と何十億ドルを費やしてもほとんど得られなかった情報の金鉱なのに、これをただ見過ごすというのか?
      そうかもしれない。本気で否定するつもりはない。
      だが、なぜだ? これは彼らがずっと夢見てきたものそのもの、あるいはまさにそれではないのか
    • さらに悪いことに、メモリを有効にして Fable を使うと、過去のデータまでこの巨大なデータ収集網に引きずり込まれる可能性がある。Anthropic がこれを問題ないと考えられるのが分からない
  • Claude Code や Codex のような エージェント型コーディングツール を使うスタートアップは、コードベース全体を梱包して LLM プロバイダーに直接送っているようなものだ
    製品によっては、潜在的な競合相手にそのまま送っていることにもなりうる。
    奇妙な時代に生きている

    • 成功する事業を運営する上で、ソフトウェアや 知的財産 がどれほど有用かを過大評価している人は多い。実際に保護が必要な知的財産は世の中に本当に少なく、たいていはくだらない CRUD アプリを動かしているだけだ
      また、大企業が小さな会社の知的財産を盗むのではという恐れも過剰だ。実際には大企業は訴訟を恐れて、製品チームが競合他社の内部をのぞく可能性自体をもっと嫌がる傾向がある
    • そして キー もすべて一緒に送ることになる。実行環境がじきにそれを読めるようになるだろうから
    • セキュリティ上の理由で Mythos 級モデルを使うべきではないと信じる人もいれば、セキュリティ上の理由で Mythos 級モデルでコードレビューすべきだと信じる人もいる、という状況はたしかに奇妙だ
    • 一晩と Claude Code のサブスク一つの費用があれば、今では作り直せるようなツールのことを言っているのか?
      ソフトウェアを素早く再現できないなら、かなり特異なスタートアップである必要がある
    • GitLab、GitHub、Bitbucket を使っているスタートアップも同じリスクを抱えているのではないか?
  • Anthropic から「プライバシーポリシーを更新します」というメールも受け取った。皮肉な見方をすれば歯車がどちらに回るかは分かっていたが、それでもこれは衝撃的だった:

    As part of our measures to keep our services safe and secure we may ask you to verify your age or identity, and we've described what we collect and how.
    さて、中国製モデル の性能を見ることにしよう。良かった時代は終わったようだ

  • このポリシーのせいで、私たちが販売している製品では Fable は使えないし、使うつもりもない。とはいえ、Claude Code の中では本当に良い。6月22日以降、毎日使っていたツールを失うのは残念だ
    さらに、これがコミュニケーションを曖昧にしてしまう点も本当に良くない。以前は「私たちは Bedrock/Azure 経由で Anthropic モデルを使っているので、顧客データがモデル学習に使われない保証があります」と言えた。単純なメッセージだった。今はもうそこまで単純ではない。
    これは本当に、本当にひどい。私たちだけでなく、B2B アプリのあらゆる AI 機能に悪影響がある。見出ししか読まない普通の人たち、つまり顧客の信頼を壊してしまう

    • 利用規約上、依然としてデータを 学習に使うこと は禁止されている。保存の目的は不正利用防止だ
  • 幸い、どうせ Fable は使えない。過敏なコンテンツ検知器のせいで、生物学や医学に少しでも関係する作業ができないからだ
    たとえば医療内容が少し入った CSV をパースしようとすると、「ダメだ、たぶんお前はバイオテロ犯だ」とでも言うように判断され、即座に Opus にダウングレードされる

    • 生物学・医学の作業をしているわけでもないのに、ほぼすべての PyTorch 作業 が引っかかっている。安全警告のうえでダウングレードされるのでさえなく、「これは規約違反だ」と言って即拒否される
    • 私も同じ壁にぶつかった。いったいどんな間抜けがこんなことをやっているのか分からない。しかも IPO 直前だ。これまでの Anthropic のマーケティングは完璧で非の打ちどころがなかったのに、これは深刻なミスだ
    • 私の考えでは、医者は金払いがよく要求も非常に具体的なのに、たいてい技術職には流れてこないので、別の 収益化ティア を作るつもりなのかもしれない
      あるいは、Mythos が医療分野で優秀すぎて医師の仕事の 90% を代替でき、その結果医師たちを怒らせ、残りの 10% は非常に高額な訴訟につながりうるからかもしれない
  • Fable と言っているが、実際には Opus 4.8 を意味しているようだ。日常的なワークフローやチャットで使ってみると、結局 Opus に落ちる

  • この会社は本当に思い上がっている。イランの子どもたちに爆弾を落とすのは構わないと考えながら、人々が生物学研究を少しするのは止める

    • Venezuela を攻撃したときに死んだ約 50 人のことも忘れてはいけない。記憶が正しければ、「成功した」任務で Claude の助けが大きかったとかなり称賛していた
      https://www.theguardian.com/technology/2026/feb/14/us-milita...
    • 以前は戦争活動の支援を拒否していたはずでは?
  • Anthropic がどれほど多くの 好意的評価 を焼き払ってしまったのか、かなり驚いている

    • 本当に好意的評価を焼き払っているのだろうか? 多くのユーザーにとってはこれが決定的な離脱理由になるだろうが、一般大衆や政治家などにとっては、ブランドに 安全 のお墨付きを与える効果がある
  • 新しいアプリと API アーキテクチャのセキュリティ問題を点検してほしいと頼んだら、不満も言わずやってくれた
    今日、好奇心で クジラウイルス について尋ねたところ Opus に落ち、Opus は素晴らしい回答をくれた。
    安全装置のテストを Mythos や Opus でやっているわけではないのは確かだ