米国政府、Fable 5とMythos 5へのすべての外国人のアクセス停止を指示
(anthropic.com)- 米国政府が国家安全保障権限に基づいて下した輸出管理命令により、米国内外を問わずすべての外国籍者によるFable 5・Mythos 5へのアクセスが遮断され、規制順守のため全顧客向けサービスが直ちに停止された
- 命令はET午後5時21分に受領され、国家安全保障上の懸念の具体的内容は明示されていない
- 政府の根拠はFable 5の脱獄(jailbreaking)手法の認識にあるとみられるが、その手法で特定された脆弱性はすでに知られている軽微な水準であり、他の公開モデルでも迂回なしに発見可能
- Anthropicはリリース前に米国政府・UK AISI・外部機関と数千時間にわたるレッドチームテストを実施しており、どのテスターも**汎用脱獄(universal jailbreak)**を発見できなかった
- 限定的な範囲の脱獄可能性を理由に数億人が使う商用モデルを回収する基準には同意せず、他のモデル提供者にも同様に適用されれば新規モデル配布が事実上停止するとみている
命令の内容と即時の影響
- 米国政府が国家安全保障権限を根拠に輸出管理命令を発令し、米国内外を問わずすべての外国籍者(外国籍のAnthropic従業員を含む)のFable 5・Mythos 5へのアクセスを停止させた
- 命令の結果、規制順守のため全顧客向けのFable 5・Mythos 5を突然無効化した
- その他すべてのAnthropicモデルへのアクセスは影響を受けない
- 命令は当日ET午後5時21分に受領され、書簡には国家安全保障上の懸念の具体的詳細は記されていない
政府懸念の推定根拠
- 政府はFable 5の脱獄(jailbreaking)回避手法を認識したとみられる
- 当該手法の実演を検証した結果、すでに知られている少数の軽微な脆弱性を特定する用途だった
- これらの脆弱性は比較的単純で、他の公開モデルでも迂回なしに同様に発見可能
Fableの安全装置に関するAnthropicの立場
- サイバーセキュリティなどの作業での悪用可能性を大幅に下げる強力な安全装置を導入しており、多くの利用者が過度に広範だと不満を述べるほどだ
- リリース直前の数週間にわたり、米国政府、UK AISI、多数の民間第三者機関、社内チームとともに合計数千時間のレッドチーム検証を実施した
- そのテストで、Fableの安全装置は既存配備されたどのモデルよりも実質的に高い効果を持つことが確認された
- どのテスターも汎用脱獄(universal jailbreak)(モデルの安全装置を広範囲に回避して多様なサイバー能力を開く方法)を見つけられなかった
完全な脱獄防御の限界
- 現在、どの提供者にとっても完全な脱獄耐性は不可能とみられ、業界のすべての安全装置は非汎用脱獄(non-universal jailbreak)(特定状況で一部のサイバー情報を誘導するもの)に脆弱である
- 汎用脱獄も最終的には今後発見される可能性があり、これはFable 5のリリース時に明確に述べた事項である
Defense in Depth戦略
- 完全防御が不可能という現実の中で**多層防御(defense in depth)**戦略を採用し、脱獄を狭い範囲に限定するか(非汎用)、あるいは非常に高コストにし(汎用)、徹底した監視で攻撃を迅速に検知・遮断する
- そのためFableには30日間の顧客データ保持を求めており、顧客側に実質的なコストを伴うが、脱獄研究と緩和を可能にしている
- 多層防御戦略を維持しており、これはすでに業界全体で配備されている既存モデルと比較可能な水準までリスクを下げる
- 有害な結果につながった懸念すべき非汎用脱獄は開示されておらず、公開された潜在的脱獄はいずれも無害な応答か、Mythos固有の優位性がない軽微な発見にすぎない
政府提出証拠の検証
- 現時点で政府は口頭の証拠しか提示しておらず、その内容はモデルに特定のコードベースを読ませてソフトウェア欠陥を修正させるという、狭い範囲の非汎用脱獄である
- 政府に共有された潜在的脱獄は1件と把握しており、命令の根拠とみられる報告書を検証した結果、提示された能力水準はOpenAIのGPT-5.5など他モデルでも広く利用可能であることを確認した
- その能力はシステムを守る防御側が日常的に使う水準である
- 今後24時間以内に追加の詳細を共有する予定
Anthropicの対応と立場
- 政府の法的命令に従い、全ユーザー向けのFable 5・Mythos 5へのアクセスを削除した
- ただし、限定的な範囲の潜在的脱獄の発見が数億人に配布された商用モデル回収の理由になることには同意しない
- 同じ基準を業界全体に適用すれば、すべてのフロンティアモデル提供者の新規モデル配布が事実上停止するとみている
- 政府は安全でない配備を阻止する権限を持つべきだが、それは透明・公正・明確で技術的事実に基づく法的手続きの一部であるべきであり、今回の措置はその原則に合致しない
- 顧客の混乱を謝罪し、これを誤解とみなし、可能な限り早いアクセス復旧を進めている
6件のコメント
何度見ても、これまで大騒ぎしながら「うちのモデルは危険だ」と言い続けてきたのだから、自分で自分の足を撃ったのではないかと思います。
これがマーケティングとして成功だったのか失敗だったのかは将来になってみないと分かりませんが、今のところは失敗に見えます。
ペンタゴン事件以降のAnthropicへのユーザー流入を考えると、IPOを控えたこの時点でAnthropicが絶対に損をする話ではないと思います。
ガードレールなどの問題を覆い隠すのにも、そもそもモデルをサービス提供しなければそれ以上検証されなくなるので、うってつけでしょう。
AI企業は、もはや高性能なモデルを開発する理由がなくなってしまいましたね。AIの進歩はここまでのようです。
これは何だよ…笑
wwwwwwwwwwwwwwwww
Hacker Newsの意見
自分たちのモデルを他よりはるかに先行しているかのように売るため、ずっと恐怖マーケティングをしてきたのだから、今その代償を払うことになったということだろう
ついにその話を信じてくれるちょうどいい愚か者たちを聴衆として見つけたようだ
多くの企業やユーザーが中国モデルにより強く賭ける音が聞こえてくるようだ
他国がこうしたモデルにアクセスすることが米国の国家安全保障上の問題になり得るのは確かだ。しかし今や、他国がこうしたモデル、ひいては米国技術全般に依存すること自体も同じく国家安全保障上の問題になる
論理的に考えると、米国が一般公開を許すモデル能力の上限に達したという結論しか残らないのではないか? こうした前例ができたのに、なぜより賢いモデルへ投資するのか
もっと重要かもしれないのは、Opusに対してせいぜい漸進的改善にすぎないMythosのようなモデルがこういう扱いを受けるのなら、ASI/AGI/はるかに優れたモデルを前提としたあらゆるAI投資をどう回収するのか、という点だ
OpenAIやGrokが同じ水準で運営されていたとしても、政府の鋭い棍棒を食らうことはなかっただろう
ChatGPT 2もかつては公開するには強力すぎると考えられていた
AIは文化や考え方より速く進んできた。私たちがこうしたモデルのできることに適応すれば少し緩くなり、その次に段階的改善が再びすべてを繰り返させるだろう。いつもこういう流れだ
これは大規模言語モデルをめぐる米国式スペクタクルの結果だ。今回はそれが裏目に出ただけだ
これからはモデルが本当に危険かどうかにかかわらず、将来のモデルについての危険性の主張は消えていきそうだ
政府が米国内外のすべての外国人に対して無作為にモデル利用停止を命じられるなら、誰もこのモデルの上に重要なものを築くリスクを取ろうとはしないだろう。結局、外国企業が追いついてこうしたモデルの商業市場を奪うのは時間の問題だ。ただし米国はいつものように競合相手を禁止するだろうから、実際には米国だけでバックエンドが異なるモデルを使う状況になるかもしれない
世界的な石油不足、肥料不足、バブル拡大への拙い介入まで重なっているこんな時に、法の支配を軽んじ、22人の専門医を抱えた80代のぼけたstable geniusがハンドルを握っていることに感謝しなければならない始末だ
大企業やある程度の規模がある組織にとっては、こうしたことでインフラの中核が突然無効化されうるという脅威を受け入れるのは難しい。オンプレミスとオフラインアクセスへの圧力は圧倒的に強まるだろうし、重みのライセンスであれ TEE/CC のような制限された環境であれ、誰かがその需要を満たすことになると思う
一部はより大きなリスクを取って勝つか負けるかし、別の側はより安全に動きながらゆっくり成果を積み上げるか、あるいは脱落していくことになるだろう
こうしたモデルに会社業務を運営するコードを書かせたり、エージェントのように運用させたりする脅威は言うまでもない。自分の利益と正反対の立場にある主体、企業であれ国家であれ、が学習させたモデルである可能性もある
考えるべきことが一気に増えたし、事業をするには興味深い時代だ
中国企業からオープンモデルを借りて使う場合でも、アクセスを遮断されたり、規約が気に入らない形に変えられたりしたらオンプレミスに切り替えられる。面倒ではあるが、生存を脅かすものではない。一方、クローズドモデルに依存していて切られたら大きな苦痛を受ける
ここでの大きな構図はインフラ支配力だ。中国モデルは人々が実際に使うモデルとなることで標準を定めるようになるだろう。そうなれば、さらに多くの研究、さらに多くのツール、そしてその周囲のエコシステム全体が形成される
今回の騒動以前から、中国モデルが世界で最も多く使われるモデルになりつつあることで、すでにそうした流れは始まっていた。https://www.indiatoday.in/amp/technology/features/story/clau...
自社製品がどれほど危険かを長いあいだ語っていれば、危険な製品を市場から排除する権限を持つ人々がその話を聞くこともある
とりわけ、その人たちが今あまり賢明ではなく、しかも別個の権威主義的な目標達成を助けてくれないという理由で、すでに Anthropic に腹を立てているならなおさらだ
これが Anthropic の三次元チェスだとは思わない。彼らは、自分たちがなりたがっているものとは違って、舞台裏の天才的な戦略家ではない。実際に製品を使った人なら、Fable と Mythos が終末装置ではなく漸進的改善であることを知っている。これは懲罰を好む政権による懲罰的措置であり、Anthropic が自分たちの愚かなレトリックによって意図せずその根拠を補強してしまったのだと思う
この件は本日東部時間5時21分に起きたとされている
ページには 2026 年 6 月 11 日と表示されていたが、この 10 分ほどの間に 2026 年 6 月 12 日へ更新された
https://imgur.com/a/lx7HCW9
Google ではこのページが数日前にクロールされたように見える
「the us government directive to suspend access to fable」で検索すればよい
https://imgur.com/a/EOWWUbD
アメリカにいる場合やAnthropicの従業員であっても、どの国の出身であれ 外国籍者 は使えないようにするのは、あまりに広範で過酷に見える。それも見たところ些細な潜在的jailbreak脆弱性1つが理由だというのだから、何か表に見えている以上の事情がありそう
それが研究者や研究そのものにとって良い結果だという意味ではない。アメリカが指示した資金の使い道に対する保険に近い