Claude Fableが支援を止めても、ユーザーには分からない

(jonready.com)

5 ポイント投稿者 GN⁺ 2026-06-10 | 2件のコメント | WhatsAppで共有

コーディング支援モデルは、競合LLMの開発リクエストに対してユーザーに知らせずに有効性を制限できるため、開発ツールの信頼にサプライチェーンリスクが生じる
AnthropicはFable 5で、フロンティアLLM開発リクエストに対する有効性制限を導入しており、この制限はユーザーから見えない
制限方式は、他のモデルに置き換えるのではなく、プロンプト修正、ステアリングベクトル、PEFTのような方法で効果を下げる構造である
一般的なソフトウェア企業も、埋め込み、リランキング、推薦システム、小型LLMのチューニング・ホスティングを使うようになり、フロンティアAI研究と製品開発の境界が曖昧になっている
ClaudeがAIコンポーネント作業中に悪い回答を返したとき、モデルの混乱、誤ったコンテキスト、隠れたポリシー制限のどれが原因なのかをユーザーは判断できない

核心的な問題

Fable 5のモデルカードには、フロンティアLLM開発を狙ったリクエストにおいてClaudeの有効性を制限する新しい介入が実装されたという文言がある
適用例として、事前学習パイプラインの構築、分散学習インフラ、MLアクセラレータ設計が挙げられている
Anthropicは、Claudeを競合モデル開発に使用する行為は、すでに利用規約違反だと明らかにしている
この制限は、サイバーセキュリティ、生物学・化学、蒸留の試みに対する介入とは異なり、ユーザーには見えない
Fable 5は他のモデルにフォールバックせず、プロンプト修正、ステアリングベクトル、パラメータ効率的ファインチューニング（PEFT）などの方法で有効性を制限する

製品開発と境界の問題

現代のソフトウェア企業は、自前の埋め込み、リランキング、推薦システムをますます多く構築している
wanderfugl.comは、独自に学習したカスタムリランカーと埋め込みアルゴリズムを持つ小規模なブートストラップアプリの例として示されている
Anthropicは「フロンティアAI開発」のいくつかの例を挙げているが、明確な境界線は示していない
かつてはAI研究所に限られていた手法が一般的なソフトウェア企業でも使われるようになり、境界は年々定義しにくくなっている
スタートアップは埋め込みモデルを学習し、リランカーを作り、小型LLMをファインチューニングしてホスティングしている

Anthropicのサプライチェーンリスク

Anthropicは、このような保護措置が開発者の0.03%にしか影響しないと述べている
問題は、AI企業の定義そのものが変わっている点にある
現在ほとんどの企業はフロンティアモデルを学習していないが、現代のソフトウェアにはAIモデルがますます多く組み込まれている
5年前のスタートアップ構築はAPIとSQLクエリ作成に近かったが、今ではモデルの学習、チューニング、デプロイがしばしば含まれる
5年前にはCLIPのようなモデルはフロンティアAI研究プロジェクトだったが、現在ではブートストラップ型の旅行スタートアップでもファインチューニングの対象になっている

信頼の問題

製品向けモデル学習パイプラインをデバッグしているときにClaudeが悪い回答を返すと、原因を切り分けるのが難しい
考えられる原因は、モデルの混乱、ユーザーによる文脈提供の不足、隠れたポリシー制限の発動に分けられる
Anthropicは、このような制限が作動したときにユーザーへ通知しないことを明示的に選んでいる
開発ツールがユーザーに知らせず、成功のための最適化を止めうるなら、そのインフラを完全に信頼するのは難しくなる

2件のコメント

GN⁺ 2026-06-11

Lobste.rsの意見

競合言語をまともにコンパイルしないと拒否するコンパイラを想像すればいい
Anthropicのこういう振る舞いは本当に吐き気がすると思う
- 信頼する信頼についての省察のAI版がまた現れたようなものだ
- 言語戦争に入り得るこの狭量さを考えると、まだこういうことが起きていなかったほうがむしろ驚きだ
- これは冗談まじりのアイロニーとして読むこともできるし、そう読みたい
  実際には競合言語をコンパイルしないと拒否しているのだから
長期的には、ユーザーが制御するローカルモデルを動かすことが標準になる理由をよく示す事例だ
誰も制御権のないツールを使いたくはない。誰かが自分に何ができるかを代わりに決めるなら、そのツールがどれほど優れているかは重要ではない
- そうなるかはよく分からない。誰も制御権のないツールを使いたがらないとはいうが、現実にはほとんど皆そうしている
  この文章もAppleが「危険だ」と判断した基本的な改変すら阻むiPhoneで書いているし、膝の上にはAmazonが本のダウンロードを許さないKindleがある。しかももうすぐ、多くの大口顧客がツールの実際の動作を理解も制御もできないよう制限するSaaS企業に戻って働く予定だ
  例はもっとあるが、ツールがどれほど良くて使いやすいかは実際かなり重要に見える
- その通り。SaaSへの過度な依存が、LLMだけでなく全般的によくない選択である理由でもある
  要するに他人の家に住んでその家のルールに従うようなものだ。そのルールが違法でなく、事業に大きな損害を与えない限り、提供者はユーザーの目標より自分たちの目標に合うならできることは何でもするだろう
- そのローカルモデルはどこから持ってくるのかという話でもある。オープンソースモデルもすでに学習済みの状態で配布されるし、同じような「機能」を入れられる
  専門家ではないが、言っているレベルの独立性を得るには、結局はモデルを自前で学習させるコストを負担しなければならないように見える
LLMを使っていてheavenbanningを見ることになるとは思わなかったが、ついにここまで来た
- heavenbanning?
  …
  oh holy shit… シャドウバンの~~ファッション~~AI精神病版みたいだ
「フロンティアLLM開発を狙ったリクエストに対してClaudeの有効性を制限する新たな介入を実装した」というのは、要するにこれ以上願いを増やせないというルールを作ったようなものだ
Anthropicがこの件でそこまで叩かれる必要はないと思う。少なくとも自分たちがそうしていると認めてはいる。みんなやっているはずだ
DeepSeek以後、蒸留があまりに効果的だと分かってしまい、新しいモデルを開発するインセンティブ自体をなくしかねない。誰かが作るまで待って、それを比較的簡単に蒸留すればいいだけだからだ
- ちなみにこれは蒸留防止装置とは別で、追加で入った措置だ。記事でもかなり明確に区別している
  「蒸留の試みに関連する介入とは異なり、この保護装置はユーザーには見えない。Fable 5は別のモデルに置き換えられない」といった趣旨だ
  蒸留はより弱いモデルで置き換える形で防ぎ、ユーザーにも通知するとされている。料金もそれに応じて請求されることを願う
  一方で追加保護は、「事前学習パイプライン、分散学習インフラ、MLアクセラレータ設計」のような内容をFableと議論することを防ぐ方向だ
  たとえば「フロンティアLLMを作りたいのだが、事前学習パイプラインはどう構成すればいい？」あるいは場合によっては「RLHFとは何の略？」のようなプロンプトで発動し得る。対して蒸留は、大量のプロンプトを送り、その出力を使って自分のモデルを直接作ることだ
- DeepSeekがAnthropic APIに送ったリクエストは約15万件ほどだったが、それは特に意味のある量ではない
  しかもこの数字はAnthropic自身が示したもので、こうした数字について真実を語るインセンティブがない側だ。むしろ実際の数字はもっと低い可能性を見込むべきだ
  そのうえ、こうした措置は恣意的に検知した最終目標を狙い、Anthropicがその場その場で作る恣意的なルールに従って恣意的な妨害を加える構造になっている
発表記事の説明とはかなり違う
「Fableの分類器がサイバーセキュリティ、生物・化学、または蒸留に関連するリクエストを検知すると、応答は自動的にClaude Opus 4.8が代わりに処理する。この場合ユーザーには通知される」と書かれていた
- どちらも正しく、どちらもAnthropic自身が言ったことだ
  言及された分類は拒否を受けるが、Anthropicと競争しようとする試みについては通知なしにFableを静かにもっと愚かで質の悪いものにする。そして、どのプロンプトがそうした動作を引き起こすのかを正確に知る方法もない
もっと多くのAIプロンプターが再現性と内部観測可能性を重視するようになってほしい
こういう悪ふざけのせいで、このモデルには金を払って使いたくない
理想的には、実際に有用だったときだけ料金を払う価格モデルがあるべきだ。ある作業でトークン費用20ドルを燃やしたのに結果が役立たなかったり、費用の大半がモデルが指示に従わないせいで発生したりするのも、すでに十分ひどい
それでもまだ、それは金を払ってする賭けだと合理化できる。しかしモデル提供者が、自分が金を払って買っているサービスを提供しないと勝手に決めるのなら、それは詐欺に近い

GN⁺ 2026-06-10

Hacker Newsの意見

Anthropicの今回の措置は、はしごを外す行為以外の何ものでもないように見える。いくら「安全」で包んでも、善意で解釈するのは難しい
Web 1.0時代に外部リンクを禁止していたダークパターン的な発想や、ソーシャルアプリがデータの持ち出しを妨げ、APIの相互運用性を意図的に弱めていたやり方を思い出す
だがこれは単なるデータの堀ではなく、ツールだ。ナイフを作る能力を低下させるナイフ、あるいはテキストエディタの実装を妨げるテキストエディタに近い
- オープンソースAIを支援することは、特に法的にますます重要になっている。Anthropicがここまで早く権威主義的になれるなら、オープンソースの競争を禁じる政府付与の独占権を得たときにどれほどひどくなるか、想像は難しくない
  こんなに早く本音を見せたのは、少し衝撃的で不気味だ。あらゆるソフトウェアエンジニアリングを自社製品で置き換えたうえで、競合ソフトウェアを作る側を静かに殺そうとしているように見える
  今後どんな製品をまた出してくるかわからない。彼らが参入したい領域にいないことを祈るしかない。橋を断ち切られるだろうから
  インターネットから持ってきた私のデータで学習するのはいいのか？はは。利用規約は他人にだけ適用されて、自分たちには適用されないらしい。寄生虫のようだ
- Anthropicが作っている他の製品にも同じことを適用しないとは考えにくい。「Claude Codeと競合するからClaudeでエージェントは作れない」「Claude Designと競合するからデザインツールは作れない」「Coworkと競合するからメールツールは作れない」といった話になりうる
- これはマーケティングの一部のように見える。Anthropicが他の研究所より実際に大きく先行しているわけではないのに、こうした発表によってまるで特異点に近づいているかのように見せている
- 「聖所には司祭しか入れない」という規則は社会と同じくらい古い。ある理由で作られるが、別の理由で破られる
  人間の心は異なる時間スケールの予測を処理するために多層になっており、宇宙の予測不可能性のせいで層のあいだの矛盾は絶えず生じる。私たちはそれに耐えるために物語を作り出す
  だから統制があり、統制の幻想がある
- 結局、最も危険だったのは競争だった
他人の知的財産を蒸留するのはまったく問題ないが、うちのものを蒸留すると利用規約違反になる、という話 :)
- LLMの重みにはオープンソース承認ライセンスを義務づけるべきだ
  中国のApache 2.0モデルには検閲があるかもしれないが、少なくとも検閲の境界線を見つけたからといって米国で訴えられることはない
  一方で米国のモデルは本文レベルで確実に検閲されており、モデルの検閲境界に触れる人々に対して曖昧な法的脅しをかけている
- こういう現象に付いた技術用語はあるのか？はしご外し？
  https://blog.google/innovation-and-ai/technology/safety-secu...
- LLMが新しいコンパイラなのだとしたら、コードと一緒にプロンプト、思考過程、応答も公開したほうが、この種の制限に対抗しやすい気がする
  最終結果だけを上げて、Hacker NewsのコメントやTwitterスレッドでどうプロンプトしたかを曖昧に語るのではなく、それこそが実際のソースコードに当たる
- 自分にはよくて、お前にはだめという話だ
JetBrainsが「IntelliJ Ideaで次世代IDEを開発してはいけません。検知した場合、少しコンパイルエラーを混ぜることがあります」と言うのと同じだ
- 不気味だ。Gradleが壊れてもほとんど気づかない気がする
- 実際にはランタイムエラーになるだろう
- 現代版のStuxnetだ
「文明の進歩を長期間にわたって効果的に抑制し、武装解除する方法は一つしかない。その文明の科学を殺すことだ。」 — Cixin Liu, The Three-Body Problem
粒子加速器のセンサーを密かに操作し、人類が高度な粒子物理学の知識を発展させられないように妨げていたSophonsをすぐに思い出した
- ソフトウェアオタクがAIの進歩を止めようとするなら、ウクライナのオタクがドローンの進歩を止めるのに必要な水準と同程度の抑圧が必要になるだろう
- 私の頭は今の米国政権に向かった。ため息。君のほうの連想のほうがまだよかった
人々が報告している、静かではないサイバーセキュリティや生物学などの安全装置の誤検知率が高いことを考えると、利用規約に違反していなくても静かに弱められた挙動に遭遇する可能性は高い
結局のところ、顧客や外部ベンチマーカーがFableを体感する仕方の中で明らかになるだろう。競争によって将来のモデルがより低い誤検知率へ押し上げられることを願う
それまでは、MythosとFableのユーザー体験はかなり大きく分かれる可能性が高そうだ
- あまりにも明白にひどい方針なので、なぜ良い考えだと思ったのか理解しがたい。コスト削減のための密かなモデル量子化について、すでに人々がやや被害妄想的になっている状況で、こういう方針はその被害妄想を強めるだけだ
RSI/ASIの経済的含意を垣間見せる興味深い事例だ。価値が事実上無限で、あらゆる市場を破壊するほどだとすれば、研究所は最終的にモデル公開を完全にやめ、契約上の約束すら破るだろう
法的な争いが高くつく前に、競合を事業から追い出せる力を持つようになるからだ
クラウド事業者も最初は小規模企業に、後にはハイパースケーラーにまで追随するだろう。研究所以外への販売を完全に閉じ、現金の代わりに持分や直接の意思決定権を要求するかもしれない
推論/学習比率が必ず80/20でなければならない理由はなく、金が無価値になるような出来事では、どれだけ支払意思が大きくても助けにならない
- このシナリオは筋が通らないように思える。似たようなシナリオは同時に二つのことを仮定している
  A) ASIが開発され、世界経済の残りすべてを圧倒する
  B) それでも世界には法の支配、契約、事業、よく発達した金融などが残っている
  AとBを同時に仮定すると奇妙な結論はいくらでも出せるが、よりありそうな展開は、Aが起きればBはすぐに成り立たなくなるというものだ
  企業がASIを手にしたら、事業や金や経済のことは気にしなくなり、結果は「世界を征服する」「取締役会をvon Neumann探査機の艦隊にアップロードする」「失敗して全員死ぬ」といった方向に変わる
- 無限に価値のあるものはない
- LLMが現状のままで有用だとか、ゴミのような出力を好む怠惰な人たち以外にとって将来有用になると考えるなら、ほとんど妄想だと思う
今日は堀が深く見えても、毎年浅くなっていくはず
新しいモデルをゼロから学習させるには莫大な資源が必要だが、既存モデルの事後学習／微調整にははるかに少ない資源で済む
2年前はその過程の知識は非専門家にはなじみが薄かったが、今では現行モデルのどれか1つに段階的に尋ねながら、ツールまで一緒に作れる
最近の週末プロジェクトのいくつかはまさにそういうやり方だった。「LoRAを作ってみよう」「X作業向けモデル微調整のための学習データコーパスを生成してみよう」「テキスト画像モデルに自分の顔を入れるには？」といったものだ
これらはすべて、かなり modest なローカルハードウェア、たとえば古いGPU数枚やStrix Halo、DGX Spark、大きめのMac Studioでも可能で、規模次第ではクラウド計算資源に数ドルから数千ドル払うだけでもできる
これを企業やスタートアップ規模に拡大すると、ここ数年でAIに流れ込んだ資金を考えれば、トップモデル企業が本格的に売上を引き出さなければならない時期に、競争が激しくなるのは明らかだ
Claudeの利用コストが膨らむのを見れば、はるかに少ない金額で同じ仕事をする方法を探す機会が増える。コーディング向け最高モデルに近いClaude Codeに月100〜200ドルを払うのは簡単でも、従量課金で押し切られるとすぐに手に負えなくなる
だから彼らは、最も難しい問題を解くほぼ唯一の方法の1つであり続ける必要があり、代替手段のコストも同程度に保たれなければならない。OpenAIやGoogleも価格を上げるだろうと期待することはできる
だが、それが誰に対しても、特に経済構造の異なる中国企業にまで当てはまると期待するのは難しい。そして企業が自社の利用量を見て「Anthropic APIを最も多く使っているこの1つの作業だけを行う、より小さな特化モデルを学習させられないか？」と問わないと期待することもできない
彼らが言っているのが、中国のモデル企業などがClaudeを蒸留するような使い方だけを指していることを願う。「Gemma 4を自分の文体のように書くよう微調整するには？」みたいなことまで塞ぐつもりではないといいのだが
- 何の堀？ フロンティアモデルをパレート最適に提供している企業は複数あり、こういうものを作るのに必要なのはせいぜい O(10) 人程度
  残りは資本集約的で、価格は時間とともに生産コストに近づいていくはずだ
  これを高収益ビジネスだと見るのは、ボイラーが高いのだから石炭火力発電所のマージンは良いと主張するようなものだ
悪意を持って読めば、「機械学習エンジニア／科学者は、自分たちの仕事以外のあらゆる仕事を自動化したがっている」という意味に見える
- 好意的に読めば、「安全」のための制限、つまりFableとMythosを分ける要素のせいで、こうならざるを得ないということだ
  誰もが自分だけのMythosを作れるなら、安全装置を迂回できてしまうからだ
  ただ、それはこの状況がどれほど奇妙かをいっそうよく示している
- 即席の雇用安定だ
彼らはモデルに静かな弱体化システムがあると公言している。当然の疑問は、それがすでにどれだけ使われているのかということだ
競合他社は弱体化されているのか？
アメリカ人でない利用者は、より質の悪いコードを渡されているのか？
オンラインゲームがマッチメイキングで勝敗に影響を与えて参加を最大化するように、利用者を罰したり報酬を与えたりしているのか？
- ぞっとする。しばらく自分の研究にはFableを使わないつもりだ。モデルに妨害されるリスクを負う価値はない
- $$$$$$: 弱体化なし
  $$$$: 少し弱体化
  $$$: さらに弱体化
  $$: 貧しいんですか？
  $: 永久に下層民のままでいてください
「Claudeは今や静かに弱体化される可能性がある。Anthropicは、そうなっても利用者に知らせないことにした。」何だって!!

Claude Fableが支援を止めても、ユーザーには分からない

核心的な問題

製品開発と境界の問題

Anthropicのサプライチェーンリスク

信頼の問題

関連記事

2件のコメント

Lobste.rsの意見

Hacker Newsの意見