1 ポイント 投稿者 GN⁺ 4 시간 전 | 4件のコメント | WhatsAppで共有
  • Anthropicは米国政府との対話を受けてFable 5のサイバーセキュリティ保護機構を更新し、ほとんどのコーディング作業は引き続き利用可能
  • 新しい保護機構は短期的には以前のFable保護機構よりも無害なリクエストをより頻繁にフラグする可能性があり、Anthropicは今後数週間かけてこれを調整する予定
  • リクエストがフラグされるとユーザーに通知が表示され、その応答はOpus 4.8で代替提供される
  • 生物学・化学分類器は初回リリース時と同じで、基本的な生物学に隣接する質問でもOpus 4.8へのフォールバックにつながる可能性がある
  • 使用量込みの有料プランでは7月7日までFable 5を週間使用量上限の50%まで利用でき、それ以降は他のモデルまたは使用量クレジット(usage credits)を利用する必要がある

Fable 5のアクセス再開と保護機構の調整

  • Anthropicは米国政府との対話を受けてサイバーセキュリティ保護機構を更新
  • ほとんどのコーディング作業は今回の変更の影響を受けない
  • 短期的には、新しい保護機構が以前のFable保護機構より無害なリクエストをやや多くフラグする可能性がある
    • Anthropicは今後数週間にわたり分類器を改善する予定
    • フラグされたリクエストはユーザーに明確に通知される
    • 当該応答はOpus 4.8で提供される

生物学・化学分類器の現時点での限界

  • 生物学および化学分類器は初回リリース時と同一
    • 現在の分類器は望ましい水準より広く動作している
    • 基本的な生物学に隣接する質問でもOpus 4.8へのフォールバックが発生する可能性がある
    • 当該分類器の改善はまもなく適用される予定

有料プランの利用条件とフィードバック経路

  • 使用量込みのすべての有料プランは7月7日までFable 5にアクセス可能
  • Fable 5は週間使用量上限の**最大50%**まで利用できる
    • その後、残りの使用量は他のモデルへ切り替えて利用可能
    • 使用量クレジットでFableを引き続き利用することもできる
  • プロモーションアクセス案内: Claude Fable 5 promotional access
  • Claude Codeでリクエストが誤ってフラグされた場合は/feedbackで報告できる
  • Claude.aiとCoworkではthumbsボタンでフィードバックを共有できる
    • このフィードバックは分類器の調整と誤検知の削減に活用される
  • Fable 5のブログ記事: Claude Fable 5 Mythos 5

4件のコメント

 
seoseonyu 1 시간 전

7月7日…もう 5.6 Sol をひたすら待つしかないかな

 
treestae 21 분 전

私もSolを待っています。
GalaxyやCosmosも出るでしょうね...

 
GN⁺ 4 시간 전
Hacker News の意見
  • Fable/Mythos の重みは、悪意があろうとなかろうと、一度のミスだけで敵対勢力に流出したり、どこかのトレントに上がったりし得ると思う
    Fable の重みは数百のデータセンターに配布され、数千人が直接・間接に一部または全体へのアクセス権を持つ可能性が高い。本当に世界終末級モデルならこんな扱いはしないだろうし、Mythos なら政府規制に準拠したデータセンター内でだけ動かしている、という程度なら信じられる。だがそれほど価値のあるモデルなら、国家支援のハッカーたちは盗み出すためにはるかに大きな労力をかけるはずだ。実情がどうであれ、Anthropic が言うほど画期的だとは考えにくい

    • GPT-2 の頃から、モデルが危険すぎるという話は聞かされてきた
      ある時点からは、羊飼いの少年が「狼が来た」と叫ぶのをやめてほしいという段階を超えて、むしろ狼に食べられてほしいと思うようになった
    • Mythos が何らかの形で流出して、人類全体がセルフホストで使えるようになるのが、長期的には最善かもしれない
    • 思ったより複雑かもしれない。Nvidia は高価な製品ラインに TEE を提供していると理解していて、そのため重みは暗号化された状態で使われる可能性が高い
      だからといって流出が不可能という意味ではないが、かなり大がかりな作業になる。Anthropic が Elon 側でモデルをサービス提供することをそれほど心配していない理由も、これかもしれない。おおよそ Nvidia TEE とハンドシェイクし、キーを注入してから暗号化された重みをアップロードする流れだろう。盗んだ重みで Nvidia 機器を動かし続けられないよう、ハートビート信号がなければ期限切れになるタイマーも入っている可能性が高い
    • Anthropic が本当に世界終末級だと主張しているわけではなさそう。単に攻撃的なサイバーセキュリティ能力があるので危険になり得る、という程度に見える
    • 全部マーケティングだと思う。政府はずっと、インサイダー取引をする人たちのような姿を見せてきた
  • 人間の意識に関する本の原稿を入れたらブロックされた。このモデルは笑えるほどひどく、Anthropic が悪意を持っていると感じるほど無力化している
    実質的に役に立たないものに金を払うつもりはない

    • 今日 Sonnet にブラウザ MCP を使って作業中のプロジェクトのユーザー名とパスワードを入力するよう頼んだら、セキュリティプロトコル違反なのでできないと返ってきた
      以前は普通にできていた。Claude が好きで、Codex のほうが良いという話があっても使い続けてきたが、これは本当に限界に近い。月に 200 ドル以上払っていて、契約の仕事でも推しているのに、基本的な敬意のあるサービスすら提供できないのは完全に馬鹿げている。6か月後には Easy-Bake のレシピの話しか許されず、誰かが電球でやけどしたら野の花の草原の話にさらにレベルを落とすのだろう
    • 同じ問題。言語と熱力学に関して執筆中の本もブロックされた。分類器がただの正規表現のように見える
    • 特に間の悪いタイミングだ。このモデルの強みは長い作業範囲と粘り強さ、大きな仕事を自律的に推し進める能力だと宣伝されていたからだ
      しかし途中で Opus 4.8 に戻ったり、いつでも中断されたりするなら、その能力には頼りにくい。こうした長いプロセスを回してみるとかなり堅実に進むが、何かが失敗と分類された瞬間に「長期作業」が死んでしまい、人間が救済するか、無理やりロールバックして再試行しなければならない
    • 最初に頼んだことからブロックされた。パートナーがウェブサイトのフロントエンドで見つけたバグのメモ、製品文言の修正、CSS バグ、表現上の問題を読んでほしいと言っただけなのに、即ブロックされた。使い物にならない
    • 今回はそうせざるを得なかったように見える。昨日の分類器に関する安全マージン拡大の記事を見ればいい
  • Fable がなかった間、Opus だけで十分だと感じていた。戻ってきたが、まったく恋しくなかった

  • 今夜使うつもりではあるが、気は進まない。7月7日以降は、これまでのようにサブスクリプションでずっと大きな価値を得られていた状態から、突然 API 価格を払いたくはないからだ
    もしかすると、これが今年みんなに降りかかるという「トークン経済学」なのかもしれない。いずれにせよ、使えるうちに最大限搾り取り、その後は信頼できる相棒である Opus 4.6 と Sonnet 4.6 に戻るつもりだ。いつまで提供されるかは分からないが

    • そんなふうに使ったら割り当てをすぐ使い切って、結局 API 価格を払うことになるのでは?
    • 7月7日以降に Max 350 プランが出るとほぼ確信している
    • 性能低下が始まる頃に、デフォルトモデルを Opus 4.6 に固定した。4.7 以上より結果がずっと良い
      これがまさにサービス劣化というものなのだろう
  • 米国ベースのモデルへの信頼喪失は、回復が難しそうだ
    Anthropic の大げさな終末論メッセージと、それに振り回された政権のせいで信頼は大きく削られ、一種の軍拡競争まで引き起こした

    • 逆に「私たちの製品は良すぎて禁止されるほどだった」というのは、考え得る最高の広告だ。OpenAI ならそんな状況を手に入れようと必死になったはず
      Sonnet 5 を今すぐ試したいとは思わないが、Fable にはかなり興味がある
    • OpenAI と中国企業が必要な競争をもたらしてくれることを望む
    • AI ベースの製品を作ったのなら、供給元を多様化するか抽象化レイヤーを作って、モデルに依存しないようにすべきだ。どんなモデルでも差し替えて使えるようにしておく必要がある
      エンドユーザーであるソフトウェアエンジニアなら、Gemini や ChatGPT のような別のモデルを使えばいい。そもそも存在しなかった信頼について不満を言うより、そのほうが生産的だ。Anthropic はサービスを提供する会社にすぎず、輸出禁止の有無に関係なく、いつでも提供を停止できる。どの国のどの AI 企業でも同じだ。本当に信頼できる LLM が欲しいなら、オープン重みモデルを自分で動かすべきだ
    • 逆に Anthropic が今のようにコミュニケーションしておらず、Fable が Pentagon のハッキングに使われていたらどうなっていただろう。Dario は木に吊るされていただろう
    • 大多数のユーザーは、こんなことがあったことすらまったく知らない可能性が高い。ここ HN の中に住んでいる私たちが泡の中にいることを忘れがちだ。会社はこれを成功として包装し、そのまま進むだろう
  • プロジェクトによっては、コード全体を生成させるよりも、計画とテスト/フォーマット検証のループを生成させるほうが有用な場合もある
    こうした成果物はプロジェクト全体よりはるかにトークン消費が少なく、その後のループは旧型モデルで回せる

    • 今日、2つのリポジトリにまたがるプロジェクトでそれを試してみた。すでに主要なユースケースの1つについて設計を固めてあり、Claudeにはそれと大きく変わらない上位集合を作らせるだけの作業だった
      計画を作ったあと、Fable 5の5時間コンテキストのうち残りは約10%だけで、それが今日やった作業のすべてだった。もちろん一般化はしにくい
    • その通り。Opusに計画を書かせ、Sonnetのサブエージェントを複数立ち上げて実装させている。より安くて速い
    • Devin Fusionの狙いはまさにこれで、これまでの結果はかなり良さそうに見える
      https://cognition.com/blog/devin-fusion
    • バッチ処理を試した人がいるのか気になる。https://claude.com/pricing#apiによると、Batch Processingを使うと価格が50%下がる
      OpenCode/Piのような実行ツールが、計画立案のような作業にこれを活用できるようにできるのか気になる
    • これがopusplanのアイデア
      https://code.claude.com/docs/en/model-config#opusplan-model-...
  • Claude Proをたまに使う程度なので、メッセージが分かりにくい。何か当然のことを見落としているのかもしれない
    「7月7日までは、プランの週次利用上限の最大50%をFable 5に使える」というのは、自分のサブスクリプションでFableを使えるのが期間限定プロモーションだという意味なのか? サブスクに入っているのに、なぜ普通にモデルを使えないのか? 今後サブスクでは旧型モデルだけが提供され、新型モデルは追加課金が必要な仕組みになるのか?

    • その通り
      「2026年7月7日以降、Claude Fable 5はプランの週次利用上限には含まれなくなります。Claude Fable 5は利用量クレジットを通じて引き続き利用でき、プランに含まれる利用量を超えて課金できます」と書かれている。長期的にこれが何を意味するのかは分からない。より強力なモデルが出るかAnthropicの計算リソースが増えれば、Fable 5が再びサブスクに含まれるかもしれないし、あるいはサブスク廃止の始まりかもしれない。他のプロバイダーがより良いモデルを出し続けている状況で、Opus 4.8に縛られたサブスクにお金を払うのはあまり筋が通らない
    • 大して時間もかからなかった
      Dynamic workflow “Multi-lens review of docs/membership-and-friends-model.md with adversarial verification” completed · 25m 59s
      Fable 5の上限に達した
      今週分に含まれるFable 5の利用量をすべて使い切っており、Fable 5を使い続けるには利用量クレジットが必要だと表示される
    • 初回リリース時には、限られた期間だけサブスクの一部としてFable 5を使え、その後は利用量クレジットが必要になると言っていた
      その時は、いずれまたサブスクプランの一部にしたいとも言っていた。今回の復帰では利用期間を7月7日まで延ばしたが、利用上限の50%に制限し、いつか恒久的にサブスクプランに入れたいという話は繰り返さなかった。まだ希望はあるが、明らかに良い方向には向かっていない
    • サブスクでも新モデルへのアクセスは引き続き可能なはず。Sonnet 5にはアクセスできるだろうし、それは新モデルだ。ただしMythos級のモデルがAPI専用ということ
      今はそうだという話で、こういう会社はいつ変わるか分からない
    • Fableは実行コストがより高く、まだ市場投入戦略を固めきれていないように見える
      人々が実際にどれだけ使うかを見て、Max/Proプランで補助し続ける価値があるのか、それともその上に追加のティアを作るべきか判断しようとしているのだろう
  • 「Claude Fable 5がリクエストを拒否した場合、Messages APIはエラーではなく、成功したHTTP 200レスポンスとしてstop_reason: "refusal"を返す」
    自分が「成功」と聞いてまさに思い浮かべる姿だ

    • HTTP 451ステータスコードを使う機会を逃した
      https://en.wikipedia.org/wiki/HTTP_451
    • 拒否がストリーミングの途中、ステータスコードとヘッダーをすでに受け取った後にも発生し得るのか気になる。APIを詳しく見たわけではない
  • Claude Codeのターミナルに「7月7日まではプランの週次利用上限の最大50%をFable 5に使え、上限に達したら利用量クレジットで継続利用でき、Fable 5はOpus 4.8より利用量を早く消費する」と表示される
    この50%ルールは以前はなかった気がするが?

    • Opus 4.8はGPT 5.5に比べて遅すぎるので、多少優れているとしても日常的なエンジニアリング作業には意味がない
      まもなくGPT 5.6が出るだろうし、Codexの月額249ドルプランはこれまで非常に寛大だった。Fable 5の新しい費用と推定される金額を払うには、以前試した記憶よりずっと良くなっていなければならない
    • 利用量もリセットされていなかった。幸運を祈る
    • 7月7日以降は従量課金モデルだけが残る。もはやサブスクのティアには含まれない
      いっそ戻さなければよかったとも思う。以前のように集中して使うと、コストは事実上20倍サブスク価格よりもさらに10〜20倍高くなる
    • 以前はそうではなかった
  • Fableへのアクセス権をサブスクプランに戻すことを再考してほしい。少なくとも20xプランには含めるべきだと思う
    最初の14日ほどの期間が発表されたときは、それが本来の意図であり、サブスクプランに維持しようと取り組んでいると理解していた。だが今では、それがまだ議論中なのかどうかすら何も言われていない

    • 市場が最終的には戻させるだろう。今は容量制約があるか、サブスクに合わせるには別の価格ティアが必要かを見極めている可能性が高い
      望ましくない状況は、誰かが週4日コーディングして毎週上限を使い切るようなケースなのだろう
    • 含まれるのは来週までだけ
      「Fable 5は7月7日まで週次利用上限の最大50%まで含まれ、その後は利用量クレジットで利用できる」となっている
 
runai 2 시간 전

クレジットで使えるのは誰なんだろう? 月に数百万円を超えることもありそうなのに? それならむしろGPTの次期バージョン5.6を使うかな。