1 ポイント 投稿者 GN⁺ 1 시간 전 | 1件のコメント | WhatsAppで共有
  • AnthropicはSpaceXとのパートナーシップと最近締結した複数のコンピュート契約を通じて、Claude CodeとClaude APIの利用上限を拡大すると発表
  • Claude Codeの5時間の使用量制限が2倍に増加し(Pro、Max、Team、シートベースのEnterpriseプラン)、ProとMaxアカウントのピーク時間帯の上限縮小が撤廃される
  • Claude OpusモデルのAPI rate limitsが大幅に引き上げられ、追加容量はClaude ProとClaude Maxサブスクライバーの利用可能量を直接改善する
  • AnthropicはSpaceXのColossus 1データセンターのコンピュート容量全体を利用する契約を締結し、1か月以内に300MWを超える新規容量と22万基以上のNVIDIA GPUへアクセス可能になる
  • Anthropicのコンピュート拡張は、Amazon、GoogleおよびBroadcom、MicrosoftおよびNVIDIA、Fluidstackとの契約に加えて進められ、地域内インフラ・電力コスト負担・地域社会への投資もあわせて考慮されている

Claude利用上限の拡大

  • AnthropicはSpaceXとのパートナーシップと最近締結した複数のコンピュート契約を通じて、Claude CodeClaude APIの利用上限を引き上げる
  • 3つの変更はいずれも発表当日から適用される
  • Pro、Max、Team、シートベースのEnterpriseプランでClaude Codeの5時間の使用量制限が2倍に増加
  • ProとMaxアカウントではClaude Codeのピーク時間帯の上限縮小が撤廃
  • Claude OpusモデルのAPI rate limitsも大幅に引き上げ

SpaceXとの新たなコンピュートパートナーシップ

  • AnthropicはSpaceXのColossus 1データセンターのコンピュート容量全体を利用する契約を締結
  • この契約により、1か月以内に300MWを超える新規容量と22万基以上のNVIDIA GPUへアクセス可能になる
  • 追加容量はClaude ProとClaude Maxサブスクライバーの利用可能量を直接改善する
  • 今回の契約はAnthropicの既存の主要なコンピュート拡張発表に加わるもの
  • Claudeの学習と実行にはAWS Trainium、Google TPUs、NVIDIA GPUsなど複数のAIハードウェアが使用される
  • Anthropicは追加容量をオンラインで確保する機会を引き続き模索中
  • SpaceX契約の一環として、複数GW規模の軌道上AIコンピュート容量の開発に向けてSpaceXと協力することにも関心を示している

国際展開と地域インフラ

  • 金融サービス、医療、政府のような規制の多い業界のエンタープライズ顧客は、コンプライアンスとデータレジデンシー要件を満たすために地域内インフラをますます必要としている
  • これに伴い、Anthropicの一部の容量拡張は国際的に進められている
  • 最近発表されたAmazonとの協力には、アジアと欧州の追加推論容量が含まれる
  • 容量を追加する地域は慎重に選定され、大規模投資を支えられる法的・規制的枠組みを持つ民主主義国家と協力する
  • コンピュートに必要なハードウェア、ネットワーキング、施設のサプライチェーンが安全であることも重要な基準となる

電力コストと地域社会への投資

  • Anthropicは、米国内のデータセンターによって消費者の電気料金が上昇した場合はそれを負担するという約束を最近発表
  • 国際展開の一環として、この約束を新たな法域へ拡張する案を検討中
  • 施設が立地する地域社会へ再投資するため、現地リーダーと協力する方策もあわせて進めている

1件のコメント

 
GN⁺ 1 시간 전
Hacker Newsのコメント
  • AI経済はこういう方向に進みそうだ: 推論は安くなり、特化型アクセラレータが市場に出て価格競争が始まる
    一方で学習は引き続き高コストのままで、Anthropic/OpenAIは学習事業の側へ向かうことになる
    モデルはリース単位または購入可能な資産になり、ユーザーは推論ハードウェア上で動かすか、推論ハードウェアを借りるか所有することになる
    あるいは、それらを全部代行してくれる事業者にプレミアムを払う構図になる
  • 新規300メガワット容量NVIDIA GPU 22万台超という規模は本当に桁違いに大きい
    Opusのような最新モデルの推論だけでも、どんなインフラが使われているのかを扱ったブログ記事のようなものがあるのか気になる
    秘密だとは思うが、AWS Bedrockで直接モデルを使えるなら、ある程度の手がかりにはなるのではないかと思う
    • おそらくコンピューティングインフラのことを言っていたのだろうが、電力インフラのほうも興味深い
      データセンターは運用拡張の速度がコストより重要なので、ばかげたやり方で回っていることがある
      電力会社の規制があり、送電網を壊さないためのランプレートのようなものもあるが、データセンターがこれをひどく破っているという説明がある
      負荷変動性が大きく、メーター裏側の天然ガス発電で電力を賄っていて、本来7年は持つはずのシャフトが、繰り返しの起動・停止のせいで10か月しか持たないという話だ
      https://www.volts.wtf/p/doing-data-centers-the-not-dumb-way
      コンピューティングのほうはNVIDIAの標準リファレンス設計がある
      https://www.nvidia.com/en-us/technologies/enterprise-referen...
      詳しくは見ていないが、MellanoxのGPU間ネットワーク、GPUにテンソルを分割する大規模なカスタムコード、GPUノード間でアクティベーション値を移すコードなどがあるのだと思う
    • それは正確にはそういう仕組みではない
      AnthropicがAWS Bedrock内で自社モデルをマネージドサービスとしてホスティングしていて、顧客は別のAPIを呼ぶのと同じようにLLMを呼び出す
      そのAPIリクエストをどのAWSインフラが処理しているかは見えない
  • AnthropicがGrok向けにElonが作ったデータセンターを借りるというのは、作り話では出てこないようなどんでん返しに思える
    • SpaceX側からするとかなり賢い
      金食い虫であるGrokのために作った資産を、IPO前にかなり大きな収益源へ変えている
    • その合併は、投資家を満足させつつxAIを静かに畳む方法にかなり見えた
      同時にTwitterの負債を大衆に押し付ける手段にも使っているので、会計士たちは確かに有能らしい
    • 両社にとって筋の通るどんでん返しだ
      Anthropicは成長を続けるために切実に必要なコンピュートを手に入れ、ElonはGrok需要が少なくxAIで十分に使えなかったコンピュートを貸し出し、SpaceXはIPO向けの帳簿に売上を載せられる
      「この規模の投資を支える法・規制の枠組みを持つ民主国家と協力し、容量を慎重に追加していく」という文は、現実の言葉に訳せば「利益を何より優先する」に近い
      ElonはTrumpを支持した極右寄りの人物で、Trumpもそれほど民主的ではないが、要するに金が本当にもっと必要だということだ
      xAIが中東の非民主的政府の資金を受けていた事実も忘れさせたいのだろうし、Anthropicモデルを売れるなら中国のコンピュートでも買いそうだ
  • 1か月以内にという部分がいちばん頭がおかしくなりそうな点だ
    データセンターは、よく書かれた仕様と国際標準インターフェースを備えたプラグアンドプレイ機器ではないのだから
  • 「この契約の一環としてSpaceXと協力し、数ギガワット規模の軌道上AIコンピューティング容量を開発することに関心を示した」という文を見ると、Anthropicが一般大衆よりこの宇宙事業を本気で見ているか、この一文を載せるのがコンピュートを得る契約条件だったかのどちらかだ
    • この一文を載せるのがコンピュートを得る契約条件だった、というほうに100%同意する
    • Anthropicは使えるだけのコンピュートを何でも必要としている
      Elonが軌道上データセンターを作りたいなら、Anthropicは喜んでその上でモデルを動かすだろう
      Elonが軌道上データセンターを作れるかを大きく疑う必要はなく、問題は地上ベースより経済性があるか
    • 宇宙コンピューティングがうまくいくとは思わないが、「後でよい価格で提供されるなら喜んで買う」と言うこと自体はもちろんできる
      うまくいけばそれでいいし、だめならだめというだけだ
    • 単なる権力者へのごますりに見える
      地上データセンターへのアクセス権を得る契約の一部として、明らかに荒唐無稽な宇宙軌道コンピューティングをそれ以上のものに見せかけている
      いつかそういうものが存在する可能性はあると思うが、FSDのように実現にはまったく近く見えない
      そう言うコストはほぼゼロで、あとで興味がなくなったという理由を付ければいい
      コストがあるとすれば、わずかな評判くらいだ
    • 大手テック企業のCEOの大半はこういう話をしたことがある
  • Colossus 1データセンターは違法な電力を使い、Memphis近郊の貧しい地域の空気を汚染し、水まで汚染する可能性がある場所だ
    電力網に追加需要を生み、極端な気象条件で大規模停電を引き起こして住民をさらに危険にさらす可能性も大きい
    https://en.wikipedia.org/wiki/Colossus_(supercomputer)#Envir...
    だからAnthropicも安全を大きく語ってはいるが、実際には安全より利益を優先する企業の一覧に入れられる
    • ここで違法という表現は強い
      含まれているWikipediaリンクにも許認可まわりの微妙な部分があるかもしれないとは書かれているが、電力が「違法」だと主張している内容は見ていない
    • データセンターがどうやって水を汚染するのか分からない
      化学物質を作っているわけでもなく、そういうことはしていない
    • 印刷物に載った疑惑がすべて事実というわけではない
      この種の疑惑にはかなり懐疑的であるべきで、特に資金力のある企業が関わっている場合は、「もっともらしくてしつこい」被害主張だけでも訴訟や和解圧力を受けることがある
    • 検索してみると、ほとんどのデータセンターはそのデータセンターで発生した売上に対して州税をほとんど払っていないようだ
      事実なら巨大な税の抜け穴であり、データセンターへの資本投資が大きいのも不思議ではない
      [0] https://www.datacenterknowledge.com/regulations/how-are-data...
  • 週間上限も2倍にしないなら、5時間のレート制限を2倍に増やしてもマーケティングでしかない
    5日ではなく3日で週間上限に達するようになるだけだ
    • 週間上限に近づいたことは一度もないが、時間ごとの上限にはよく引っかかった
    • $100プランに上げてからこの5か月、どちらの上限にも一度も引っかかったことがない気がする
      多く使う週は1日6時間以上、継続して使うこともある
      ただし常にセッションを20万〜25万トークン未満に保つことにはかなり厳格だ
    • 個人的には基本のClaude Codeサブスクを使っていて、平日の夜や週末に1〜2時間ほどコーディングしながら気分転換する用途で使っている
      毎週3〜5セッションくらい使う
      もっと複雑な作業をすると5時間枠をすぐ使い切ってしまい、いら立つが、まだ週間上限には達したことがない
      自分のようなケースはかなり多い気がする
    • その通り、実際の制約要因は週間上限
      本気で押し込めば、月額$200のMaxプランの週間上限ですら1日で簡単に使い切れる
    • まだ意地で使っているOpus 4.6だと、自分のワークフローでは5時間枠の中で週間使用量の約10%を燃やせる
      頭の中では週間使用量を日単位、つまり1日約14%として計算していて、週の前半は抑えめに使い、後半でもう少し自由に使おうとしている
      そうすると最後の2日間は、貯めておいた使用量をどう消化するか考える羽目になる
      5時間枠のせいでこれがさらに難しくなり、週の最後の日には起きている時間ごとに5時間枠ごと10%を入れようとして本当に嫌になる
      いちばん生産的な時間に働きたいのであって、ばかげた時間枠に合わせて働きたくはない
      「午前11時にClaudeをいちばん使いそうだから、午前7時30分にHaikuへどうでもいいメッセージを送って5時間枠を始めて、12時30分にまた切り替わるようにしておこう」みたいなことは考えたくない
      だからこの変更は歓迎だが、100%自分たちが作った問題を少し緩和しつつ、ユーザーに恩を売っているふりをしているだけだ
      ピーク時間の利用を下げたい意図は分かるが、それでも嫌だ
  • Claude Codeの5時間レート制限をPro、Max、Team、シートベースのEnterpriseプランで2倍に増やし、ProとMaxのピーク時間制限縮小をなくし、Claude OpusモデルのAPIレート制限も大きく引き上げるという
    結局のところ、ElonはxAIを諦めてコンピュートを売る側へ回ったように見える
    • 同じデータセンターに関係しているのかは分からないが、この発表は、まだ新しかった複数のGrokモデルが短い告知の後に廃止されてからわずか数時間で出てきた
      Grok 4.1 FastはXでリサーチする最安の方法で、X APIより安かったのに、5月15日に消えた
      https://docs.x.ai/developers/models
      売るためのコンピュートを空けているのかもしれない
    • まだElonがxAIを諦めたと断定はできない
      ただ、GemmaやQwenのようなオープンソースモデルがあまりに速く良くなっていて、Anthropicでさえ長期的には自社モデルとツールの価値に現実的なリスクがあると見ている
      基本的に自分がAnthropicやxAIなら、可能なあらゆる場所で売上を作って何が生き残るかを見る
      何もかもがこれほど変動的な状況では、独占支配を狙うことに価値はない
    • 詳細は秘密だ
      単に無駄になっていたGPU時間なのかもしれないが、Anthropicが断りにくい提案をした可能性もある
      推測にすぎないが、Elonが断れない提案だとしたら、Anthropicが学習データや技術の一部を提供する話かもしれない
    • 正直、よい考えかもしれない
      xAIは真面目な研究所とは見なしにくい
    • 諦めたとは思わない
      Claudeがどう動くかについての内部情報を得られるし、Claudeの利用データの巨大な流れも手に入る
      それらすべてが今後のGrok開発に反映される気がする
  • この知らせを2日前に知りたかった
    数日間Claude Codeを使っていて何度も上限に達したのでMaxにアップグレードしようとしたところ、アップグレードの流れでPersonaによる本人確認を求められた
    まあいいかと思ってアップグレードを取り消そうとしたが、既存プランのClaude Codeアクセスまで全部ブロックされ、本人確認を完了しない限り解除できなくなった
    自分は絶対にやらないし、本当にひどい体験だった
    不幸中の幸いは、Deepseekのほうがずっと安く、リバースエンジニアリング作業では似たような水準だと分かったことだ
  • 上限のせいで結局サブスクを解約し、自分のワークフローをpiで完全にモデル非依存にした
    良い知らせではあるが、もう戻ることはない
    Anthropicは短期間にあまりに多くの失敗をして、自分を失った
    OpusはGPT 5.5、DeepSeek、Kimi、Qwenで代替できるし、これらはすべて自分の単一ハーネスで動かしていて、モデルを簡単に切り替えられる
    どれか1つでも同じような振る舞いを始めたら、すぐ乗り換えられる