1 ポイント 投稿者 GN⁺ 2025-12-15 | 1件のコメント | WhatsAppで共有
  • Claudeプラットフォームで複数モデルのエラー率が上昇している状態と報告されている
  • ユーザーはメールまたはSMSで障害発生および復旧通知を購読できる
  • SMS通知は世界各国の国番号リストを通じて各国の番号で登録可能
  • 購読者は**OTP(ワンタイムパスワード)**認証を経てSMS更新を受け取れる
  • Anthropicが運営するClaudeサービスの障害状況モニタリング体制を示す事例である

Claudeサービス障害のお知らせ

  • Claudeステータスページで複数モデルでエラー率が高まっている状態が告知されている
    • 「Elevated errors across many models」という文言で表示
    • 具体的な原因や影響範囲についての説明はない

通知の購読方法

  • ユーザーはメールまたはSMSを通じて障害更新通知を受け取れる
    • メールはインシデントが更新されるたびに通知
    • SMSはClaudeがインシデントを作成または解決したときに送信

SMS通知の登録手順

  • SMS通知を受け取るには国番号の選択 → 携帯電話番号の入力 → OTP認証の手順が必要
    • OTP(ワンタイムパスワード)を入力して番号を検証する必要がある
    • 認証後にSMS更新を受信可能

対応国一覧

  • ページには世界の大半の国番号一覧が含まれている
    • 例: 米国(+1)、韓国(+82)、日本(+81)、英国(+44)、ドイツ(+49) など
    • 各国のユーザーが同じ手順でSMS通知を受け取れる

サービス状態モニタリングの意味

  • ClaudeステータスページはAnthropicサービスのリアルタイム障害状況を公開する窓口として機能する
    • ユーザーに透明性のある障害通知および復旧進捗の共有機能を提供
    • 開発者および企業顧客がサービス可用性を即座に把握できる仕組みである

1件のコメント

 
GN⁺ 2025-12-15
Hacker Newsの反応
  • 問題発生直後にステータスページを更新したのが印象的だった
    Claude Codeを使っていてAPIエラーが出たのでステータスページを確認したら、実際に障害が表示されていた
    こうした透明性のある対応は、あらゆるサービスが当然行うべきことだと思う

    • ユーザーへの影響が始まった瞬間にインシデントを公開する習慣は、GoogleとAnthropicでSREとして働く中で身についた本能だ
      たまたま個人的にClaudeを使っていたおかげで、障害の深刻さをすぐ把握できた
    • 私も問題に遭って2分後にステータスページを確認したが、すでに更新されていた
    • 529エラーをデバッグしていたところで、この障害のせいでしばらく混乱した
    • 私も同じ状況で、ステータスページを見てすぐ更新を購読した
      Claudeユーザーは日曜の夜でも熱心に働いているようだ
  • 私は今回のインシデント対応エンジニアの一人だ
    14:43 PT / 22:43 UTC時点で問題は緩和された。ご不便をおかけして申し訳ない

    • 私も同じチームのエンジニアだが、原因はネットワークルーティング設定ミスだった
      重複した経路広告により、一部の推論バックエンドへのトラフィックがブラックホールに吸い込まれていた
      検知まで約75分かかり、一部の緩和ルートも想定どおりには機能しなかった
      誤った経路は削除され、サービスは復旧した
      今後はsynthetic monitoringとインフラ変更の可視性を強化し、より早く検知する予定だ
    • Cloudflareのようにインシデント分析レポートを公開する予定があるのか気になる
      透明性のおかげでCloudflareをより信頼するようになった
    • どうしてもClaudeに聞かなければならない時に動かなくて困った
    • 週末をうまく締めくくれるといいね
    • 開発者として単純に興味があるのだが、大規模デプロイ環境でどういう形で問題が起きるのか、もっと知りたい
  • 50年後のスチームパンク・ディストピアを想像してみる
    「LLMホスティングが止まり、世界中の生産が停止し、市場は崩壊した。Sam、聞こえるか?」
    そう考えるだけで笑える

    • みんなが同じ3つの中央集権的な推論プロバイダーを使うというのは、今みんながus-east-1とCloudflareの背後にいるのと同じくらい非現実的だ
    • インターネットやCloudflareが落ちるのと大差ない気がする
    • Karpathyがこうした障害を**「知能ブラウンアウト(intelligence brownout)」**と呼んでいたのを思い出した
      関連動画: YouTube Shorts
    • 「記号操作に長けた孤独なコーダーだけが、人類と闇の間に残された最後の存在だ」みたいな一文が思い浮かぶ
    • 「問題をvibeコーディングで作ってしまったのに、いまはLLMが落ちていてvibeで直せない」というジョークが出てきそうだ
  • Claude.aiのチャットでこんなメッセージを受け取った

    "You have reached the messages quota for your account. It will reset in 2 hours, or you can upgrade now"
    

    絶妙なタイミングだったのか、あるいは収益化担当者にボーナスを出すべきなのかもしれない

    • おそらくエラーハンドリングが適切に実装されていないのだろう
      バックエンドが429/402エラーを返していないか、ゲートウェイがそれを誤って処理して間違ったメッセージを返したように見える
    • 私も同じメッセージを見たが、単なるタイミングの問題だと思っていた
  • Opus 4.5を終了したら泣きそうだ

    • すでにAPIクレジットをもっとくれと言う人たちが中毒者みたいに見えていた
    • みんな価格にはかなり満足しているようだ
  • 障害の直前、Opusが妙に長い応答を返し始めていた
    単純な質問にもコードベース全体を吐き出すように答え、データベーススキーマに関する簡単な質問でも2回も圧縮が起きた

  • canivibe.ai — 使うサービスによってvibeを合わせられるかもしれない

    • サイトはかっこいいが、Discordのようなチャットアプリでは埋め込みがうまく動かない
    • 可用性が89%とは、ちょっと冗談みたいな数字
    • 「Vibedetector」という名前がぴったりだ
  • 今回はAWS障害だったのではないかと気になる

  • ステータスページ上では、もう復旧したようだ
    エージェントが同じエラーループにはまっていたのに、今回はきちんと結果を返すのを見た
    こうした障害を自動検知するルールが追加されたのではないかと思うし、かなり刺激を受ける対応だった