- Claudeプラットフォームで複数モデルのエラー率が上昇している状態と報告されている
- ユーザーはメールまたはSMSで障害発生および復旧通知を購読できる
- SMS通知は世界各国の国番号リストを通じて各国の番号で登録可能
- 購読者は**OTP(ワンタイムパスワード)**認証を経てSMS更新を受け取れる
- Anthropicが運営するClaudeサービスの障害状況モニタリング体制を示す事例である
Claudeサービス障害のお知らせ
- Claudeステータスページで複数モデルでエラー率が高まっている状態が告知されている
- 「Elevated errors across many models」という文言で表示
- 具体的な原因や影響範囲についての説明はない
通知の購読方法
- ユーザーはメールまたはSMSを通じて障害更新通知を受け取れる
- メールはインシデントが更新されるたびに通知
- SMSはClaudeがインシデントを作成または解決したときに送信
SMS通知の登録手順
- SMS通知を受け取るには国番号の選択 → 携帯電話番号の入力 → OTP認証の手順が必要
- OTP(ワンタイムパスワード)を入力して番号を検証する必要がある
- 認証後にSMS更新を受信可能
対応国一覧
- ページには世界の大半の国番号一覧が含まれている
- 例: 米国(+1)、韓国(+82)、日本(+81)、英国(+44)、ドイツ(+49) など
- 各国のユーザーが同じ手順でSMS通知を受け取れる
サービス状態モニタリングの意味
- ClaudeステータスページはAnthropicサービスのリアルタイム障害状況を公開する窓口として機能する
- ユーザーに透明性のある障害通知および復旧進捗の共有機能を提供
- 開発者および企業顧客がサービス可用性を即座に把握できる仕組みである
1件のコメント
Hacker Newsの反応
問題発生直後にステータスページを更新したのが印象的だった
Claude Codeを使っていてAPIエラーが出たのでステータスページを確認したら、実際に障害が表示されていた
こうした透明性のある対応は、あらゆるサービスが当然行うべきことだと思う
たまたま個人的にClaudeを使っていたおかげで、障害の深刻さをすぐ把握できた
Claudeユーザーは日曜の夜でも熱心に働いているようだ
私は今回のインシデント対応エンジニアの一人だ
14:43 PT / 22:43 UTC時点で問題は緩和された。ご不便をおかけして申し訳ない
重複した経路広告により、一部の推論バックエンドへのトラフィックがブラックホールに吸い込まれていた
検知まで約75分かかり、一部の緩和ルートも想定どおりには機能しなかった
誤った経路は削除され、サービスは復旧した
今後はsynthetic monitoringとインフラ変更の可視性を強化し、より早く検知する予定だ
透明性のおかげでCloudflareをより信頼するようになった
50年後のスチームパンク・ディストピアを想像してみる
「LLMホスティングが止まり、世界中の生産が停止し、市場は崩壊した。Sam、聞こえるか?」
そう考えるだけで笑える
関連動画: YouTube Shorts
Claude.aiのチャットでこんなメッセージを受け取った
絶妙なタイミングだったのか、あるいは収益化担当者にボーナスを出すべきなのかもしれない
バックエンドが429/402エラーを返していないか、ゲートウェイがそれを誤って処理して間違ったメッセージを返したように見える
Opus 4.5を終了したら泣きそうだ
障害の直前、Opusが妙に長い応答を返し始めていた
単純な質問にもコードベース全体を吐き出すように答え、データベーススキーマに関する簡単な質問でも2回も圧縮が起きた
canivibe.ai — 使うサービスによってvibeを合わせられるかもしれない
今回はAWS障害だったのではないかと気になる
ステータスページ上では、もう復旧したようだ
エージェントが同じエラーループにはまっていたのに、今回はきちんと結果を返すのを見た
こうした障害を自動検知するルールが追加されたのではないかと思うし、かなり刺激を受ける対応だった