AnthropicのClaude Code障害ポストモーテム：2026年4月23日

(anthropic.com)

7 ポイント投稿者 ragingwind 2026-04-24 | 13件のコメント | WhatsAppで共有

過去1か月の間、一部のユーザーからClaudeの応答品質が低下したという報告が続いていました。Anthropicがこれを追跡した結果、Claude Code、Claude Agent SDK、Claude Coworkに影響を与えた3つの異なる変更が原因だったことを確認しました。API自体には影響はなく、2026年4月20日（v2.1.116）時点で、すべての問題は解決されたとしています。このポストモーテムには、問題の原因、修正内容、そして再発防止策がまとめられています。

3つの障害の原因と経緯

推論努力（reasoning effort）のデフォルト値引き下げ（3月4日）: Claude Codeのデフォルトの推論努力レベルをhighからmediumに変更しました。UIがフリーズしたように見えるほどの長い待ち時間を減らすための措置でしたが、ユーザーは応答品質の低下を体感し、最終的に4月7日に元へ戻しました。現在はOpus 4.7ではxhigh、それ以外のモデルではhighがデフォルト値に設定されています。
キャッシュ最適化バグによる推論履歴の削除（3月26日）: 1時間以上アイドル状態だったセッションを再開する際、以前の推論（thinking）履歴を一度だけ整理するよう設計された機能が、バグによりその後のすべての会話ターンごとに繰り返し削除されていました。これによりClaudeは、自分がなぜ特定の作業を行ったのかを記憶できなくなり、ユーザーが経験した「物忘れ」、反復応答、異常なツール選択の原因となりました。キャッシュミス（cache miss、保存済みデータを見つけられない現象）が繰り返し発生し、利用量上限が想定より早く消費される副作用もありました。4月10日に修正されました。
システムプロンプトの過度な簡潔化指示（4月16日）: Opus 4.7の冗長な出力を減らすため、「ツール呼び出しの間のテキストは25語以内、最終応答は100語以内」というシステムプロンプトを追加しました。内部テストでは問題がありませんでしたが、実際のコーディング品質に悪影響を与えることが確認され、4月20日に削除されました。

問題の発見が遅れた理由

3つの変更がそれぞれ異なる時点、異なるトラフィック範囲に適用され、 全体として一貫性のない品質低下のように見え、個別の原因を特定しにくくなっていました。
内部テスト環境と実際のユーザー環境の差がありました。キャッシュバグの場合、内部で進行中だった別の実験やUI表示方式の違いのため、再現自体が容易ではありませんでした。
既存の評価体系（eval suite）が十分に広くありませんでした。 システムプロンプト変更の影響は、より多様な評価を回した後になって初めて3%の性能低下として明らかになりました。

再発防止のための対策

内部スタッフが実際の公開ビルドを使うことを義務化し、内部テスト用ビルドとの乖離を減らします。
システムプロンプト変更に対する統制を強化します。 すべての変更時にモデル別の広範な評価を実施し、各行の影響を個別に分析（ablation）し、段階的な展開と十分な検証期間（soak period）を設けます。
Code Reviewツールを改善します。 実際にOpus 4.7へ関連コードリポジトリ全体をコンテキストとして与えたときにキャッシュバグを発見できた点に着目し、コードレビュー時に参照できるリポジトリ範囲を拡大します。
ユーザー向けコミュニケーションチャネル（@ClaudeDevs）を新設し、製品上の意思決定の背景を透明に共有します。

「意図的な品質低下はなかった」という点について

Anthropicはモデルを意図的に劣化させたことはないと述べており、APIと推論レイヤー（inference layer）には影響がなかったことを確認しました。ただし、製品レイヤー（Claude Code）における設定変更とバグが複合的に作用し、ユーザー体感の品質が低下したのは事実です。あわせて、すべての購読者の利用量上限をリセットする措置も発表しました。

13件のコメント

crawler 2026-04-24

どうして障害原因の3つ全部がコスト削減と直接関係してるんでしょうねｗｗｗｗｗ
性能が低下するほど、GPUリソースが本当にかなり逼迫しているみたいですね……

colus001 2026-04-24

これが正解なんだけど、言い訳が長いね（笑）

youknowone 2026-04-24

これまで公開ビルドをテストもせずに配布し、配布後もテストしていなかったという話をずいぶん長々と書いていますね。実際、私は3月26日にすぐそのバグを踏んだのに、社内で確認するのに3週間もかかるなんて話になると思っているのでしょうか……

youknowone 2026-04-24

パッチが当たった直後から、それまで使い切るのに3〜4時間かかっていた5時間クォータが30分で消費されるようになったのに、社員アカウントには5時間クォータがないか、少なくとも毎回/usageを見ながら作業しなければならないほど足りないわけではないので、気づくまでかなり時間がかかったんでしょうね。

amond 2026-04-24

SWE-Bench-Pro daily benchmark（キュレーションされたセット）でclaude codeを見ると、興味深い点が見える。

4/10〜4/20の区間ではruntimeが半分（653s→345s）、tool callが半分（3.3K→1.8K）、トークンは−18%減ったのに、pass rateはむしろ+16pp上がっている。4つの軸がすべて良い方向に同時に動くのは、よくあるパターンではない。

その過程で起きた事故3件が4/23のpostmortemだが、見ると全部「トークン/latencyを減らそうとして」起きたものだ。

一方、codex（gpt-5.4-xhigh）は同じ期間で数字がほとんど動いていない。pass rateは56%前後で固定、トークン/runtime/tool callもclaude codeの2倍水準のまま

colus001 2026-04-24

障害のポストモーテムではなく、コスト削減のポストモーテムなのでは？

sudoeng 2026-04-24

社内スタッフに実際の公開ビルドの使用を義務付け、社内テスト用ビルドとの乖離を減らします。
はははは

lim8603 2026-04-25

Opus 4.7 に YAGNI を教え込んでしまったみたいですね。毎回アーキテクチャの決定で、YAGNI に従った段階的な修正だという理由付けをしているからそういうものかと思っていたら、結局やらかしてしまいました。記憶力も長くない子なのに先延ばしの癖までついてしまって、大変なことです。

tazuya 2026-04-24

最初に問題提起されたときは問題ないと言い張っていたのに、あまりに話題が大きくなって隠しきれなくなったから公開した、と考えるのは私だけでしょうか。

unsure4000 2026-04-24

claude.aiのWebも全体的に細かく使い勝手が落ちている感じ…。トークンを節約するためにメモリも切りました。

xguru 2026-04-24

この告知を見てから、むしろAnthropicをさらに信頼できなくなった感じ。

上に関連記事が2本あるけど、2本は7か月差の投稿です。問題はどちらも同じく3つずつ。

最近のClaude品質低下イシュー3件の事後分析 2025-09-19
最近のClaude Code品質報告に関するアップデート 2026-04-24

skageektp 2026-04-24

私はたった5ドル分のクレジットくらい腹が立ってる!!

wedding 2026-04-24

話が長いな..