Claude APIのアップタイム99%でインシデント9件 — 3月のAIサービス信頼性レポートを公開
(reports.ai-watch.dev)AIWatchは、Claude、OpenAI、Geminiなど主要なAIサービスの障害・アップタイム・復旧時間を
リアルタイムでモニタリングするオープンソースプロジェクトです。
ダッシュボード: https://ai-watch.dev
ランディングページ: https://ai-watch.dev/intro
GitHub: https://github.com/bentleypark/aiwatch
障害発生時にはAIが原因を分析し、復旧時間を予測して、
Discord/Slack に即座に通知を送ります。
今回は、3月20〜31日(12日間)に収集したデータをもとに、27サービス(3月時点)の
信頼性レポートを公開します。初回レポートのため期間は短く、4月からは月間フルデータで公開されます。
主な発見 3つ
1. アップタイム%の数値は不完全です
Claude APIは99%のアップタイムを記録しましたが、12日間で9件のインシデントが発生しました。
Cohereはアップタイム100%でインシデントゼロです。
数値だけを見ると似ているように見えますが、実際の信頼性はまったく異なります。
2. 短いインシデントが積み重なると大きな問題になります
Together AIは12日間でインシデント20件と最多でしたが、
平均復旧時間は25分で、総ダウンタイムは8時間37分です。
一方、ChatGPTは4件でしたが、そのうち1件は19時間46分に及びました。
3. アップストリーム依存のリスク
Deepgramの74時間にわたるVoice Agent障害は、OpenAIの障害から始まりました。
他のAIの上にAIを載せたサービスは、上位サービスの障害をそのまま引き継ぎます。
AIWatch Score 上位5件(3月時点)
| サービス | Score | 等級 | インシデント |
|---|---|---|---|
| Cohere API | 100 | Excellent | 0件 |
| Hugging Face | 100 | Excellent | 0件 |
| OpenRouter | 99 | Excellent | 0件 |
| Groq Cloud | 93 | Excellent | 1件 |
| DeepSeek API | 92 | Excellent | 1件 |
| OpenAI API | 88 | Excellent | 1件 (2h 56m) |
| Together AI | 84 | Good | 20件 (avg 25m) |
| ChatGPT | 73 | Good | 4件 (最長 19h 46m) |
| Claude API | 59 | Fair | 9件 (モデル別集計) |
| ElevenLabs | 47 | Degrading | 2件 (最長 4h 47m) |
Scoreの計算式(3月レポート基準): Uptime(50) + インシデント影響日数(30) + 復旧時間(20) = 100点満点
インシデント件数ではなく 影響日数(affected_days) 基準のため、報告方式に関係なく公平な比較が可能です。
算出方法の全文公開: https://ai-watch.dev/#about-score
ElevenLabsはアップタイム97.55%で、27サービス中唯一Degrading等級となりました。
音声/オーディオサービスを本番環境で利用しているなら注意が必要です。
参考事項
- モニタリング期間は3月20〜31日(12日間)で、初回レポートのためデータは部分的です。
4月からは月間フルデータで公開されます。
用途別のおすすめ(3月レポート基準)
- 本番クリティカル: Cohere(100点、インシデント0件)、OpenAI API(88点、インシデント1件/総ダウンタイム 2h 56m)
- 低遅延 / 安定性: Groq Cloud(93点、アップタイム100%)、DeepSeek API(92点)
- コーディングワークフロー: Cursor、Windsurf(高いアップタイム)
- 音声/オーディオ: AssemblyAI推奨 + Fallback必須 (ElevenLabs・Deepgramで複数障害)
まだコメントはありません。