1 ポイント 投稿者 p2c2kbf 2026-04-13 | まだコメントはありません。 | WhatsAppで共有

AIWatchは、Claude、OpenAI、Geminiなど主要なAIサービスの障害・アップタイム・復旧時間を
リアルタイムでモニタリングするオープンソースプロジェクトです。

ダッシュボード: https://ai-watch.dev
ランディングページ: https://ai-watch.dev/intro
GitHub: https://github.com/bentleypark/aiwatch

障害発生時にはAIが原因を分析し、復旧時間を予測して、
Discord/Slack に即座に通知を送ります。

今回は、3月20〜31日(12日間)に収集したデータをもとに、27サービス(3月時点)の
信頼性レポートを公開します。初回レポートのため期間は短く、4月からは月間フルデータで公開されます。

主な発見 3つ

1. アップタイム%の数値は不完全です
Claude APIは99%のアップタイムを記録しましたが、12日間で9件のインシデントが発生しました。
Cohereはアップタイム100%でインシデントゼロです。
数値だけを見ると似ているように見えますが、実際の信頼性はまったく異なります。

2. 短いインシデントが積み重なると大きな問題になります
Together AIは12日間でインシデント20件と最多でしたが、
平均復旧時間は25分で、総ダウンタイムは8時間37分です。
一方、ChatGPTは4件でしたが、そのうち1件は19時間46分に及びました。

3. アップストリーム依存のリスク
Deepgramの74時間にわたるVoice Agent障害は、OpenAIの障害から始まりました。
他のAIの上にAIを載せたサービスは、上位サービスの障害をそのまま引き継ぎます。


AIWatch Score 上位5件(3月時点)

サービス Score 等級 インシデント
Cohere API 100 Excellent 0件
Hugging Face 100 Excellent 0件
OpenRouter 99 Excellent 0件
Groq Cloud 93 Excellent 1件
DeepSeek API 92 Excellent 1件
OpenAI API 88 Excellent 1件 (2h 56m)
Together AI 84 Good 20件 (avg 25m)
ChatGPT 73 Good 4件 (最長 19h 46m)
Claude API 59 Fair 9件 (モデル別集計)
ElevenLabs 47 Degrading 2件 (最長 4h 47m)

Scoreの計算式(3月レポート基準): Uptime(50) + インシデント影響日数(30) + 復旧時間(20) = 100点満点
インシデント件数ではなく 影響日数(affected_days) 基準のため、報告方式に関係なく公平な比較が可能です。
算出方法の全文公開: https://ai-watch.dev/#about-score

ElevenLabsはアップタイム97.55%で、27サービス中唯一Degrading等級となりました。
音声/オーディオサービスを本番環境で利用しているなら注意が必要です。


参考事項

  • モニタリング期間は3月20〜31日(12日間)で、初回レポートのためデータは部分的です。
    4月からは月間フルデータで公開されます。

用途別のおすすめ(3月レポート基準)

  • 本番クリティカル: Cohere(100点、インシデント0件)、OpenAI API(88点、インシデント1件/総ダウンタイム 2h 56m)
  • 低遅延 / 安定性: Groq Cloud(93点、アップタイム100%)、DeepSeek API(92点)
  • コーディングワークフロー: Cursor、Windsurf(高いアップタイム)
  • 音声/オーディオ: AssemblyAI推奨 + Fallback必須 (ElevenLabs・Deepgramで複数障害)

まだコメントはありません。

まだコメントはありません。