GitHub Actionsがダウン

(githubstatus.com)

1 ポイント投稿者 GN⁺ 2026-05-27 | 1件のコメント | WhatsAppで共有

GitHubステータスページは現在 All Systems Operational で、2026年5月27日には報告されたインシデントはなし
直近90日基準で主要コンポーネントはすべて Operational で、Actionsの稼働率は99.66%、Pull Requestsは99.55%
5月26日の ActionsとPages では認証問題により実行開始・アクションダウンロード失敗が発生し、Actions実行の大半が影響を受けた
5月20日の Actions 遅延は 誤って構成されたヘルスチェック が原因で、全実行の4.5%と scale set ジョブの30%が遅延
5月15日の Actions 低下は 計画されたフェイルオーバー 中のルーティング問題で発生し、ピーク時には実行の42%が失敗

現在のサービス状態

GitHubステータスページは現在 All Systems Operational と表示されている
2026年5月27日には 報告されたインシデントなし と表示されている
直近90日基準で主要コンポーネントはすべて Operational 状態
- Git Operations: 99.83% の稼働率
- Webhooks: 99.73% の稼働率
- API Requests: 99.98% の稼働率
- Issues: 99.86% の稼働率
- Pull Requests: 99.55% の稼働率
- Actions: 99.66% の稼働率
- Packages: 99.98% の稼働率
- Pages: 99.96% の稼働率
- Copilot: 99.91% の稼働率
- Codespaces: 99.77% の稼働率
- Copilot AI Model Providers: 100.0% の稼働率
GitHub Enterprise Cloud の地域別ステータスページも別途提供されている
- Australia
- EU
- Japan
- US

2026年5月26日の Actions および Pages インシデント

Actions および Pages インシデント
- 10:57 UTC に ActionsとPagesのパフォーマンス低下 の調査が開始
- 11:19 UTC には Actions の 可用性低下 が確認された
- 11:53 UTC には Actions の実行開始失敗とアクションダウンロード失敗を引き起こす 認証問題 が調査中で、この時点では Actions 実行の大半が影響を受けていた
- 12:37 UTC に GitHub Actions に影響した認証問題の原因が特定され、緩和作業が進められた
- 13:00 UTC に Actions と Pages の低下が緩和され、安定性確認のための監視へ移行
- 13:18 UTC にインシデントは解決し、詳細な 根本原因分析 は準備でき次第共有予定

2026年5月20日の Actions インシデント

Actions インシデント
- 16:00〜17:45 UTC の間、GitHub Actions の顧客が 5分超の実行開始遅延 を経験
- 影響時間帯では全実行の約 4.5% が遅延し、scale set ジョブはより大きな影響を受けた
- scale set ジョブの 30% が遅延し、4% はまったく開始できなかった
- 原因は、ランナーにジョブを割り当てる内部サービスの 誤って構成されたヘルスチェック だった
- 上位依存先での短時間の遅延急増が複数の pod でヘルスチェック失敗を引き起こし、それらの pod がサービスから外されたことで残りの容量に負荷が集中した
- 追加負荷は メモリ逼迫 につながり、あるリージョンクラスターで連鎖障害が拡大して自己回復できなくなった
- 対応は正常なリージョンクラスターの容量を拡張し、損傷したリージョンクラスターからトラフィックを退避させる形で進められ、その後実行開始遅延は回復した
- 再発防止のため、連鎖障害シナリオを避けるよう ヘルスチェック構成 を強化し、リージョン低下時にトラフィックを再分散する自動緩和策を評価中
- 20:14 UTC にインシデントは解決

2026年5月15日の Actions 可用性低下

Actions 可用性低下
- 07:43〜08:48 UTC の間、GitHub Actions で一部顧客の ワークフロー実行失敗 または開始遅延が発生
- インシデントは、GitHub Actions が使用する支援インフラの 計画されたフェイルオーバー の過程で始まった
- フェイルオーバー中、自動サービスディスカバリー更新が正しく伝播せず、トラフィックが誤ってルーティングされ、ワークフローオーケストレーションの中核依存先でリクエストタイムアウトが増加した
- 最大影響時には Actions 実行の 42% が失敗
- Actions ワークフロー実行に依存する downstream サービスも影響を受け、GitHub Pages と Copilot cloud services が含まれた
- 08:12 UTC に対応担当者がサービスディスカバリーのルーティング問題を手動で修正
- タイムアウトと失敗率はまもなく回復し、すべての影響サービスが安定するまで監視が継続された
- 再発防止のため、フェイルオーバー完了前にサービスディスカバリー状態を検証する フェイルオーバーガードレール、事前・事後検証の強化、インフライベント中のタイムアウト連鎖を減らす依存先の回復力改善が進められている
- 08:48 UTC にインシデントは解決

1件のコメント

GN⁺ 2026-05-27

Hacker Newsの意見

コメントはhttps://news.ycombinator.com/item?id=48278090に移動されました