1 ポイント 投稿者 GN⁺ 2025-10-30 | 1件のコメント | WhatsAppで共有
  • Microsoftのクラウドサービス Azure障害(outage) が発生したことが報告された
  • Hacker Newsの投稿は、ユーザーが直接障害発生を知らせる告知形式で作成されている
  • 障害の原因、影響範囲、復旧状況などは本文で具体的に言及されていない
  • 投稿はAzureサービス利用者への注意喚起を目的としている
  • クラウドインフラへの依存度が高い企業や開発者にとって、運用リスク認識の重要性を改めて想起させる事例である

Azureサービス障害の報告

  • Hacker Newsの「Tell HN: Azure outage」投稿は、Azureプラットフォームで障害が発生した事実を知らせている
  • 本文内容は抽出されておらず、詳細な原因、影響地域、サービス種別などは確認できない
  • 投稿の形式から、ユーザーが直接障害を目撃してコミュニティに共有したものと見られる

追加情報

  • Microsoft Azureは世界的に利用されているクラウドコンピューティングサービスである
  • 本文には復旧の進捗状況や公式発表の内容は含まれていない
  • 原文に追加情報はない

1件のコメント

 
GN⁺ 2025-10-30
Hacker Newsの意見
  • 重要なサービス、特に公共交通機関がクラウドに完全依存していてバックアップがないのは、今でも驚きだ
    オランダでは今日は総選挙の投票日だが、Azure障害のせいで列車が数時間遅延または運休し、投票できなかった人もいた

    • 投票が1日だけなのか気になる。1日だけなら、こうした問題はいつでも起こり得る。複数日にわたって実施するのには明確な理由があるはずだ
    • 2025年にもなって、いまだに直接投票所へ行かなければならないのが信じられない。私は20年以上郵便投票をしていて、1か月前に投票用紙を受け取り郵送している。いつかはオンライン投票で紙の無駄をなくしてほしい
    • 投票日は祝日に指定すべきだと思う
    • ただし2つのクラウドに展開すると税金の無駄だと非難される。結局、信頼性コスト削減のどちらかを選ばなければならない
    • ニュージーランドも今回の障害を免れなかった。政府のRealMEサービス(納税申告、パスポート申請など)が止まり、大きな混乱があった
  • Azureステータスページの告知によると、Azure Statusで16:00 UTCごろFront Doorの問題により一部サービスが停止した
    ポータルにアクセスできない顧客にはPowerShellやCLIでアクセスするよう案内し、AFDからポータルを切り離して復旧中だという

    • 17:17 UTCの更新では、原因は誤った構成変更である可能性が高いと明らかにした。すべての変更を停止し、以前の正常な状態へロールバック中とのこと
    • ヨーロッパではAFDがしばしば地域単位でダウンする。その半分以上は公式には報告すらされない
    • DNSに言及があるのを見ると、以前のAWS障害に似ているのか気になる
    • ステータスメッセージではAFDの問題を認めていたが、ポータルをAFD依存なしで動かすための対応しか触れられていない。AFDを使っているこちらとしては長期戦になるかもしれない
    • ポータルだけでなくmicrosoft.comもダウンしている
  • Starbucksのモバイル注文が使えず、Grubhubで注文しようとしたらそちらも落ちていた。結局HNに来て原因を見つけた

    • HNは地下室のサーバー数台で動いているので、クラウドより安定しているようだ
    • sysadmin subredditはHNより1時間以上早く障害を検知していた。当番エンジニアたちが即座に気づいた
    • 以前のAWS障害のときもStarbucksアプリは止まっていた
    • ドライブスルーの列が進まなくておかしいと思ったが、これが原因だった
    • 私のNetatmo空気質センサーも通知が止まっていた。家の中のデータなのに、なぜわざわざクラウドを経由しなければならないのか疑問だ
  • Azure障害はAWS障害ほど衝撃的ではない。
    最初はMicrosoftエコシステムの垂直統合が魅力的だったが、実際に使ってみるとリソース割り当てがあまりにも不便でAWSに戻った
    今はGCPを一度も使ったことがないが、むしろそちらのほうが良さそうだと思っている

    • 以前Azureを初めて使ったとき、メニューが画面全体を覆うほど複雑だった。そのとき初めてクラウドで道に迷う感覚を味わった
    • 正直、GCPはかなり良い。もっと多くの人に使ってみてほしい
    • ただし規制が厳しい業界ではMicrosoftしか許可されない。AWSやGCPは最初から検討対象にすらならない
    • Microsoftは公共部門の規制対応が上手く、政府機関の顧客が多い。だからAzure障害は公共サービスにより大きな影響を与える
    • 実際、MSが落ちてもGithubが無事なら気づかないかもしれない
  • 今、決済システムが止まっていて、半分閉店状態のスーパーマーケットの中に立っている

    • 以前働いていたスーパーにはオフラインモードがあり、決済承認に失敗すると客が無料で商品を持ち帰ることがあった
    • 近所のFamily Dollarはネットワーク問題で月に2日は必ず止まる。私がバックアップ回線を提供して売上の半分をもらえるなら、お互いにウィンウィンだろう
    • 今回のスーパーは完全停止ではなかったが、決済段階でタイムアウトしているようで非常に遅かった
    • 90年代に機械式レジが電子式に置き換わっていた時代を思い出す。最近ではカード端末がブートループに陥り、花代を現金で払った。パートナーは店員が税金なしで現金を懐に入れようとしているのだと冗談を言っていた
    • どんな小売店でも最低限オフライン決済機能は持つべきだと思う
  • もうGoogle Cloud RunCloudflare Workersへ移るべきかと考えている
    個人的にはHetznerは価格性能比が良くて信頼できる印象がある
    関連の比較動画もあったし、vpspricetracker.comのようなサイトにGeekbenchスコアも併記されていると良いと思う

    • Hetznerも悪くないが、Googleレベルの安定性ではないだろう
    • いっそmulti-provider構成にするほうが良いのではないかと思う
    • ちなみに4か月前のCloudflare障害もGoogle Cloudの問題に起因していたことがある
  • この2年間、サービスを少しずつAzureから移している。
    最後に残っているのは静的アセット用バケットとMatomo分析用VMだけだが、Front Doorの体験があまりにもひどかった。今日の件で完全にCloudflareへ移行すると決めた

    • 実際、今年はすべてのクラウドが大きな障害を経験している。もはやどこも絶対的な信頼性は保証できない
    • それでも、こうした危機的状況を好機に変えることが重要だ
  • login.microsoftonline.comがダウンしてSSOが全社的に停止した。microsoft.comも一緒に死んでいた

    • 米国テナントではログインフローが止まるが、ヨーロッパ(特にgermany-west)では正常に動作している
    • うちの会社はSSOと365は大丈夫だが、管理ポータルだけ接続不可だ
    • 今では**NASSO(Not A Single Sign On)**状態だと冗談を言っている
    • 最近はOffice 365障害がほぼ毎週のように発生しているのに、いまだにこれを導入するのが不思議だ
  • VSCodeのダウンロードに失敗する
    ダウンロードリンクが死んでいる

    • 今日wingetも断続的に失敗している。UniGetUIを使っているが、Microsoft関連パッケージだけ一覧更新ができない
    • Azure DevOpsのリポジトリにもアクセスできず、作業が止まっている
    • いっそVSCodiumを使えという提案もある
  • 私たちのチームは100% Azureベースだが、今回の障害の影響はない
    1年前にFront Doorを捨ててから安定している。以前は新しいデプロイのたびに問題が起き、一度はホームページにMicrosoftバナーが表示されるというとんでもないこともあった

    • Front Door OriginTimeout問題を1年以上経験した末に移行した。ただしAPIサーバーは今もAFDの背後にあるため、今回も影響を受けている
    • 障害よりさらに深刻なのはコンテンツ汚染の問題だ。購読もしていないMicrosoftバナーが表示されるのはかなり深刻なことだ