- 米コロラド州ボルダーのNIST時間施設が停電で数日間停止し、予備発電機の故障によりUTC基準時と最大5μsの誤差が発生
- NTPサーバー6台を運用するこの施設は、発電機故障にもかかわらず時間偏差を5μs以下に維持し、一般ユーザーへの影響はほとんどなかった
- 科学研究機関や航空宇宙企業など精密タイミングに依存する組織には影響の可能性があり、NISTが直接連携中
- GPSおよびWWV-Ft. Collinsシステムが正常にバックアップとして機能し、米国全体の時間インフラの冗長性が実証された
- 今回の事例はGPS依存のリスクとタイミングインフラの脆弱性を示し、代替PNTシステム開発の必要性を浮き彫りにした
停電と時間誤差の発生
- コロラド州ボルダーのNISTキャンパスが時速160km(100mph)超の強風により、電力会社が火災リスク防止のため送電を停止
- キャンパス全体が封鎖されて職員の立ち入りが不可能となり、復旧が遅延
- 予備発電機の1台が2日後に故障し、NTPサーバーの**主要集合体(clock ensemble)**への電源が断たれた
- Time Realization and Distribution Groupの責任者Jeff Shermanは、不正確な時刻配信を防ぐためサーバーを停止する可能性まで検討
- 幸い、別棟の時計システムが時刻信号を送信でき、一部の職員が現場に残って非常用電源の再ルーティングで復旧
- バッテリーバックアップ(UPS)が発電機交換まで時刻を維持し、結果としてUTCとの差は5μs以下に収まった
NTPサーバー運用と影響範囲
- NISTは6台の主要NTPサーバーを通じてインターネット時刻サービスを提供
sntp time-a-b.nist.gov コマンドの結果では、一般ユーザーの**ネットワーク遅延誤差は約35ミリ秒(35,000μs)**であり、5μsの誤差は無視できる水準
- そのためサーバーは停止せず運用を継続し、精度は平常時より約5,000倍低かったが、大半のユーザーには影響がなかった
- 大学、航空宇宙、科学研究機関などは微小な誤差にも敏感なため、NISTがこれらと直接連携して補正作業を進行
- 米国のGPSシステムがWWV-Ft. Collinsキャンパスへ自動切り替えされ、全面的なサービス停止なく維持された
時間インフラの脆弱性と代替技術
- 筆者はRaspberry PiベースのGPS時計2台を使って独自のNTPサーバーを運用しており、GPS依存のリスクを指摘
- CISAは米国のGPSへの過度な依存リスクをすでに警告しており、政府は代替PNT(Position, Navigation, Timing)技術の開発を進めている
- **Broadcast Positioning System(BPS)**がGPS代替候補として議論されている
- 筆者はルビジウム原子時計とGPSDOを用いて数ナノ秒単位の精度を維持し、GPS信号障害時でも数か月間時刻を維持可能
- しかし科学、RF、メディア、金融分野などではナノ秒単位の精度が要求され、多くがNIST基準時を参照している
教訓とシステム信頼性
- 今回の出来事はNISTの災害対応体制が実際に機能したことを証明し、「微小な誤差の中でも正常運用」を示した
- 冗長電源、複数時計、GPSバックアップ体制が組み合わさり、全米の時間インフラの安定性を維持
- 筆者は「タイミングインフラは非常に脆弱であり、多重バックアップが不可欠」だと強調
- マイクロ秒単位の危機的状況でもNISTチームが問題を解決し、ほとんどのユーザーが気付かないほどに復旧した
1件のコメント
Hacker Newsの意見
NISTのTime Over Fiber(TOF)プログラムが最も興味深かった
このサービスは光ファイバーを通じて高精度な時刻配信を提供しており、一部の直接接続されたリンクが影響を受けたとのこと
こんなサービスは初めて知ったが、おそらく金融業界(HFT、FINRA規則4590関連)や5G同期、あるいはGoogle SpannerのようなグローバルDB向けに使われる可能性があると思う
関連リンク: NIST告知, TOFプログラム説明, FINRA Rule 4590, 5G同期関連の記事
リアルタイム取引システムではGPSで十分で、マイクロ秒単位の正確さよりも**レイテンシー(latency)**のほうが重要だった
規制要件も1秒の誤差を許容しており、TOFレベルの精度は求められていない
たとえば重力波とガンマ線バーストを同時観測するときのように、広い地域のデータを高精度に同期する必要がある場合に使われる
たとえばSchriever Space Force Baseのような場所がGPSの主要な制御拠点だ
また、GNSS信号が途切れたときに備える地上ベースの時刻網としても重要だ
関連記事: 中国の高精度地上タイミングシステム
実際にはBoulderサーバーだけに同期の問題があった
「NIST全体がオフライン」という表現は大げさだ
サーバーステータスページによれば、16台のIPv4 NTPサーバーのうち影響を受けたのは5台だけで、残りは正常に動作していた
ほとんどの利用者はそもそも上位サーバーを直接使うべきではないので、問題はほとんどなかった
個人的にはpool.ntp.orgの利用を勧める
エラーが伝播する可能性はないのだろうか? pool.ntp.orgは障害や誤差の相関を避けるように分散されているのだろうか
細かい指摘だが、UTCは"Coordinated Universal Time"の略だ
英語とフランス語のどちらにも偏らないように文字順が調整されている
UT0、UT1、UT2など既存の略語体系との一貫性も考慮された
話題から少し外れるが、chronyを褒めたい
さまざまなハードウェア環境で、従来のOS標準NTPクライアントよりはるかに安定していた
それだけ性能と安定性が実証されているということだ
このスレッドがあまりに面白くて、つい読み続けてしまう
今日Adderallを飲みすぎたせいかもしれない
知っているHFTトレーダーの何人かは今回の件で数十万ドルを稼いだらしい
意図的にシステムを利用したのか、それとも単なる運のいいグリッチだったのか知りたい
昔は「間違った時刻を送るくらいなら、まったく送らないほうがましだ」と言われていたが、今回はなぜ誤差のある時刻を送ったのかよく分からない
NISTメーリングリストによれば、インターネット伝送では通常1msレベルの不確実性が生じるため、科学用途の精度とは次元が違う
当時は電源も管理アクセスも両方失われており、時計がどれだけずれているか分からない状態だった
もし電源復旧直後に誤った時刻が配信されれば、世界中のシステムが同期エラーを起こしかねなかった
だから**安全に遮断(scram)**するほうがよかった
関連短編小説: The Time Rift of 2100
たとえば火災報知器が誤って「問題なし」と知らせるより、まったく応答しないほうが安全だ
「NISTの時計が大惨事寸前だった」という動画タイトルが理解できない
単に別のキャンパスで時刻補正すればいいだけではないのか?
本当にそこまでの精度が必要な事例があるなら、専門家の説明が必要だ
人々が正確な時刻を必要とした最も重要な事例が気になる
White Rabbitを使ってRF電力システムとデータ収集装置をナノ秒単位で同期している
TrueTimeによって世界規模のトランザクション整合性を保証している
もしGPS衛星がそれだけずれていたら、位置精度はLoran-C並みまで落ちるだろう
NPRの記事から始まった話だ
原文リンク