WeatherNext 2: Google DeepMindの最先端気象予測モデル

(blog.google)

5 ポイント投稿者 GN⁺ 2025-11-19 | 1件のコメント | WhatsAppで共有

WeatherNext 2は、AIを活用してグローバルな気象予測の精度と効率を大幅に向上させたモデル
単一のTPUで1分以内に数百の気象シナリオを生成し、従来モデルより8倍高速な予測速度を提供
新しい**Functional Generative Network(FGN)**構造により、物理的に一貫した予測を維持し、1時間単位の解像度までサポート
予測データはEarth EngineとBigQueryで利用可能で、Vertex AIの早期アクセスプログラムを通じてカスタム推論機能を提供
この技術は、Search、Gemini、Pixel Weather、Google Maps PlatformなどGoogleの各種サービスにおける気象機能を強化する

WeatherNext 2の概要

Google DeepMindとGoogle Researchが共同開発したWeatherNext 2は、AIベースの気象予測モデルで、従来比8倍の速度と1時間単位の解像度を提供
- 単一入力から数百の可能性のある気象シナリオを生成
- 予測は単一のTPUで1分未満で完了し、従来の物理ベースのスーパーコンピュータモデルでは数時間を要する
このモデルは、**気温、風速、湿度などの99.9%の変数と予測リードタイム（0〜15日）**において、従来モデルより優れた性能を示す
WeatherNext 2は、地球全体の高解像度予測を可能にし、気象機関の意思決定支援にも活用される

新しいAIモデリング手法

WeatherNext 2は、**Functional Generative Network(FGN)**という新しいAIモデリング手法を採用
- モデル構造に直接**「ノイズ」を注入することで、予測結果が物理的に現実的で相互に関連した状態**を維持する
広告
このアプローチは、**「マージナル（marginal）」と「ジョイント（joint）」**予測の両方に有効
- マージナルは個別要素（例: 特定地点の気温、高度別の風速、湿度）
- ジョイントは複数要素が組み合わさった大規模な気象システムで、猛暑地域や風力発電量予測など複合現象の分析に不可欠
モデルはマージナルデータのみで学習するが、ジョイントパターンを自ら学習して複合予測を実行する

データアクセスと活用

WeatherNext 2の予測データは、Google Earth EngineとBigQueryで公開
- Earth EngineデータカタログとBigQuery Analytics Hubを通じて参照可能
広告
Google Cloud Vertex AIでは、早期アクセスプログラムを通じて**カスタムモデル推論（inference）**機能を提供
この技術は、Search、Gemini、Pixel Weather、Google Maps PlatformのWeather APIなどに統合され、今後はGoogle Mapsの天気情報機能にも適用予定

研究から実用へ

WeatherNext 2は、研究成果を実際の応用へ拡張した事例
- Googleはこの技術を通じて、世界中の研究者、開発者、企業が複雑な問題解決に活用できるよう、ツールとデータを公開している
今後は、新たなデータソースの統合とアクセス性の拡大を通じてモデル性能を継続的に改善する計画
Googleは、地理空間AI研究エコシステムの強化に向けて、Earth Engine、AlphaEarth Foundations、Earth AIなどと連携

追加資料

WeatherNext 2に関する**論文（arXiv: 2506.10772）**を公開
開発者向けドキュメント、Earth Engineデータカタログ、BigQueryクエリ例、Vertex AI早期アクセス登録ページを提供
関連モデルとして、GenCast（極端気象予測）とGraphCast（全球高速予報）もあわせて紹介

1件のコメント

GN⁺ 2025-11-19

Hacker Newsのコメント

私はこの分野にかなり深く関わっているのだが、部外者にとって興味深い点は、neuralgcm や WeatherNext 1 のような最新モデルがいずれも CRPS という目的関数で学習されていることだと思う
この手法は一般的な ML 分野ではほとんど使われず、天気予報でしか見たことがない
要するに、入力にランダムな ノイズ を加え、通常の損失（L1 など）を最小化しつつ、同時に異なるノイズ初期値から生成された2つの結果の差を最大化するよう学習させる
こうしたアプローチがいつか従来の GenAI にも適用されるのか気になる
- ノイズは入力ではなくモデル パラメータ に加えられるのではないかと思う
  これは Variational Noise論文を思い出させる
  もし入力にノイズを加えるのなら、DINO のような SSL手法 に近そうだ
- 最近の最適化作業で、意図的に異なる2つの出力を作りたかったのだが、よいヒューリスティックが見つからなかった
  GenAI とは無関係の作業だったが、この CRPS方式 があれば役立ったかもしれない
- このアプローチは Variational Autoencoder を思い起こさせる
- なぜ L2 損失ではなくこの方式を使うのか、その目的が気になる
- モデルは過去データを学習しているが、実際の予測時には新しい観測値で複数回 アンサンブル実行 することを明確にしておくべきだ
最近、Google 検索の地域天気予報が目に見えて不正確になったと感じている
数週間前から夜間の気温が氷点下まで下がると予報し続けていたが、実際にはそうならなかった
私の地域は予測が難しい場所ではあるが、Google 以外のソースのほうがはるかに正確だった
もしかすると新モデルの ロールアウト がすでに行われて悪化したのか、あるいは逆に近いうち改善される予定なのか気になる
地域単位でモデルごとの予測性能を比較できるサイトがあるかも知りたい
- Open-Meteo の無料 API が便利
  モデルごとの予報データをグラフで可視化でき、主要モデルを複数含んでいる
  ただし WeatherNext はまだない
- 地域別のモデル性能比較はあまりにも当然の機能に思えるのに、実際にはほとんど存在しない。理由が気になる
発表では速度とシナリオ数の向上が強調されていたが、精度向上 についての説明が不足していると感じた
「WeatherNext 2 は8倍高速で1時間単位の解像度を提供する」という文句は魅力的だが、結局ユーザーである私が欲しいのは 正確な予報ひとつ だけだ
- 重要なのは、この製品の エンドユーザー は一般人ではないということだ
  CRPS スコアのような指標は専門家向けで、これは従来のアンサンブルモデルの under-dispersion 問題 を解決するためのものだ
  こうした改善が、最終的に一般ユーザーが目にする 決定論的予報 の精度向上につながる基盤になる
  関連技術は WeatherBench で確認できる
- 一般ユーザーの立場からすると説明が不足していた
  天気予報の中核は何十年も前から アンサンブルシナリオ という概念で、「降水確率 70%」とは100個のシナリオのうち70個で雨が降るという意味だ
  つまり、たったひとつの『正確な予報』というものは存在しない
- ユーザーとしては 不確実性のばらつき も見たい
  多くの天気アプリはこれを視覚的にうまく示している
- 最も重要なベンチマークは精度であり、既存の物理ベースモデル（GFS、ECMWF など）と比較すべきだ
  こうしたモデルは巨大な HPC クラスターで動いているが、中央で計算して結果だけ配布すればよいので効率的だ
- 過去データで学習されたモデルではあるが、物理ベースの要素が不足しているように見える
  高性能を実現するために必要な 物理的根拠 がどこにあるのか気になる
Google の天気予測エンジンはすでに非常に優秀で、今シーズンの ハリケーン進路予測 は驚くほど正確だった
一方で米国政府の Global Forecasting System(GFS) は悪化してきている
関連記事: Ars Technicaリンク
- 「GFS が悪化している」とは具体的にどういう意味なのか気になる
論文を読んだが、モデルをどれくらいの頻度で 再学習 する必要があるのかは明記されていない
地域ごとの分布を学習する構造なら、時間の経過とともにパターンは変化するので、定期的な再学習が必要になりそうだ
もし毎週3日ずつ学習しなければならないなら、それは現実的には コスト問題 になり得る
第二次世界大戦時代の逸話を思い出した
Kenneth Arrow が長期予報はランダムな推測と変わらないことを発見したが、上官は「役に立たないとわかっていても計画には必要だ」と答えたという
- 統計の授業で聞いた話では、実際には 好天のほうが悪天候よりずっと多い
  だから「雨は降らない」とだけ言っても90%は当たる
  それなのに昔の天気予報はそれより精度が低かったというのが皮肉だ
  最近のモデルは本当に驚くほど正確で、10日予報でさえほぼ当たる
- 古代の占術も単なる迷信ではなく、決断できないときにランダムな選択を通じて行動を促す 意思決定ツール だったという解釈がある
- Eisenhower の言葉どおり、「計画は役に立たないが、計画する過程は不可欠だ」という教訓を思い出す
最近 Google の標準天気アプリの精度が落ちた
2〜5度ほどずれることがよくあった
HN で勧められていた Weawow アプリを使ってみたが、名前はいまいちでも精度は素晴らしい
これまで使った中でいちばん満足している
依然として AIベースの天気予報 は実生活では遠い存在に感じる
親世代がテレビの天気予報を見ていた頃と比べても、体感的な精度はそれほど変わらない
晴れ予報の日に土砂降りになったり、雨予報だったのに一日中晴れていたりすることがまだある
消費者の立場では、技術の進歩が実際の 体感的な信頼性 につながっていないように思える
- データはある: Our World in Data によれば、予報精度は着実に向上している
- 問題はデータの 表現方法 だ
  たとえば Apple Weather で「雨の日」と表示されるのは、その日のどこかの時点で降水確率が高ければそう表示されるためだ
  実際には朝5時だけ雨で、残りは晴れかもしれない
  ユーザーがデータを解釈できる必要があり、AI が個人の関心に合わせて予報を 文脈化 してくれるとよい
- 予報は着実に改善しているが、段階的な進化 であって突然の革命ではない
  たとえば Weathergraph に rainbow.ai の短期降水予測を追加したが、これまで使った中で最も正確だった
  レーダーデータ自体もノイズが多く、それを整える過程自体がすでに MLモデル だ
- 実際には精度は大きく向上している
  30年前の1日予報の精度が、今では4日予報の精度に相当する
  ただし、私たちが天気をより深く理解するようになったわけではなく、計算能力 が飛躍的に増えた結果だ
- 一般的な天気予報も依然として完璧ではない
このモデルをどこで使えるのか気になった
以前の Dark Sky のような超ローカル予報を探している
- 研究成果はすでに実サービスに統合されている
  WeatherNext 2 の予報データは Earth Engine と BigQuery で利用可能で、Vertex AI ではカスタム推論向けの早期アクセスプログラムも実施されている
  さらに Search、Gemini、Pixel Weather、Google Maps Platform Weather API にも適用されている
- 個人的には Windy アプリがいちばん好きだ
  モデル間の予報差を比較でき、風ベクトルアニメーション が視覚的にとても面白い
- HRRR モデルも非常に優秀だ
  1時間ごとに更新され、15分単位の解像度で18時間、1時間単位で48時間の予報を提供する
  HRRRサイト
- 以前の Weather Underground は個人気象観測所のデータを統合していた
  IBM に買収されて以降かなり変わったが、そのプロジェクトがまだ生きているかもしれない
- Google 公式の Weather APIリンクも参考になる
今シーズンで最も正確だった ハリケーン予測 を提供したモデルが、今回発表されたものと同じモデルなのか気になる
関連記事: Ars Technicaリンク

WeatherNext 2: Google DeepMindの最先端気象予測モデル

WeatherNext 2の概要

新しいAIモデリング手法

データアクセスと活用

研究から実用へ

追加資料

関連記事

1件のコメント

Hacker Newsのコメント