1 ポイント 投稿者 GN⁺ 2024-09-17 | 1件のコメント | WhatsAppで共有
  • 私たちは Jayesh、Cris、Nikhil で、Silurian チームの一員です。Silurian は地球をシミュレーションする基盤モデルを構築しており、まずは天気予報から始めています。最近のハリケーン予測結果はこちらで可視化できます

  • 天気予報があと1日早く分かったら、その価値はどれほどあるでしょうか? 従来の予測システムでは、予測精度が1日分向上するのに10年かかっていました。しかし近年は、GPU と現代のディープラーニング技術のおかげで、この速度が加速しています

  • 2022年以降、NVIDIA、Google DeepMind、Huawei、Microsoft などで天気のディープラーニングシステム研究が活発に進められています。これらのモデルは物理法則をほとんど組み込まず、データだけから予測を学習します。驚くべきことに、このアプローチは従来の大気物理シミュレーションよりも優れた予測を提供しています

  • Jayesh と Cris はそれぞれ Microsoft の ClimaX と Aurora プロジェクトを率い、この技術の可能性を直接体験しました。彼らが構築した基盤モデルは、天気予報のゴールドスタンダードと見なされる ECMWF の予測を改善し、使用した学習データはごく一部にすぎませんでした。Silurian の目標は、これらのモデルを可能な限り拡張し、物理予測の限界まで押し広げることです。最終的には、エネルギーグリッド、農業、物流、国防など、天候の影響を受けるあらゆるインフラをモデル化することです。つまり、地球をシミュレーションするということです

  • この夏、私たちは GFT(Generative Forecasting Transformer)という 1.5B パラメータのフロンティアモデルを構築しました。このモデルは約11kmの解像度で、最大14日間の全球天気をシミュレーションします。過去記録には極端気象データが不足しているにもかかわらず、GFT は 2024 年のハリケーン進路予測で非常に優れた成果を示しています。こちらで私たちのハリケーン予測を確認できます。私たちは cambecc/earth というオープンソースの天気可視化ツールを使ってこれを可視化しています

  • HN でのローンチにとても興奮しており、皆さんの意見をぜひ聞きたいです

GN⁺のまとめ

  • Silurian は、天気予報を出発点として地球をシミュレーションする基盤モデルを構築する企業です
  • 近年のディープラーニング技術の進歩により、天気予報の精度は大きく向上しています
  • Silurian の GFT モデルは、極端気象データが不足しているにもかかわらず、優れた予測性能を示しています
  • この技術は、エネルギー、農業、物流など多様なインフラに適用できる可能性を持っています
  • 類似機能を持つプロジェクトとして、NVIDIA や Google DeepMind の天気ディープラーニングシステムがあります

1件のコメント

 
GN⁺ 2024-09-17
Hacker Newsのコメント
  • 熱帯低気圧のアンサンブル予測ができるようになってうれしい

    • MLモデルとECMWFのHRESモデルを比較している点にはがっかりした
    • HRESは平均的な天気の最適推定ではなく、あり得る天気の単一の実現である
    • NeuralGCMはWeatherBenchのリーダーボードで上位にいる
    • モデルの性能をWeatherBenchで比較してほしい
  • 物理学を組み込んでいないモデルが、データだけでより良い予測をしている

    • 「言語学者を解雇するたびに性能が上がる」というNLPの格言は、物理学者にも当てはまる
  • Silurianが地球をシミュレーションする基盤モデルを構築している

    • 成功したら、次に何をシミュレーションしたいのか気になる
  • ClimaXの商業的ポテンシャルに興奮している

    • 特定の業界から商業的ポテンシャルについて連絡があったのか気になる(例: 天然資源探査)
  • 非営利団体として土地に関する類似モデルを構築している

    • land maskをland embeddingに置き換える手助けをしたい
    • これは地域効果のダウンスケーリングに大いに役立つはず
  • Googleが昨年公開したGraphCastと比べてどう違うのか気になる

  • 天気モデルはやや混乱する

    • MLの手法が物理ベースのシミュレーションより数値的に安定しているのか気になる
    • 計算要件の面でどう比較されるのか気になる
    • 以前、FORTRANからVerilogへモデルを変換した経験がある
  • 予測不可能な地震にこのアプローチを適用したことがあるのか気になる

  • このアプローチは「The Bitter Lesson」のもう一つの事例のように思える

  • 今後さらに何をシミュレーションするつもりなのか気になる

    • サンフランシスコで自然言語でオブジェクトを検索できるデモを構築した
    • Clay embeddingを使ってみたが、CLIPで微調整したOSM caption embeddingより性能が劣っていた