xLSTMを活用した長期時系列予測: XLSTMTime
(arxiv.org)xLSTMTime: Long-term Time Series Forecasting With xLSTM
- 近年、Transformerベースのモデルは多変量長期時系列予測(LTSF)で顕著な成果を示してきた。しかし、高い計算コスト、時間的ダイナミクスの捉えにくさ、長期依存関係の管理といった課題に直面している
- 単純な線形構造を持つLTSF-Linearの登場により、Transformerベースのモデルを上回る性能が示され、時系列予測におけるTransformerの有用性が再評価されることになった
- これに対応して、この論文は最近のアーキテクチャである拡張LSTM(xLSTM)をLTSFに適用した結果を提示する。xLSTMは指数ゲーティングと、より高い容量を持つ修正メモリ構造を含み、LTSFに適した潜在力を持つ
- 私たちが採用したLTSFアーキテクチャであるxLSTMTimeは、既存のアプローチを上回る。複数の実世界データセットでさまざまな最先端モデルとxLSTMTimeの性能を比較した結果、優れた予測能力が実証された
- 私たちの研究結果は、洗練された再帰アーキテクチャがLTSFタスクにおいてTransformerベースのモデルに対する競争力のある代替となり得ること、そして時系列予測の地形を再定義する可能性を示唆している
GN⁺のまとめ
- この論文は、Transformerベースのモデルの限界を克服するためにxLSTMを導入し、長期時系列予測で優れた性能を示している
- xLSTMTimeは、指数ゲーティングと修正メモリ構造を通じて、既存モデルを上回る予測能力を実証している
- この研究は、時系列予測における再帰アーキテクチャの可能性を再び注目させ、Transformerベースのモデルに対する新たな代替案を提示している
- 類似の機能を持つプロジェクトとしては、FacebookのProphet、AmazonのDeepARなどがある
1件のコメント
Hacker News のコメント
ここ数年、Transformer ベースのモデルが多変量の長期時系列予測で注目されているのは確かだが、非ディープラーニングモデルより一般に優れているのかは疑問
私の理解ではそうではなかったが、この分野をそれほど closely に追っているわけではない
ディープラーニングモデルは季節性を学ぶのは得意だが、複雑なトレンドやショックはうまく扱えない傾向がある
経済・金融データは季節性が単純でトレンドが複雑なことが多いので、ディープラーニングはかなり苦戦するように思う
この論文には同意する。私が使った中で良かったディープラーニング時系列アーキテクチャは、DeepAR や N-BEATS のように MLP やリカレントニューラルネットワークの単純な拡張に近いもので、Transformer ベースの構造は、特に最近大量に出ている Transformer ベースの基盤モデルまで含めて、本当にひどかった
ただしディープラーニングモデル同士でも、Transformer、双方向 LSTM、通常の MLP、VAE などで性能差は非常に大きかった
その友人は、Transformer ベースの構造は木モデルに比べ、比較的少ない労力でも時系列タスクでまずまずの性能を出しやすいと言っていた
私の理解では、十分にパラメータをチューニングすれば木ベースモデルが通常は Transformer に勝てる。ただし TimeGPT のようなモデルは、広範なチューニングなしでもそこそこの性能を出すので、素早い実装には魅力的
私の仕事の一部は実際に、経済分野のナウキャスティングと予測モデルを作ること。インフレ率、GDP のような経済指標と、市場流動性のような金融指標を扱っている
まだ論文は読めていないが、「Transformer は得意なことでは素晴らしいが、LSTM 系モデルもなお非常に価値がある」という全体的なトーンには完全に同意する
これは Google の AI ベースの天気予測モデルとどう関係があるの?
https://deepmind.google/discover/blog/graphcast-ai-model-for...
参考までに、Graphcast は少なくとも大規模な全球パターン予測では、すべての従来型の全球単一予測を上回っている。Z500 のような指標で、おおむね 3〜10 日先の区間が基準
ECMWF には Graphcast 派生の AIFS があり、数年以内にそれか類似のものを運用環境に載せる可能性が高い
予測ツールとして売り出されているなら、時系列のイベント分類には適用されないのだろうか?
論文中のデータセットリンクが動かないのが残念。修正されるといい
最高のディープラーニング時系列モデルは、ヘッジファンド内部に非公開で存在しているはず
ヘッジファンドでうまくいく方法でも、データ量やデータの性質が異なり、必要な帰納バイアスが少ない、または異なる領域では悪い可能性がある
時系列予測は決定論的な領域で最もよく機能する
公開されている LLM、AI、ディープラーニング、機械学習手法の中で株式市場に効くものはない。本当に一つもない。全部試した
誰かの時系列予測手法が実際に効いたなら、それを公開してはいなかったはず
これを XSLT と読み間違えた
誰かがこれで株価予測をしようとして全財産を失う日が楽しみだ