1 ポイント 投稿者 GN⁺ 2024-07-06 | 1件のコメント | WhatsAppで共有

Diffusion Forcing

Diffusion Forcing の紹介

  • "Diffusion Forcing" は、"teacher forcing" と "diffusion models" に由来する名前
  • Diffusion Forcing は、次トークン予測モデルとフルシーケンス拡散モデルの主要な強みをどちらも活用できる
  • 1回の学習で、さまざまなサンプリング時刻に柔軟に動作できる

Diffusion Forcing の動作原理

  • シーケンス拡散を学習しつつ、各トークンに異なるノイズレベルを適用する
  • 拡散のノイズは、さまざまなレベルのマスキングとして見ることができる
  • サンプリング時にシーケンス全体で異なるノイズレベルを使うことで、柔軟な動作を実現できる

動画予測

  • Diffusion Forcing を使った動画予測は、安定して一貫した結果を提供する
  • DMLab および Minecraft データセットで、Diffusion Forcing は既存手法より優れた性能を示す

スライディングウィンドウなしの無限ロールアウト安定化

  • Diffusion Forcing は、学習時の最大シーケンス長よりはるかに長い動画をロールアウトできる
  • スライディングウィンドウなしで RNN をロールアウトできる
  • DMLab および Minecraft データセットで、2000フレーム以上のロールアウトが可能

Diffusion Planning

  • Diffusion Forcing は、テスト時にガイダンスを使ってプランナーとして活用できる
  • 各トークンを [a_t, o_{t+1}] と定義し、因果関係を明示的にモデリングする
  • 新しい観測が行われた後、後続推定によって更新できる

長期模倣学習

  • 多くの実世界タスクはマルコフ特性を持たず、長期記憶を必要とする
  • ロボットアームが2つの果物スロットを入れ替える作業で、成功した結果を示す
  • Diffusion Forcing は、テスト時に見ていない妨害要因に対しても頑健に動作できる

GN⁺の意見

  • Diffusion Forcing は、次トークン予測モデルとフルシーケンス拡散モデルの長所を組み合わせ、柔軟なサンプリングを可能にする
  • 動画予測とロールアウトで既存手法より優れた性能を示しており、実用的な応用可能性を高める
  • 長期模倣学習での成功は、Diffusion Forcing の強力なフィードバック制御能力を示している
  • Diffusion Forcing の安定化効果は、さまざまなシーケンス長での活用可能性を高める
  • 新しい技術を採用する際には、モデルの複雑さと計算コストを考慮する必要がある

1件のコメント

 
GN⁺ 2024-07-06
Hacker Newsの意見
  • シーケンスマスキングのアイデアと拡散モデルを組み合わせた新しいアプローチを提案している

    • 各ピクセルの「不確実性」レベルを追跡し、それを拡散モデルの「ノイズ」レベルとして用いる
    • 画像の特定部分を先に確定できるため、迷路解決などに活用できる
    • ロボットアームの制御にも使われた
    • タイトルはアイデアを過小評価している。これは「分数マスキング」を行う方法だ
    • コードベースについて知りたいことが多い。迷路追跡タスクや動画拡張タスクをどう設定しているのか、ロボットアームをどう接続しているのか、など
    • アーキテクチャ自体にもさらなる研究と説明が必要だ
  • 新しい事前学習なしで、既存のテキスト生成LLMを拡散技術と組み合わせられる研究やツールがあるか気になる

    • Tree of ThoughtsやMCTSなど似たアプローチはあるが、トークンレベル生成により近いものを探している
    • 小さなGPT / Phi 3 / Gwenモデルでも動作するのか気になる
  • Russは拡散を研究中だ。ロボティクスへの応用可能性が非常に高そうだ

  • この分野で働く者として、この研究は非常に難解な形で提示されている

    • 解決しようとしている問題が何なのか、新しい生成モデルを提案しているのか気になる
  • 学習時間について見落としている点があるのか気になる。トークンごとにノイズを加えると学習が大幅に遅くなるのか気になる

    • 素晴らしい論文だ
  • とても面白い研究だが、なぜ「Diffusion Forcing」と呼ばれているのか気になる