MIT 6.S184: フローマッチングと拡散モデル入門
(diffusion.csail.mit.edu)フローマッチングと拡散モデルの紹介
- MITのコンピュータサイエンス講義 6.S184 は、確率微分方程式を活用した生成AIに関する講義。
- 拡散モデルおよびフローベースモデルは、画像、動画、音楽など多様なデータモダリティにおいて、生成AIの最先端技術として定着している。
- この講義は、これらのモデルの数学的基礎をゼロから構築することを目標としており、受講者は授業の終わりまでに簡単な画像拡散モデルを自ら構築することになる。
- このコースは、生成AIの理論と実践を原理から理解したい学生に最適。
講義ノート
- 講義ノートは授業の中心を成し、すべての資料について独立した説明を提供する。
- 講義スライドは視覚的な補助資料として提供されるものであり、独立した教材ではない。
講義
-
第1講: フローおよび拡散モデル
- 生成モデルの紹介
- 常微分方程式および確率微分方程式
- フローおよび拡散モデルにおけるサンプリング
-
第2講: 学習目標の構築
- 条件付きおよび周辺確率経路
- 連続の式とフォッカー・プランク方程式
- 周辺ベクトル場および周辺スコア関数
-
第3講: フローおよび拡散モデルの学習
- フローマッチング
- スコアマッチング
- さまざまな拡散モデルのアプローチ
-
第4講: 画像生成器の構築
- ガイダンスと条件付き生成
- ニューラルネットワークアーキテクチャ
- 最先端モデルの調査
-
第5講: 生成ロボティクス
- Benjamin Burchfiel によるゲスト講義
- 大規模行動モデル
- ロボティクスのための拡散モデル
-
第6講: 生成タンパク質設計
- Jason Yim によるゲスト講義
- AIによる新しいタンパク質設計
- タンパク質構造生成のためのフローマッチング
実習
- 授業に付属する3つの実習があり、段階的にフローマッチングと拡散モデルを構築する演習が提供される。
- 実習は Google Colab で開いて進めることができる。
講師
- Peter と Ezra が共同で講義し、Tommi Jaakkola がスポンサーおよびアドバイザーの役割を担っている。
- Peter Holderrieth は博士課程の学生であり、Ezra Erives は工学修士課程の学生。
事前要件
- 線形代数、実解析、基本的な確率論が必要であり、Python と PyTorch の経験も求められる。
注意事項
- この講義では大規模言語モデル(LLM)は扱わない。LLM はテキストのような離散データを含むが、この講義は画像、動画、タンパク質構造のような連続空間のデータを中心に扱う。
謝辞
- この講義は、多くの個人および組織の支援なしには実現しなかった。
- Tommi Jaakkola 教授、MIT EECS の Lisa Bella、Ellen Reid、そして多くの人々に感謝の意を表する。
1件のコメント
Hacker Newsのコメント
MITの講義「6.S184: Introduction to Flow Matching and Diffusion Models」がYouTubeで公開された
条件付き正規化フローは逆設計問題に対する最も美しい解決策の一つだ
この10年はディープラーニング教育の黄金時代だった
すばらしい講義だ、早く受講したい
最新のAI技術に関する公開講座をすべて集めたコレクションがあるのか気になる
MIT OCWとその協力者たちにとても感謝している
この技術は非常に有用なのに、LLMsが多くの注目を奪ってしまったように思える
MITが時宜にかなった関連性の高いコンテンツを無料で提供しているのはすばらしい
本当に感謝している、現代AIに関するほかのOCW講座があるのか気になる
よくやった、おめでとう