- Ligo Biosciences の創業者たちが、タンパク質構造予測のための最新モデルである AlphaFold3 のオープンソース実装を共有
- Google DeepMind とその新しいスタートアップ Isomorphic Labs は、新薬開発へと事業を拡大している
- AlphaFold3 を開発し、新薬開発を加速させ、製薬会社の需要を生み出している
- すでに Novartis および Eli Lilly と 30 億ドル規模の契約を締結済み
- AlphaFold3 は生体分子構造予測(biomolecular structure prediction)モデルで、3つの主要機能を持つ
- タンパク質構造予測
- 薬物-タンパク質相互作用構造予測
- 核酸-タンパク質複合体構造予測
- AlphaFold3 はタンパク質構造のマッピングを劇的に加速するため、科学分野で非常に重要
- 博士課程の学生1人が博士課程全体を通して1つの構造を研究するのに対し、AlphaFold3 を使えば実験精度に匹敵する予測を数分で得られる
- 問題は、DeepMind が 5 月に AlphaFold3 を発表したものの、コードを公開していないこと
- AlphaFold3 は、バイオテック業界全体が恩恵を受けられる構造モデリング技術の根本的な進歩であり、その活用分野は非常に広い
- CRISPR 遺伝子編集技術:科学者が DNA がはさみ役の Cas タンパク質とどのように相互作用するかを正確に見られる
- がん研究:候補薬ががん標的にどう結合するかを予測可能。DeepMind の論文のハイライトの1つは、臨床 KRAS 阻害剤とその標的の複合体構造予測
- 抗体/ナノボディと標的の予測:AlphaFold3 はこの分子クラスに対する精度を次点のツール比で 2 倍向上
- 残念ながら非商用ライセンスのため、どの企業も利用できない
- そこで AlphaFold3 のオープンソース実装をリリース
- 単一鎖タンパク質で学習した完全なモデルを公開し、他の2つの機能もまもなく学習・公開予定
- 学習コードも含まれる
- 重みはトレーニングとベンチマーク完了後に公開予定
- Apache 2.0 ライセンスを採用し、真のオープンソースとなるようにしている
- DeepMind は論文を通じて、各コンポーネントの擬似コードとともにモデル全体の構造を公開していた
- これを PyTorch に完全移植したが、想像以上に多くのリバースエンジニアリングが必要だった
- 初期構築時に、DeepMind の論文内で学習を妨げるさまざまな問題を発見。ディープラーニングコミュニティにとって興味深い内容と思われる
- MSE 損失スケーリングが Karras et al. (2022) と異なる。論文で提供された重み付けでは高ノイズ水準で損失が下がらない
- 論文では residual layer が欠落している
- 欠落していた residual layer を追加したところ、gradient flow と収束に利点があった
- DeepMind が DiT ブロックで residual connection を省略した理由を知っている人がいるのか気になる
- MSA モジュールの現在の形には dead layer が存在する
- 最後の pair weighted averaging と transition layer は pair representation に寄与できず、gradient が伝播しない
- AlphaFold2 の ExtraMsaStack と同じ順序に置き換えた
- Weight sharing を使うのも代替案になり得るが、論文ではその説明が曖昧
- Ligo(YC S24)では酵素設計のために AlphaFold3 のアイデアを活用している
- AlphaFold3 のオープンソース化は、コミュニティに役立つ副次的なミッションだと考えている
GN⁺の意見
- AlphaFold3 はタンパク質構造予測分野における革新的な技術であり、新薬開発や生命科学研究に大きな影響を与えると予想される
- しかし DeepMind がコードを公開しなかったことは、科学界の再現性や協業の精神に反する行動と見ることもできる
- AlphaFold3 に類似した機能を持つオープンソースプロジェクトとしては、OpenFold、RoseTTAFold などがある
- AlphaFold3 を導入する際は、モデルの精度と限界、計算資源の要件などを綿密に検討する必要がある
- オープンソース実装の登場により、より多くの研究者や企業が AlphaFold3 の恩恵を受けられるようになったが、商用化には依然として制約がある
1件のコメント
Hacker Newsのコメント
DeepMindとAlphaFoldはクローズドソースへ移行しつつある
予測がどのように検証されるのか気になる
実装に関する論文を出版する予定があるのか気になる
このオープン版を商用環境で使えるようになってうれしい
この実装の名前は変更したほうがよさそうだ
モデルコード自体は課題の小さな一部にすぎない
計算プロテオミクスに少し関わったことがある
疑似コードだけ公開すれば十分ではないと誰が思っただろう
ColabFoldに詳しいのか気になる
次のステップが何なのか気になる