1 ポイント 投稿者 GN⁺ 2024-09-12 | 1件のコメント | WhatsAppで共有

Chai-1の紹介: 生体分子の相互作用を解読

  • Chai-1の公開
    • Chai-1は、創薬に関するさまざまな作業で最先端の性能を発揮する新しいマルチモーダル基盤モデル
    • タンパク質、低分子、DNA、RNA、共有結合修飾などを統合的に予測可能
    • Webインターフェースを通じて無料で提供され、商用利用も可能
    • 非商用利用向けには、モデル重みと推論コードをソフトウェアライブラリとして提供

生体分子相互作用のための最先端モデル

  • 性能評価
    • PoseBustersベンチマークで77%の成功率を達成(AlphaFold3は76%)
    • CASP15タンパク質モノマー構造予測セットでCα LDDT 0.849を達成(ESM3-98Bは0.801)
    • 多重配列アラインメント(MSA)を必要とせず、単一配列モードでも高い性能を維持
    • 多量体構造予測でAlphaFold-Multimerモデルより高い予測精度(69.8% vs. 67.7%)
    • 単一配列だけでAlphaFold-Multimer水準の品質による多量体構造予測が可能

ネイティブなマルチモーダル基盤モデル

  • 追加データの活用
    • 実験室由来の制約条件など新たなデータによって性能向上が可能
    • 抗体-抗原構造予測の精度を2倍に高めるエピトープ条件付けなど、さまざまな機能を探究

モデル公開

  • 無料のWebインターフェースを提供
    • 商用利用も可能
    • 非商用利用向けにはソフトウェアライブラリとしてコードを公開
    • 研究および産業コミュニティとの協力を通じて、エコシステム全体に利益を提供

次のステップ

  • チームの背景
    • OpenAI、Meta FAIR、Stripe、Google Xなど、先進的な研究および応用AI企業の出身
    • AIを活用した生物学研究の発展に重要な役割を果たす
    • Chai-1は数か月にわたる集中的な取り組みの成果であり、まだ始まりの段階
    • 生物学を科学から工学へと転換することが目標
    • 生化学分子間の相互作用を予測し、再プログラムするAI基盤モデルをさらに開発予定

GN⁺のまとめ

  • Chai-1は創薬とライフサイエンス研究における重要なツールであり、タンパク質、低分子、DNA、RNAなどの構造予測で最先端の性能を発揮
  • 多重配列アラインメントなしでも高い性能を維持し、多量体構造予測でも優れた性能を示す
  • 研究および産業コミュニティとの協力を通じてエコシステム全体に利益をもたらし、無料で利用できるWebインターフェースと非商用向けソフトウェアライブラリを提供
  • 生物学を工学へと転換することを目標に、生化学分子間の相互作用を予測し再プログラムするAIモデルを追加で開発する予定

1件のコメント

 
GN⁺ 2024-09-12
Hacker Newsの意見
  • Reflection事件以降、独立したテストへの熱意が生まれた
  • SOTA評価をそのまま受け入れないでほしい
  • Chaipytorch3dからクォータニオン関数をコピーして使っていたことを発見した
  • タンパク質構造の知識は創薬の制約要因ではない
    • 結果が創薬パイプラインに与える影響を見積もるのが興味深い
  • **"foundation""multi-modal"**という用語は論文の要旨にしか登場しない
    • AlphaFoldの手法をコピーし、言語埋め込みやその他の制約条件を追加している
    • 性能向上のデータが不足している
  • 誤差範囲が非常に大きい
  • 公開の危険性がある
    • 新しい生物兵器の開発に悪用される可能性がある
  • バイオハッカーが新しいタンパク質を開発するのがどれほど難しいのか気になる
  • HNのタイトルが不正確だ
    • 1%高いスコアを出したからといって以前のモデルに勝ったことにはならない
  • 賭けのオッズがあるなら早期リタイアできる
  • AutoDock Vinaの作者である
    • ドッキングソフトウェアは新しい結合体を見つけるために汎化が必要だ
    • 評価アプローチが新しい分子に対する性能をテストしていない
    • Chai-1のリリースは手法の評価に役立つだろう