Chai-1: 生体分子相互作用の解読

(chaidiscovery.com)

1 ポイント投稿者 GN⁺ 2024-09-12 | 1件のコメント | WhatsAppで共有

Chai-1の公開
- Chai-1は、創薬に関するさまざまな作業で最先端の性能を発揮する新しいマルチモーダル基盤モデル
- タンパク質、低分子、DNA、RNA、共有結合修飾などを統合的に予測可能
- Webインターフェースを通じて無料で提供され、商用利用も可能
- 非商用利用向けには、モデル重みと推論コードをソフトウェアライブラリとして提供

性能評価
- PoseBustersベンチマークで77%の成功率を達成（AlphaFold3は76%）
- CASP15タンパク質モノマー構造予測セットでCα LDDT 0.849を達成（ESM3-98Bは0.801）
- 多重配列アラインメント（MSA）を必要とせず、単一配列モードでも高い性能を維持
- 多量体構造予測でAlphaFold-Multimerモデルより高い予測精度（69.8% vs. 67.7%）
- 単一配列だけでAlphaFold-Multimer水準の品質による多量体構造予測が可能

追加データの活用
- 実験室由来の制約条件など新たなデータによって性能向上が可能
- 抗体-抗原構造予測の精度を2倍に高めるエピトープ条件付けなど、さまざまな機能を探究

無料のWebインターフェースを提供
- 商用利用も可能
- 非商用利用向けにはソフトウェアライブラリとしてコードを公開
- 研究および産業コミュニティとの協力を通じて、エコシステム全体に利益を提供

チームの背景
- OpenAI、Meta FAIR、Stripe、Google Xなど、先進的な研究および応用AI企業の出身
- AIを活用した生物学研究の発展に重要な役割を果たす
- Chai-1は数か月にわたる集中的な取り組みの成果であり、まだ始まりの段階
- 生物学を科学から工学へと転換することが目標
- 生化学分子間の相互作用を予測し、再プログラムするAI基盤モデルをさらに開発予定

1件のコメント

GN⁺ 2024-09-12

Reflection事件以降、独立したテストへの熱意が生まれた
SOTA評価をそのまま受け入れないでほしい
Chaiがpytorch3dからクォータニオン関数をコピーして使っていたことを発見した
タンパク質構造の知識は創薬の制約要因ではない
- 結果が創薬パイプラインに与える影響を見積もるのが興味深い
**"foundation"と"multi-modal"**という用語は論文の要旨にしか登場しない
- AlphaFoldの手法をコピーし、言語埋め込みやその他の制約条件を追加している
- 性能向上のデータが不足している
誤差範囲が非常に大きい
公開の危険性がある
- 新しい生物兵器の開発に悪用される可能性がある
バイオハッカーが新しいタンパク質を開発するのがどれほど難しいのか気になる
HNのタイトルが不正確だ
- 1%高いスコアを出したからといって以前のモデルに勝ったことにはならない
賭けのオッズがあるなら早期リタイアできる
AutoDock Vinaの作者である
- ドッキングソフトウェアは新しい結合体を見つけるために汎化が必要だ
- 評価アプローチが新しい分子に対する性能をテストしていない
- Chai-1のリリースは手法の評価に役立つだろう