Chai-1: 生命分子相互作用の解読
(chaidiscovery.com)- Chai Discoveryが創薬に使われる分子構造予測モデル Chai-1 を公開し、タンパク質・低分子・DNA・RNA・共有結合修飾まで1つのモデルで扱う
- 公開ベンチマークでは PoseBusters 77%の成功率 と CASP15 Cα LDDT 0.849 を記録し、AlphaFold3、ESM3-98B と直接比較された
- 既存ツールの多くが主に多重配列アラインメント(MSA)に依存するのに対し、Chai-1 は 単一配列モード でも大半の性能を維持する
- マルチマー予測では DockQ acceptable prediction rate 69.8% を記録し、MSA ベースの AlphaFold-Multimer の 67.7% を上回った
- 無料のウェブインターフェースは商用利用にも開放されており、モデル重みと推論コードは Apache 2.0 ライセンスで公開されている
Chai-1 の公開と利用方法
- Chai-1 は創薬関連タスクを対象にしたマルチモーダルベースの分子構造予測モデル
- 予測対象にはタンパク質、低分子、DNA、RNA、共有結合修飾などが含まれる
- 無料の ウェブインターフェース で利用でき、創薬のような商用アプリケーションでも許可されている
- モデル重みと推論コードは Apache 2.0 ライセンスの chai-lab ソフトウェアライブラリとして公開されている
ベンチマーク結果と MSA 依存の緩和
- 代表的なベンチマーク結果は、既存の主要モデルと同等またはそれ以上の数値として示されている
- PoseBusters: 成功率 77%、AlphaFold3 は 76%
- CASP15 タンパク質単量体構造予測セット: Cα LDDT 0.849、ESM3-98B は 0.801
- 既存の構造予測ツールの多くは多重配列アラインメント(MSA)を必要とするが、Chai-1 は 単一配列モード でも実行可能で、大半の性能を維持する
- マルチマー折りたたみ予測では DockQ acceptable prediction rate 基準で 69.8% を記録し、MSA ベースの AlphaFold-Multimer は 67.7% だった
- Chai Discovery によれば、Chai-1 は MSA 検索なしで単一配列のみから AlphaFold-Multimer 級の品質のマルチマー構造を予測できる最初のモデル
- 実験室で得られた制約条件のような新しいデータをプロンプトとして入力すると、性能が二桁のパーセンテージポイントで改善する可能性がある
- 例として epitope conditioning があり、少数の contact または pocket residue だけを使っても抗体-抗原構造予測の精度が2倍になる
- こうした入力は実験室の実験に由来しうるため、AI ベースの抗体エンジニアリングをより実現しやすくする
- モデルの総合分析は 技術報告書 で確認できる
チームと今後の方向性
- Chai Discovery のチームは OpenAI、Meta FAIR、Stripe、Google X のような研究・応用 AI 企業の出身者で構成されている
- チームの多くは先進的な創薬企業で Head of AI を務め、全体として 12 を超える創薬プログラムの推進に貢献してきた
- Chai-1 は数か月にわたる集中的な作業の成果であり、Chai Discovery のより広い目標は生物学を科学から工学へと転換すること
- 今後は生化学分子間の相互作用を予測し、再プログラムする AI ベースのモデルをさらに構築していく計画
まだコメントはありません。