原文:Abramson et al., Nature 2024
DOI:10.1038/s41586-024-07487-w
摘要
AlphaFold 3 是 DeepMind 與 Isomorphic Labs 聯合開發的生物分子結構預測模型,採用基於擴散的架構更新,能夠統一預測包含蛋白質、核酸、小分子、離子及修飾殘基的複合物結構。在 PoseBusters 基準測試中,該模型在蛋白-配體相互作用預測上顯著優於傳統分子對接工具及同類深度學習方法。
1. 研發背景
1.1 蛋白質結構預測的進展
AlphaFold 2 的問世標誌著蛋白質結構預測領域的重大突破,其通過深度學習方法實現了接近實驗精度的單鏈蛋白質結構預測。此後,AlphaFold-Multimer 將預測能力擴展至蛋白質-蛋白質複合物。
1.2 多類型生物分子預測的挑戰
儘管 AlphaFold 2 在蛋白質結構預測上取得顯著成功,但生物體內存在多種類型的分子相互作用,包括蛋白質與核酸、小分子配體、離子及修飾殘基的相互作用。這些相互作用對於理解細胞功能和藥物設計至關重要。
1.3 現有方法的局限
傳統分子對接工具(如 AutoDock Vina)依賴實驗測定的蛋白質結構作為輸入,無法真正實現從頭預測。專用深度學習方法雖然在特定任務上表現良好,但無法處理包含多種分子類型的複合物。
2. 技術架構概述
AlphaFold 3 在繼承 AlphaFold 2 整體流程的基礎上進行了實質性架構更新,主要包括三個核心組件:輸入嵌入模塊、Pairformer 處理模塊和擴散生成模塊。
2.1 輸入與嵌入
模型接受聚合物序列(蛋白質、DNA、RNA)、小分子 SMILES 表示、共價鍵信息及可選的模板結構作為輸入。輸入嵌入器將各類化學實體轉換為統一的 token 表示。
2.2 Pairformer 模塊
Pairformer 取代了 AlphaFold 2 中的 Evoformer,成為模型的核心處理單元。該模塊僅作用於成對表示(pair representation)和單表示(single representation),大幅簡化了多序列比對(MSA)的處理:
- MSA 模塊縮減至 4 個 block
- 採用輕量級的 pair-weighted 平均操作
- MSA 表示不保留至後續步驟
- Pairformer 包含 48 個處理 block
2.3 擴散模塊
擴散模塊是 AlphaFold 3 最顯著的架構創新,直接替代了 AlphaFold 2 的結構模塊。該模塊直接作用於原始原子坐標,而非基於氨基酸特定的框架和側鏈扭轉角。
擴散過程在不同噪聲水平下進行訓練:
- 低噪聲水平:促使網絡學習局部立體化學
- 高噪聲水平:強調系統的大尺度結構
2.4 置信度預測
AlphaFold 3 開發了擴散 rollout 程序:在訓練中使用較大步長進行 mini rollout 生成預測結構,據此計算性能指標並訓練置信度頭。置信度頭基於成對表示預測:
- pLDDT:局部距離差分測試
- PAE:預測對齊誤差矩陣
- PDE:距離誤差矩陣
3. 性能評估
3.1 蛋白-配體相互作用
在 PoseBusters 基準測試集(428 個蛋白-配體結構)上,AlphaFold 3 以口袋對齊配體 RMSD < 2Å 為成功標準,顯著優於:
- 傳統對接工具 AutoDock Vina(P = 2.27 × 10⁻¹³)
- 深度學習方法 RoseTTAFold All-Atom(P = 4.45 × 10⁻²⁵)
值得注意的是,AlphaFold 3 僅使用蛋白質序列和配體 SMILES 作為輸入,而傳統對接工具依賴實驗測定的蛋白質結構。
3.2 蛋白-核酸相互作用
在蛋白-核酸複合物預測上,AlphaFold 3 的表現優於專用預測器 RoseTTAFold2NA(P < 0.001)。模型能夠預測包含數千個殘基的大型蛋白-核酸複合物。
3.3 共價修飾預測
模型對共價修飾(包括鍵合配體、糖基化、修飾蛋白殘基和核酸鹼基)的預測同樣表現良好。單殘基糖基化的成功率與鍵合配體相當;多殘基糖基化的成功率略低(42.1%,n=131)。
3.4 蛋白-蛋白相互作用
與 AlphaFold-Multimer v2.3 相比,AlphaFold 3 在蛋白-蛋白界面預測上取得顯著提升(P = 1.81 × 10⁻¹⁸)。抗體-抗原界面預測的改進尤為明顯(P = 6.54 × 10⁻⁵)。
3.5 置信度校準
AlphaFold 3 的置信度指標(ipTM、pLDDT、PAE)與預測準確性呈現良好的校準關係。高 ipTM 分數對應高界面準確性,高 pLDDT 對應高 LDDT_to_polymer 分數。
4. 模型局限性
4.1 立體化學問題
模型輸出存在兩類主要的手性違規:
- 手性中心不守恆:PoseBusters 基準中的手性違規率為 4.4%
- 原子重疊:在部分預測中觀察到嚴重違反物理合理性的原子位置重疊
4.2 幻覺問題
從非生成式模型轉向擴散生成模型引入了新的技術挑戰:在無序區域產生虛假的結構秩序(幻覺)。AlphaFold 3 採用交叉蒸餾方法緩解此問題。
4.3 動態行為預測
與所有基於 PDB 訓練的模型一樣,AlphaFold 3 預測的是晶體結構中觀察到的靜態構象,而非生物分子在溶液中的動態行為。模型無法捕捉構象變化、摺疊過程和熱漲落等動態特性。
4.4 對 MSA 深度的依賴
AlphaFold 3 對多序列比對(MSA)深度的依賴性與 AlphaFold-Multimer v2.3 相似:MSA 較淺的蛋白質預測準確性較低。
5. 討論與結論
5.1 統一框架的優勢與妥協
AlphaFold 3 展示了在單一深度學習框架內實現跨生物分子空間高精度建模的可能性。統一方法簡化了工作流程、減少了專用工具間的兼容性問題。然而,這種統一也可能意味著在特定任務上無法達到專用模型的最優性能。
5.2 擴散模型的特性
擴散架構的採用帶來了生成式建模的優勢:能夠產生多解分佈、在局部結構上保持清晰定義。然而,這也引入了幻覺風險和訓練複雜性。
5.3 應用前景
對於藥物發現應用,AlphaFold 3 的預測能力為早期靶點評估和化合物篩選提供了有價值的工具,但最終的藥物設計決策仍需谨慎考慮模型的置信度指標和已知局限。
未來改進方向
- 改進擴散採樣策略以減少幻覺
- 增強手性約束的強制執行
- 整合時間維度以建模動態行為
- 擴展訓練數據以覆蓋更廣泛的化學空間
重要提示:與 AlphaFold 2 不同,AlphaFold 3 的商業使用許可是受限的。用戶在商業應用中需遵守相應的許可協議。
參考資料:
[1] Abramson, J., Adler, J., Dunger, J. et al. Accurate structure prediction of biomolecular interactions with AlphaFold 3. Nature 630, 493–500 (2024). https://doi.org/10.1038/s41586-024-07487-w