原文:Abramson et al., Nature 2024
DOI:10.1038/s41586-024-07487-w
摘要
AlphaFold 3 是 DeepMind 与 Isomorphic Labs 联合开发的生物分子结构预测模型,采用基于扩散的架构更新,能够统一预测包含蛋白质、核酸、小分子、离子及修饰残基的复合物结构。在 PoseBusters 基准测试中,该模型在蛋白-配体相互作用预测上显著优于传统分子对接工具及同类深度学习方法。
1. 研究背景
1.1 蛋白质结构预测的进展
AlphaFold 2 的问世标志着蛋白质结构预测领域的重大突破,其通过深度学习方法实现了接近实验精度的单链蛋白质结构预测。此后,AlphaFold-Multimer 将预测能力扩展至蛋白质-蛋白质复合物。
1.2 多类型生物分子预测的挑战
尽管 AlphaFold 2 在蛋白质结构预测上取得显著成功,但生物体内存在多种类型的分子相互作用,包括蛋白质与核酸、小分子配体、离子及修饰残基的相互作用。这些相互作用对于理解细胞功能和药物设计至关重要。
1.3 现有方法的局限
传统分子对接工具(如 AutoDock Vina)依赖实验测定的蛋白质结构作为输入,无法真正实现从头预测。专用深度学习方法虽然在特定任务上表现良好,但无法处理包含多种分子类型的复合物。
2. 技术架构概述
AlphaFold 3 在继承 AlphaFold 2 整体流程的基础上进行了实质性架构更新,主要包括三个核心组件:输入嵌入模块、Pairformer 处理模块和扩散生成模块。
2.1 输入与嵌入
模型接受聚合物序列(蛋白质、DNA、RNA)、小分子 SMILES 表示、共价键信息及可选的模板结构作为输入。输入嵌入器将各类化学实体转换为统一的 token 表示。
2.2 Pairformer 模块
Pairformer 取代了 AlphaFold 2 中的 Evoformer,成为模型的核心处理单元。该模块仅作用于成对表示(pair representation)和单表示(single representation),大幅简化了多序列比对(MSA)的处理:
- MSA 模块缩减至 4 个 block
- 采用轻量级的 pair-weighted 平均操作
- MSA 表示不保留至后续步骤
- Pairformer 包含 48 个处理 block
2.3 扩散模块
扩散模块是 AlphaFold 3 最显著的架构创新,直接替代了 AlphaFold 2 的结构模块。该模块直接作用于原始原子坐标,而非基于氨基酸特定的框架和侧链扭转角。
扩散过程在不同噪声水平下进行训练:
- 低噪声水平:促使网络学习局部立体化学
- 高噪声水平:强调系统的大尺度结构
2.4 置信度预测
AlphaFold 3 开发了扩散 rollout 程序:在训练中使用较大步长进行 mini rollout 生成预测结构,据此计算性能指标并训练置信度头。置信度头基于成对表示预测:
- pLDDT:局部距离差分测试
- PAE:预测对齐误差矩阵
- PDE:距离误差矩阵
3. 性能评估
3.1 蛋白-配体相互作用
在 PoseBusters 基准测试集(428 个蛋白-配体结构)上,AlphaFold 3 以口袋对齐配体 RMSD < 2Å 为成功标准,显著优于:
- 传统对接工具 AutoDock Vina(P = 2.27 × 10⁻¹³)
- 深度学习方法 RoseTTAFold All-Atom(P = 4.45 × 10⁻²⁵)
值得注意的是,AlphaFold 3 仅使用蛋白质序列和配体 SMILES 作为输入,而传统对接工具依赖实验测定的蛋白质结构。
3.2 蛋白-核酸相互作用
在蛋白-核酸复合物预测上,AlphaFold 3 的表现优于专用预测器 RoseTTAFold2NA(P < 0.001)。模型能够预测包含数千个残基的大型蛋白-核酸复合物。
3.3 共价修饰预测
模型对共价修饰(包括键合配体、糖基化、修饰蛋白残基和核酸碱基)的预测同样表现良好。单残基糖基化的成功率与键合配体相当;多残基糖基化的成功率略低(42.1%,n=131)。
3.4 蛋白-蛋白相互作用
与 AlphaFold-Multimer v2.3 相比,AlphaFold 3 在蛋白-蛋白界面预测上取得显著提升(P = 1.81 × 10⁻¹⁸)。抗体-抗原界面预测的改进尤为明显(P = 6.54 × 10⁻⁵)。
3.5 置信度校准
AlphaFold 3 的置信度指标(ipTM、pLDDT、PAE)与预测准确性呈现良好的校准关系。高 ipTM 分数对应高界面准确性,高 pLDDT 对应高 LDDT_to_polymer 分数。
4. 模型局限性
4.1 立体化学问题
模型输出存在两类主要的手性违规:
- 手性中心不守恒:PoseBusters 基准中的手性违规率为 4.4%
- 原子重叠:在部分预测中观察到严重违反物理合理性的原子位置重叠
4.2 幻觉问题
从非生成式模型转向扩散生成模型引入了新的技术挑战:在无序区域产生虚假的结构秩序(幻觉)。AlphaFold 3 采用交叉蒸馏方法缓解此问题。
4.3 动态行为预测
与所有基于 PDB 训练的模型一样,AlphaFold 3 预测的是晶体结构中观察到的静态构象,而非生物分子在溶液中的动态行为。模型无法捕捉构象变化、折叠过程和热涨落等动态特性。
4.4 对 MSA 深度的依赖
AlphaFold 3 对多序列比对(MSA)深度的依赖性与 AlphaFold-Multimer v2.3 相似:MSA 较浅的蛋白质预测准确性较低。
5. 讨论与结论
5.1 统一框架的优势与妥协
AlphaFold 3 展示了在单一深度学习框架内实现跨生物分子空间高精度建模的可能性。统一方法简化了工作流程、减少了专用工具间的兼容性问题。然而,这种统一也可能意味着在特定任务上无法达到专用模型的最优性能。
5.2 扩散模型的特性
扩散架构的采用带来了生成式建模的优势:能够产生多解分布、在局部结构上保持清晰定义。然而,这也引入了幻觉风险和训练复杂性。
5.3 应用前景
对于药物发现应用,AlphaFold 3 的预测能力为早期靶点评估和化合物筛选提供了有价值的工具,但最终的药物设计决策仍需谨慎考虑模型的置信度指标和已知局限。
未来改进方向
- 改进扩散采样策略以减少幻觉
- 增强手性约束的强制执行
- 整合时间维度以建模动态行为
- 扩展训练数据以覆盖更广泛的化学空间
重要提示:与 AlphaFold 2 不同,AlphaFold 3 的商业使用许可是受限的。用户在商业应用中需遵守相应的许可协议。
参考资料:
[1] Abramson, J., Adler, J., Dunger, J. et al. Accurate structure prediction of biomolecular interactions with AlphaFold 3. Nature 630, 493–500 (2024). https://doi.org/10.1038/s41586-024-07487-w