原文:Isomorphic Labs Technical Report (February 2026)
摘要
IsoDDE 是 Isomorphic Labs 开发的药物设计引擎,在 AlphaFold 3 架构基础上实现显著改进。在 Runs N' Poses 基准测试最难子集中,其蛋白-配体预测成功率达 50%,较 AlphaFold 3 提升超过 2 倍;在抗体-抗原界面预测上,高保真度预测比例较 AlphaFold 3 提升 2.3 倍。
1. 研究背景
1.1 AlphaFold 3 后的结构预测格局
AlphaFold 3 的发布确立了深度学习在生物分子结构预测中的主导地位。此后,领域内出现了多种 AlphaFold 风格的结构模型(如 Chai-1、Boltz-1/2、Protenix 等),主要通过架构调整、条件控制功能和推理时引导机制来改进模型性能。
1.2 泛化能力的核心挑战
尽管近期进展显著,基准测试揭示了模型在泛化至未探索分子空间时的持续失败:
- 抗体-抗原对接失败率超过 50%(即使对 AlphaFold 3 而言)
- 当前共折叠模型大多记忆小分子结合模式,导致在新口袋上的性能崩溃
- 准确的结构预测往往无法转化为定量的相互作用强度指标
1.3 现有方法的局限
传统分子对接工具依赖实验测定的蛋白质结构作为输入,无法真正实现从头预测。更重要的是,现有模型在处理分布外(out-of-distribution)数据时性能显著下降,限制了其在 first-in-class 靶点发现和新型调控机制研究中的应用。
2. 技术架构概述
IsoDDE 的架构改进代表了自 AlphaFold 3 发布以来该领域的首次实质性精度跃升。
2.1 架构优化
模型保留了 AlphaFold 3 的核心元素——作用于成对表示的三角运算,但进行了多项优化:
- 三角注意力的改进
- 信号流的重排以改善单表示和成对表示之间的信息传递
2.2 生成建模的物理先验引入
模型重新审视了生成建模的数学表述,引入了物理先验知识。这包括对扩散过程的改进,以及在不同噪声水平下对局部结构和全局构象的联合优化。
2.3 推理时引导机制
与近期其他模型(如 Boltz-2)类似,IsoDDE 也具备推理时引导能力,可用于纠正物理不准确性(如错误的手性)。然而,与这些模型不同的是,IsoDDE 的无条件预测准确性本身已有显著提升。
3. 性能评估
以下评估结果均基于论文报告的基准测试。IsoDDE 与 AlphaFold 3 使用相同的训练数据截止日期(2021年9月30日),确保比较的公平性。
3.1 蛋白-配体结构预测
在 Runs N' Poses 基准测试(用于评估蛋白-配体共折叠模型对远离训练集样本的泛化能力)中,IsoDDE 展现出显著的性能提升:
- 在最困难的相似度区间(0-20%),IsoDDE 达到 50% 的成功率,较 AlphaFold 3 提升超过 2 倍
- 其中 17 个成功预测是 AlphaFold 3 未能正确预测的
3.2 抗体-抗原界面预测
在包含 334 个结构的低同源性抗体-抗原测试集上:
- 高保真度区间(DockQ > 0.8):IsoDDE 达到 39%,较 AlphaFold 3(17%)提升 2.3 倍,较 Boltz-2(2%)提升 19.8 倍
- 正确预测区间(DockQ > 0.23):单种子情况下 IsoDDE 成功率达 63%
- 使用 1000 个模型种子后,高保真度预测率可达 59%
3.3 CDR-H3 环区预测
CDR-H3 环区是抗体可变性的主要来源。IsoDDE 以 ≤2Å 骨架 RMSD 预测 70% 抗体的 CDR-H3 环区,较 AlphaFold 3(58%)提升 1.2 倍,较 Boltz-2(43%)提升 1.6 倍。
3.4 结合亲和力预测
在 ChEMBL 35 新发布的活性数据预测中,IsoDDE 在各靶点类别上保持较高性能。在适用于物理模拟的精选数据集上,其亲和力预测超越 FEP+ 等金标准自由能微扰方法。
3.5 新口袋识别
在一般测试集上,IsoDDE 的口袋识别能力 AUPRC 优于 P2Rank 1.5 倍。这一能力使模型能够发现此前仅可通过实验方法识别的新口袋。
4. 典型案例
4.1 蛋白-配体案例
PDB 8EA6:配体在两条 NKG2D 蛋白链界面处打开一个新的隐式口袋,形成三元复合物。配体作为变构蛋白-蛋白相互作用抑制剂发挥作用。
PDB 8E23:Pol θ 的变构抑制剂导致螺旋移动,在训练集中未见的口袋中打开结合位点。
4.2 抗体-抗原案例
PDB 9FZD:纳米抗体结合细菌外膜蛋白 A(OmpA)。训练数据中无 OmpA 与纳米抗体的复合物结构。
- IsoDDE 预测 DockQ 0.943,CDR-H3 骨架 RMSD 0.94Å
- AlphaFold 3 预测 DockQ 0.00,CDR-H3 RMSD 4.98Å(纳米抗体定位在 OmpA 错误侧)
PDB 8Q3J:抗体 Fv 结合小鼠 IL-38。
- IsoDDE 重链-抗原界面 DockQ 0.876,CDR-H3 RMSD 0.78Å
- AlphaFold 3 将重链和轻链方向翻转,DockQ 0.060
5. 局限性与讨论
5.1 训练数据截止日期的影响
IsoDDE 与 AlphaFold 3 使用相同的训练数据截止日期(2021年9月30日),这确保了比较的公平性,但也意味着模型无法利用此后发布的结构数据。
5.2 计算资源需求
抗体-抗原预测使用 1000 个种子可显著提升性能,但这带来了相应的计算开销。对于工业级药物发现流程,这种计算成本的可行性需要进一步评估。
5.3 实际验证需求
基准测试表现与实际药物项目中的价值之间可能存在差距。此外,模型在立体化学(手性、原子重叠)方面的表现需要更多独立评估。
5.4 竞争格局
开源模型(如 Boltz-2、Chai-1)在可操控性和效率方面持续改进,虽然当前无条件准确性不及 IsoDDE,但其开放性和快速迭代能力可能缩小差距。
6. 结论
IsoDDE 在生物分子结构预测的泛化能力上实现了实质性进展。在蛋白-配体、抗体-抗原、新口袋识别等多个任务上,其性能较现有方法有显著提升,且部分能力(如亲和力预测)在特定条件下可超越传统物理方法。
未来改进方向
- 扩展训练数据覆盖范围
- 优化计算效率
- 增强立体化学约束的强制执行
- 在实际药物项目中积累验证数据
参考资料:
[1] Isomorphic Labs Team. Accurate Predictions of Novel Biomolecular Interactions with IsoDDE. Technical Report, February 2026.