原文:Passaro et al., bioRxiv 2025
DOI:10.1101/2025.06.14.659707
摘要
Boltz-2 是 MIT、Valence Labs 和 ETH Zurich 聯合開發的開源生物分子結構預測模型,在 Boltz-1 基礎上實現顯著改進。模型在保持結構預測能力的同時,首次使 AI 模型的結合親和力預測精度接近自由能微擾(FEP)方法水平,計算效率提升超過 1000 倍。
1. 研發背景
1.1 結構預測與親和力預測的分離現狀
近年來,AlphaFold 3 和 Boltz-1 等模型顯著提升了生物分子複合物結構預測的準確性。然而,這些模型在預測結合親和力(衡量分子結合強度的關鍵屬性)方面仍存在明顯不足。結構預測與親和力預測的能力分離限制了模型在藥物發現中的實際應用價值。
1.2 FEP 方法的精度與計算成本矛盾
自由能微擾(FEP)方法是當前最準確的親和力計算技術,但其計算成本極高,無法在大規模篩選中實用。分子對接等方法速度較快,但精度不足以提供可靠的信號。這種精度與計算成本的長期權衡制約了計算藥物發現的效率。
1.3 現有 AI 方法的局限
現有基於 AI 的親和力預測模型尚未達到 FEP 方法或實驗室檢測的精度。主要挑戰包括:公開結合數據的實驗差異和噪聲、訓練信號的選擇困難、以及結構預測與親和力預測之間的表示學習鴻溝。
2. 數據流程創新
2.1 結構數據擴展
與 Boltz-1 僅使用單一結構不同,Boltz-2 利用來自實驗技術(NMR)和計算方法(分子動力學)的系綜數據。實驗數據包括 2023年6月1日前發布的 PDB 結構。MD 數據來自三個大規模開放項目:MISATO、ATLAS 和 mdCATH。
2.2 親和力數據整理
親和力數據來自 ChEMBL、PubChem 和 BindingDB 等公共數據庫。數據整理策略聚焦四個方面:僅保留高質量檢測、通過合成誘餌數據降低數據偏倚、減少過擬合、通過置信度分數過濾確保結構質量。
2.3 混合監督策略
為支持苗頭化合物發現和先導化合物優化兩種不同場景,模型採用混合數據集,包含二元分類標籤和連續親和力值。對於連續值(Ki、Kd、IC50 等),所有值轉換為以 µM 為單位的對數尺度。
2.4 合成誘餌生成
為擴展負樣本池並改善化學空間覆蓋,模型通過在不同靶點間隨機打亂 hit-to-lead 篩選中識別的結合物來生成合成誘餌。最終數據集包含約 140 萬結合物和超過 300 萬誘餌,涵蓋約 3000 個獨特蛋白質簇。
3. 模型架構改進
3.1 架構組件
Boltz-2 架構包含四個主要組件:
- trunk:計算最密集部分,使用 bfloat16 混合精度和 trifast 核優化
- 去噪模塊:集成 Boltz-steering 物理約束
- 置信度模塊
- 親和力模塊(新增)
訓練裁剪尺寸擴展至 768 tokens,與 AlphaFold 3 相當。
3.2 可控性增強
模型引入三項關鍵控制功能:
- 實驗方法條件化:允許指定 X-ray、NMR 或 MD 等預測應對齊的結構預測方法類型
- 模板條件化與引導:整合相似複合物結構,支持多鏈模板
- 接觸和口袋條件化:允許指定來自實驗技術或人類直覺的特定距離約束
3.3 親和力模塊
親和力模塊由 PairFormer 和兩個預測頭組成:一個預測結合可能性,另一個回歸連續親和力值。模塊作用於 Boltz-2 的結構預測,利用成對表示和經過專門關注蛋白-配體和配體內相互作用的 PairFormer 模型精化的預測坐標。
3.4 物理質量約束
Boltz-2 集成 Boltz-steering(作為 Boltz-1x 發布的一部分引入)——一種在推理時應用基於物理勢能的方法,在不犧牲準確性的情況下改善物理合理性。集成此方法的版本稱為 Boltz-2x。
4. 訓練策略
4.1 三階段訓練
模型訓練分為三個階段:結構訓練、置信度訓練和親和力訓練。親和力訓練在結構和置信度訓練之後進行,梯度從 trunk 分離。
4.2 親和力訓練細節
親和力訓練流程包含多個關鍵組件:預計算和裁剪結合口袋、trunk 表示預處理和自定義採樣策略、批次構建關注局部化學變化。監督聯合應用於二元和連續親和力任務:
- 連續值使用 Huber 損失監督
- 二元分類使用 Focal 損失以解決類別不平衡
4.3 與生成模型耦合
Boltz-2 用於訓練分子生成器(SynFlowNet)以產生具有高結合分數的小分子。生成智能體採用 GFlowNet 損失函數,使其能夠從任意和多模態分數分佈中採樣。
5. 性能評估與局限
5.1 結構預測性能
在 2024-2025 年提交的 PDB 結構評估集上,Boltz-2 在各模態上與 Boltz-1 相當或適度改進。改進最顯著的模態是 RNA 鏈和 DNA-蛋白複合物。與 Chai-1 和 ProteinX 等其他商業可用模型相比,Boltz-2 表現具有競爭力,但仍稍落後於 AlphaFold 3。
5.2 動態性能
在 mdCATH 和 ATLAS 數據集的保留簇上,MD 條件化對預測系綜有明顯影響,導致更多樣化的結構,更好地捕捉模擬的構象多樣性。Boltz-2 在預測關鍵動態屬性(如 RMSF)方面與近期專用模型表現相當。
5.3 親和力預測性能
在 FEP+ 基準(4 靶點子集:CDK2、TYK2、JNK1、P38)上,Boltz-2 顯著優於深度學習基線,接近基於 FEP 方法的準確性,同時速度提升超過 1000 倍。在 CASP16 親和力賽道的回顧性評估中,Boltz-2 開箱即用地優於所有提交的參賽作品。
5.4 前瞻性案例
在 TYK2 靶點的前瞻性篩選中,Boltz-2 與生成模型(SynFlowNet)耦合的工作流程成功生成多樣化、可合成的高親和力結合物,經絕對結合自由能(ABFE)模擬驗證。
5.5 局限性與信息缺口
論文未完全披露以下技術細節:模型參數規模的具體數字、訓練計算資源、推理速度基準與 AlphaFold 3 的直接對比、以及親和力預測在不同化學系列中的泛化能力評估。與 AlphaFold 3 在結構預測上的差距(尤其在抗體-抗原預測上)表明,開放模型在某些任務上仍落後於專有模型。
6. 結論
Boltz-2 代表了開源生物分子建模領域的重要進展,首次在統一框架內實現了與 FEP 方法相當的親和力預測精度和接近 AlphaFold 3 的結構預測能力。計算效率提升超過 1000 倍的親和力預測為大規模虛擬篩選和先導優化提供了實用工具。
未來發展方向
- 進一步縮小與專有模型的結構預測差距
- 擴展親和力預測的化學空間覆蓋
- 深化與生成模型的集成以實現端到端分子設計
- 建立更標準化的親和力預測基準以促進社區協作
參考資料:
[1] Passaro S, Corso G, Wohlwend J, et al. Boltz-2: Towards Accurate and Efficient Binding Affinity Prediction. bioRxiv 2025. https://doi.org/10.1101/2025.06.14.659707