原文:Isomorphic Labs Technical Report (February 2026)
摘要
IsoDDE 是 Isomorphic Labs 開發的藥物設計引擎,在 AlphaFold 3 架構基礎上實現顯著改進。在 Runs N' Poses 基準測試最難子集中,其蛋白-配體預測成功率達 50%,較 AlphaFold 3 提升超過 2 倍;在抗體-抗原界面預測上,高保真度預測比例較 AlphaFold 3 提升 2.3 倍。
1. 研發背景
1.1 AlphaFold 3 後的結構預測格局
AlphaFold 3 的發布確立了深度學習在生物分子結構預測中的主導地位。此後,領域內出現了多種 AlphaFold 風格的結構模型(如 Chai-1、Boltz-1/2、Protenix 等),主要通過架構調整、條件控制功能和推理時引導機制來改進模型性能。
1.2 泛化能力的核心挑戰
儘管近期進展顯著,基準測試揭示了模型在泛化至未探索分子空間時的持續失敗:
- 抗體-抗原對接失敗率超過 50%(即使對 AlphaFold 3 而言)
- 當前共摺疊模型大多記憶小分子結合模式,導致在新口袋上的性能崩潰
- 準確的結構預測往往無法轉化為定量的相互作用強度指標
1.3 現有方法的局限
傳統分子對接工具依賴實驗測定的蛋白質結構作為輸入,無法真正實現從頭預測。更重要的是,現有模型在處理分佈外(out-of-distribution)數據時性能顯著下降,限制了其在 first-in-class 靶點發現和新型調控機制研究中的應用。
2. 技術架構概述
IsoDDE 的架構改進代表了自 AlphaFold 3 發布以來該領域的首次實質性精度躍升。
2.1 架構優化
模型保留了 AlphaFold 3 的核心元素——作用於成對表示的三角運算,但進行了多項優化:
- 三角注意力的改進
- 信號流的重排以改善單表示和成對表示之間的信息傳遞
2.2 生成建模的物理先驗引入
模型重新審視了生成建模的數學表述,引入了物理先驗知識。這包括對擴散過程的改進,以及在不同噪聲水平下對局部結構和全局構象的聯合優化。
2.3 推理時引導機制
與近期其他模型(如 Boltz-2)類似,IsoDDE 也具備推理時引導能力,可用於糾正物理不準確性(如錯誤的手性)。然而,與這些模型不同的是,IsoDDE 的無條件預測準確性本身已有顯著提升。
3. 性能評估
以下評估結果均基於論文報告的基準測試。IsoDDE 與 AlphaFold 3 使用相同的訓練數據截止日期(2021年9月30日),確保比較的公平性。
3.1 蛋白-配體結構預測
在 Runs N' Poses 基準測試(用於評估蛋白-配體共摺疊模型對遠離訓練集樣本的泛化能力)中,IsoDDE 展現出顯著的性能提升:
- 在最困難的相似度區間(0-20%),IsoDDE 達到 50% 的成功率,較 AlphaFold 3 提升超過 2 倍
- 其中 17 個成功預測是 AlphaFold 3 未能正確預測的
3.2 抗體-抗原界面預測
在包含 334 個結構的低同源性抗體-抗原測試集上:
- 高保真度區間(DockQ > 0.8):IsoDDE 達到 39%,較 AlphaFold 3(17%)提升 2.3 倍,較 Boltz-2(2%)提升 19.8 倍
- 正確預測區間(DockQ > 0.23):單種子情況下 IsoDDE 成功率達 63%
- 使用 1000 個模型種子後,高保真度預測率可達 59%
3.3 CDR-H3 環區預測
CDR-H3 環區是抗體可變性的主要來源。IsoDDE 以 ≤2Å 骨架 RMSD 預測 70% 抗體的 CDR-H3 環區,較 AlphaFold 3(58%)提升 1.2 倍,較 Boltz-2(43%)提升 1.6 倍。
3.4 結合親和力預測
在 ChEMBL 35 新發布的活性數據預測中,IsoDDE 在各靶點類別上保持較高性能。在適用於物理模擬的精選數據集上,其親和力預測超越 FEP+ 等金標準自由能微擾方法。
3.5 新口袋識別
在一般測試集上,IsoDDE 的口袋識別能力 AUPRC 優於 P2Rank 1.5 倍。這一能力使模型能夠發現此前僅可通過實驗方法識別的新口袋。
4. 典型案例
4.1 蛋白-配體案例
PDB 8EA6:配體在兩條 NKG2D 蛋白鏈界面處打開一個新的隱式口袋,形成三元複合物。配體作為變構蛋白-蛋白相互作用抑制劑發揮作用。
PDB 8E23:Pol θ 的變構抑制劑導致螺旋移動,在訓練集中未見的口袋中打開結合位點。
4.2 抗體-抗原案例
PDB 9FZD:納米抗體結合細菌外膜蛋白 A(OmpA)。訓練數據中無 OmpA 與納米抗體的複合物結構。
- IsoDDE 預測 DockQ 0.943,CDR-H3 骨架 RMSD 0.94Å
- AlphaFold 3 預測 DockQ 0.00,CDR-H3 RMSD 4.98Å(納米抗體定位在 OmpA 錯誤側)
PDB 8Q3J:抗體 Fv 結合小鼠 IL-38。
- IsoDDE 重鏈-抗原界面 DockQ 0.876,CDR-H3 RMSD 0.78Å
- AlphaFold 3 將重鏈和輕鏈方向翻轉,DockQ 0.060
5. 局限性與討論
5.1 訓練數據截止日期的影響
IsoDDE 與 AlphaFold 3 使用相同的訓練數據截止日期(2021年9月30日),這確保了比較的公平性,但也意味著模型無法利用此後發布的結構數據。
5.2 計算資源需求
抗體-抗原預測使用 1000 個種子可顯著提升性能,但這帶來了相應的計算開銷。對於工業級藥物發現流程,這種計算成本的可行性需要進一步評估。
5.3 實際驗證需求
基準測試表現與實際藥物項目中的價值之間可能存在差距。此外,模型在立體化學(手性、原子重疊)方面的表現需要更多獨立評估。
5.4 競爭格局
開源模型(如 Boltz-2、Chai-1)在可操控性和效率方面持續改進,雖然當前無條件準確性不及 IsoDDE,但其開放性和快速迭代能力可能縮小差距。
6. 結論
IsoDDE 在生物分子結構預測的泛化能力上實現了實質性進展。在蛋白-配體、抗體-抗原、新口袋識別等多個任務上,其性能較現有方法有顯著提升,且部分能力(如親和力預測)在特定條件下可超越傳統物理方法。
未來改進方向
- 擴展訓練數據覆蓋範圍
- 優化計算效率
- 增強立體化學約束的強制執行
- 在實際藥物項目中積累驗證數據
參考資料:
[1] Isomorphic Labs Team. Accurate Predictions of Novel Biomolecular Interactions with IsoDDE. Technical Report, February 2026.