原文:Isomorphic Labs Technical Report (February 2026)

摘要

IsoDDE 是 Isomorphic Labs 開發的藥物設計引擎,在 AlphaFold 3 架構基礎上實現顯著改進。在 Runs N' Poses 基準測試最難子集中,其蛋白-配體預測成功率達 50%,較 AlphaFold 3 提升超過 2 倍;在抗體-抗原界面預測上,高保真度預測比例較 AlphaFold 3 提升 2.3 倍。

1. 研發背景

1.1 AlphaFold 3 後的結構預測格局

AlphaFold 3 的發布確立了深度學習在生物分子結構預測中的主導地位。此後,領域內出現了多種 AlphaFold 風格的結構模型(如 Chai-1、Boltz-1/2、Protenix 等),主要通過架構調整、條件控制功能和推理時引導機制來改進模型性能。

1.2 泛化能力的核心挑戰

儘管近期進展顯著,基準測試揭示了模型在泛化至未探索分子空間時的持續失敗:

1.3 現有方法的局限

傳統分子對接工具依賴實驗測定的蛋白質結構作為輸入,無法真正實現從頭預測。更重要的是,現有模型在處理分佈外(out-of-distribution)數據時性能顯著下降,限制了其在 first-in-class 靶點發現和新型調控機制研究中的應用。

2. 技術架構概述

IsoDDE 的架構改進代表了自 AlphaFold 3 發布以來該領域的首次實質性精度躍升。

2.1 架構優化

模型保留了 AlphaFold 3 的核心元素——作用於成對表示的三角運算,但進行了多項優化:

2.2 生成建模的物理先驗引入

模型重新審視了生成建模的數學表述,引入了物理先驗知識。這包括對擴散過程的改進,以及在不同噪聲水平下對局部結構和全局構象的聯合優化。

2.3 推理時引導機制

與近期其他模型(如 Boltz-2)類似,IsoDDE 也具備推理時引導能力,可用於糾正物理不準確性(如錯誤的手性)。然而,與這些模型不同的是,IsoDDE 的無條件預測準確性本身已有顯著提升。

3. 性能評估

以下評估結果均基於論文報告的基準測試。IsoDDE 與 AlphaFold 3 使用相同的訓練數據截止日期(2021年9月30日),確保比較的公平性。

3.1 蛋白-配體結構預測

在 Runs N' Poses 基準測試(用於評估蛋白-配體共摺疊模型對遠離訓練集樣本的泛化能力)中,IsoDDE 展現出顯著的性能提升:

3.2 抗體-抗原界面預測

在包含 334 個結構的低同源性抗體-抗原測試集上:

3.3 CDR-H3 環區預測

CDR-H3 環區是抗體可變性的主要來源。IsoDDE 以 ≤2Å 骨架 RMSD 預測 70% 抗體的 CDR-H3 環區,較 AlphaFold 3(58%)提升 1.2 倍,較 Boltz-2(43%)提升 1.6 倍

3.4 結合親和力預測

在 ChEMBL 35 新發布的活性數據預測中,IsoDDE 在各靶點類別上保持較高性能。在適用於物理模擬的精選數據集上,其親和力預測超越 FEP+ 等金標準自由能微擾方法

3.5 新口袋識別

在一般測試集上,IsoDDE 的口袋識別能力 AUPRC 優於 P2Rank 1.5 倍。這一能力使模型能夠發現此前僅可通過實驗方法識別的新口袋。

4. 典型案例

4.1 蛋白-配體案例

PDB 8EA6:配體在兩條 NKG2D 蛋白鏈界面處打開一個新的隱式口袋,形成三元複合物。配體作為變構蛋白-蛋白相互作用抑制劑發揮作用。

PDB 8E23:Pol θ 的變構抑制劑導致螺旋移動,在訓練集中未見的口袋中打開結合位點。

4.2 抗體-抗原案例

PDB 9FZD:納米抗體結合細菌外膜蛋白 A(OmpA)。訓練數據中無 OmpA 與納米抗體的複合物結構。

PDB 8Q3J:抗體 Fv 結合小鼠 IL-38。

5. 局限性與討論

5.1 訓練數據截止日期的影響

IsoDDE 與 AlphaFold 3 使用相同的訓練數據截止日期(2021年9月30日),這確保了比較的公平性,但也意味著模型無法利用此後發布的結構數據。

5.2 計算資源需求

抗體-抗原預測使用 1000 個種子可顯著提升性能,但這帶來了相應的計算開銷。對於工業級藥物發現流程,這種計算成本的可行性需要進一步評估。

5.3 實際驗證需求

基準測試表現與實際藥物項目中的價值之間可能存在差距。此外,模型在立體化學(手性、原子重疊)方面的表現需要更多獨立評估。

5.4 競爭格局

開源模型(如 Boltz-2、Chai-1)在可操控性和效率方面持續改進,雖然當前無條件準確性不及 IsoDDE,但其開放性和快速迭代能力可能縮小差距。

6. 結論

IsoDDE 在生物分子結構預測的泛化能力上實現了實質性進展。在蛋白-配體、抗體-抗原、新口袋識別等多個任務上,其性能較現有方法有顯著提升,且部分能力(如親和力預測)在特定條件下可超越傳統物理方法。

未來改進方向

  • 擴展訓練數據覆蓋範圍
  • 優化計算效率
  • 增強立體化學約束的強制執行
  • 在實際藥物項目中積累驗證數據

參考資料:
[1] Isomorphic Labs Team. Accurate Predictions of Novel Biomolecular Interactions with IsoDDE. Technical Report, February 2026.

← 返回博客列表