原文:Chai Discovery Team, bioRxiv 2025
DOI:10.1101/2025.07.05.663018
摘要
Chai-2 是一款多模态生成模型,在全新抗体设计任务上实现了 16% 的实验成功率,相比此前计算方法提升超过 100 倍。在针对 52 个全新靶点的测试中,仅用单轮实验就在 50% 的靶点上发现了成功结合物,且多数具有高亲和力和良好的可开发性特征。这一突破性进展使得抗体发现可以在 24 孔板规模完成,将实验周期从数月缩短至两周,为生物制剂先导发现开辟了新的可能性。
1. 背景:抗体发现的困境
抗体药物已成为现代生物医药的重要支柱。截至 2022 年,单克隆抗体占美国和欧洲所有生物制药批准的一半以上。然而,传统的抗体发现流程面临诸多挑战:动物免疫与文库筛选资源密集且耗时漫长;获得的先导物通常需要数月的亲和力或可开发性优化;难以精确控制 desired binding site,对于难靶点往往束手无策。
计算方法有望改变这一局面,但现有方法的实验成功率 rarely exceed 0.1%,仍需依赖高通量实验筛选。Chai-2 的发布标志着这一局面的实质性改变。
2. 技术方法:零样本生成架构
2.1 核心设计流程
Chai-2 采用"零样本"(zero-shot)设计策略:
- 输入:靶点结构 + 表位残基列表(仅需少数几个残基)
- 生成:设计模型生成序列和全原子结构
- 排序:计算模型对设计进行排序和筛选
- 验证:直接进入小规模生化实验(如 24 孔板格式)
- 表征:确定定量结合亲和力
整个流程从表位定义到实验验证仅需约两周。
2.2 技术架构改进
相比前代 Chai-1,Chai-2 的折叠模块在抗体-抗原复合物预测上实现了两倍于实验精度的提升。
- 多模态生成:支持 scFv 抗体、VHH 纳米抗体、迷你蛋白等多种结合物格式
- 多靶点提示:可同时针对多个靶点设计,实现定制化的交叉反应性
- 无需逐靶点调优:所有能力均通过零样本实现,无需针对特定靶点微调
3. 实验验证:从迷你蛋白到抗体
3.1 迷你蛋白设计:建立基准
研究团队首先以迷你蛋白设计作为基准测试,选取五个此前文献中研究过的靶点。Chai-2 在每个靶点上的成功率均为此前最优方法的至少三倍。
特别值得注意的是 TNFα——这一被估计为 PDB 中计算设计难度前 1% 的靶点,此前尚无计算方法成功设计的报道,而 Chai-2 实现了突破。
亲和力:IL-7Rα、PD-L1、PDGFRβ、InsulinR 达到皮摩尔级,TNFα 达到低纳摩尔级。
3.2 抗体设计:核心突破
在更具难度的抗体设计任务上,Chai-2 实现了历史性突破:
- 52 个全新靶点,PDB 中无已知抗体
- 每个靶点设计 ≤20 个抗体或纳米抗体
- 靶点成功率:50% (26/52 个靶点至少获得一个成功结合物)
- 总体命中率:16% (VHH 20.0%,scFv 13.7%)
- 与此前方法对比:>100× 提升 (此前 <0.1%)
这一结果是计算方法在全新抗体设计上的首次双位数成功率,具有里程碑意义。
3.3 设计质量评估
- 结构新颖性:绝大多数设计与已知抗体 RMSD > 10Å
- 序列新颖性:所有设计的 CDR 编辑距离 > 10
- 多样性:多数靶点包含多个结构聚类
- 可开发性:与现有治疗性单克隆抗体相当
- 亲和力:EFNA 2.2 nM、VATF 80 nM、CSF1 17 nM 等
4. 应用展示:灵活的设计能力
以 CCL2 为例,研究团队展示了 Chai-2 的灵活提示能力:
同一靶点,两个不同表位,每种表位生成 VHH 和 scFv 两种格式。
- VHH:4/20 成功(20% 命中率)
- scFv:5/20 成功(25% 命中率)
Chai-2 还支持交叉反应性设计,可同时针对多个蛋白设计。
5. 意义与展望
5.1 对抗体发现流程的影响
- 实验规模:可在 24 孔板中完成,无需高通量筛选
- 时间线:从表位到实验验证仅需两周
- 反馈循环:设计-验证反馈循环的收紧,使得快速迭代优化成为可能
- 靶点覆盖:50% 的测试靶点成功率表明该方法具有广泛适用性
5.2 技术演进脉络
Chai-2 的成功建立在多项技术积累之上:AlphaFold2(结构预测)→ RoseTTAFold/RFdiffusion(扩散模型在蛋白质设计)→ Chai-1(多模态结构预测)→ Chai-2(抗体设计的生成式建模)。这一演进体现了从"预测"到"设计"、从"结构"到"功能"的发展趋势。
5.3 局限性与挑战
- 高亲和力预测:预测哪些设计将具有高亲和力仍具挑战
- 表位选择:当前方法需要预先指定表位
- 体内性能:计算设计的抗体在体内的稳定性、免疫原性等仍需进一步验证
6. 结论
Chai-2 在全新抗体设计任务上实现了从 <0.1% 到 16% 的跨越式提升,标志着计算方法在生物制剂发现领域的实质性突破。"24孔板"规模的实验流程和两周的时间线,为抗体发现提供了新的可能性。这一进展不仅代表了算法层面的进步,更可能重塑生物制剂先导发现的标准策略。随着计算设计成功率的持续提升,传统的高通量筛选方法可能逐渐让位于更精准、更高效的计算-实验闭环流程。
参考资料
Chai Discovery Team. (2025). Zero-shot antibody design in a 24-well plate. bioRxiv. https://doi.org/10.1101/2025.07.05.663018
← 返回博客列表