首页

位置导航: 首页 > 业界动态 > 正文

Nature重磅综述:人工智能如何重新定义蛋白质设计

来源:分子之旅

访问:

2025-10-10 09:26

AI驱动蛋白质设计:从随机试错到精准创造的革命之路

蛋白质设计正经历一场由人工智能(AI)驱动的革命。传统方法在应对蛋白质序列空间的巨大复杂性和功能多样性时已接近极限,而AI工具的出现彻底改变了这一领域——从依赖试错的传统流程转变为精准预测、高效生成的全新范式。根据《Nature Reviews Bioengineering》最新综述,AI不仅大幅提升了蛋白质设计的效率,更为药物发现、生物技术和合成生物学带来了前所未有的机遇。

蛋白质设计的挑战与AI的崛起

蛋白质序列空间之庞大,远超人类直觉和传统计算方法的处理能力:一个典型的350个残基的蛋白质就有约10^455种可能序列,这比宇宙中的原子数量还要多出数十个数量级。传统依赖定向进化理性设计的策略各自存在局限性:定向进化劳动密集、耗时漫长;理性设计则受限于结构数据的可用性和准确性。

AI的介入改变了这一局面。深度学习模型能够从海量数据中自动推断蛋白质生物物理特性,发现传统方法难以捕捉的规律。从AlphaFold 2的革命性结构预测,到ProteinMPNN的逆折叠序列设计,再到RFDiffusion的生成能力,AI工具已经覆盖了蛋白质设计的全流程。


DFE8D

图 1:AI驱动蛋白质设计工具发展时间线


AI驱动蛋白质设计路线图

根据哈佛大学和莫纳什大学研究团队提出的实用路线图,AI驱动的蛋白质设计可分为两个主要策略和七个核心工具包:

两种策略选择

定向进化策略(关注"做什么")适合功能容易筛选但结构机制不清楚的情况。AI通过预测有益突变和从序列预测功能,大幅减少实验周期。

理性设计策略(关注"如何做")当结构和机制知识详细时更为有效。AI工具可以预测序列-结构-功能关系,甚至从头设计新蛋白质。

七大AI工具包

研究团队将AI工具分为七个功能各异的工具包,每个针对特定设计任务:


1.蛋白质数据库搜索:快速检索序列和结构模板; 2.蛋白质结构预测:准确推断3D结构和动力学; 3.蛋白质功能预测:从序列或结构推断功能; 4.蛋白质序列生成:针对特定目标设计序列; 5.蛋白质结构生成:创建符合功能目标的结构; 6.虚拟筛选:在实验验证前评估设计候选物; 7.DNA合成:将蛋白质序列反向翻译为优化DNA;

8F691

图 2: 人工智能学习范式和蛋白质设计模型架构


实践案例:AI蛋白质设计的成功应用

案例一:AAV衣壳蛋白的定向进化

研究人员使用AI驱动的定向进化设计了腺相关病毒(AAV)衣壳蛋白。通过在28个关键残基位置上引入随机突变,产生了10^10个AAV2变体的虚拟库。使用定制CNN和RNN模型筛选后,超过110,000个变体被实验验证为可行,其中一些携带多达29个突变,全部在没有结构指导的情况下完成。

案例二:抗体优化

ESM蛋白语言模型被用于优化临床成熟抗体。在仅两轮实验筛选中,仅筛选不到20个变 体就实现了结合亲和力最高160倍的提升,展示了AI在蛋白质工程中的强大效率。

案例三:从头设计荧光素酶

最令人印象深刻的是从头设计荧光素酶的工作。研究团队使用trRosetta进行序列-结构协同设计,产生了1,615个新颖支架。最终获得的LuxSit变体表现出卓越的热稳定性(熔解温度>95°C),并能高效催化合成底物的化学发光反应。

未来展望

AI驱动的蛋白质设计正在向更加复杂的功能发展:多域组装体复杂变构网络以及全蛋白质组设计都已成为可能的发展方向。随着数据基础的扩大和模型解释性的提高,AI有望设计出包含非经典氨基酸或全新化学骨架的系统,甚至实现整个蛋白质组的设计

伦理考虑也随着这一技术的发展而日益重要,特别是在合成生物学领域。研究人员需要确保这些强大工具的使用符合伦理标准,并促进科学知识的公平获取。

人工智能正在将蛋白质设计从一门艺术转变为精确的科学,为我们解决全球健康、可持续发展和能源挑战提供了全新工具。

原文链接:https://www.nature.com/articles/s44222-025-00349-8