Nature:破译蛋白质隐形能量景观,从“看结构”到“控动态”的革命

Jack小新
2026-05-20 02:43:31
人工智能
生命科学
论文精读与讲座笔记
本帖最后由 Jack小新 于 2026-5-20 02:56 编辑


本文解读Nature 2026研究《Large-scale discovery, analysis and design of protein energy landscapes》,科学家开发多重氢氘交换质谱 mHDX‑MS高通量技术,一次性解析5778 个蛋白质结构域的构象能量 landscape,系统揭示蛋白在折叠态、部分展开态与高能激发态间的微观波动规律。研究首次证实:即便整体折叠与全局稳定性高度相似,不同蛋白的局部动态与稳定性分布可存在巨大差异,低协同性蛋白常存在整条二级结构的脆弱区段,并基于机器学习实现定点突变稳定化设计。成果为抗体药物优化、工业酶改造、蛋白疫苗设计提供前所未有的大数据基础。




蛋白质从来不是一张静止的结构图片。在细胞内,每一个蛋白质分子都在持续不断地运动:局部片段开合、螺旋末端轻微解旋、折叠核心短暂松动、甚至整条结构单元瞬间 “松开”。这些转瞬即逝的高能构象虽然占比极低,却是决定蛋白质功能、稳定性、药物结合、聚集倾向与免疫原性的真正关键。传统结构生物学,包括 AlphaFold 在内,大多只给出能量最低的 “基态” 结构,却无法描述这些无处不在、影响重大的动态波动。长期以来,这些高能态被称为结构生物学的 “黑暗物质”,难以观测、更难以规模化研究。


这项工作的问世,助力人类真正打开了蛋白质动态世界的大门。研究团队开发了一套多重氢氘交换质谱(mHDX‑MS)技术,能够在一次实验中并行测量数百个蛋白质的构象波动能量,在完全相同的条件下系统分析了5778 个蛋白质结构域,构建了迄今为止全球最大规模的蛋白质能量景观数据库。这项工作不仅刷新了观测尺度,更回答了一系列长期悬而未决的根本问题:结构相似的蛋白动态是否相似?局部不稳定区段如何分布?哪些序列与结构特征决定协同性?我们能否理性设计更稳定、波动更小的蛋白质?答案将直接重塑下一代蛋白药物、工业酶与诊断试剂的研发逻辑。


一、为什么蛋白质的 “隐形动态” 决定药物成败


理解蛋白质能量景观,最简单的方式是把它想象成一片高低起伏的山谷地形。能量最低的谷底是天然折叠态,山坡上是各种部分展开的高能态,山顶则是完全去折叠状态。在真实体系中,蛋白质并非静止在谷底,而是持续在不同能级之间热涨落。这些涨落直接决定了一个蛋白质能否成药、好不好用、稳不稳定。


高能态与局部波动至少在四大场景起决定性作用。第一,稳定性与聚集:局部脆弱区段频繁展开,会暴露出疏水核心,引发蛋白聚集、沉淀、失活。第二,药物结合:许多药物靶点只有在构象打开、隐藏口袋暴露时才能结合,静态结构完全看不到。第三,酶催化:催化循环往往依赖特定区段的开合与构象重排,动态决定催化效率。第四,免疫原性:部分展开的序列片段更容易被免疫系统识别,引发不必要的副作用。


长期以来,科研人员只能通过单点突变、圆二色、DSC 等手段测量 “整体稳不稳定”,完全不知道哪里不稳定、何时不稳定、为何不稳定。传统氢氘交换虽然能观测动态,但一次只能测一个蛋白,耗时长、成本高、难以形成规模。没有大规模数据,就无法建立预测模型,更无法实现理性设计。而这项 Nature 研究,正是从根本上打破了这一瓶颈。


二、mHDX‑MS:一次给数千个蛋白绘制 “动态能量指纹”


这项研究的核心突破,是建立了一套可规模化、并行化、高通量的多重氢氘交换质谱流程(mHDX‑MS)。它的原理清晰而优美:蛋白质中骨架酰胺氢在折叠紧密、结构稳定的区域难以被氘取代;反之,在波动大、松散、高能态易暴露的区域,氢氘交换速率显著加快。通过精确测量交换速率,就能直接推算出每个区域的开放自由能 ΔGopen,从而描绘出整条肽链的稳定性分布。


为了实现高通量,研究团队做了三项关键创新:首先,将多达数百个蛋白质混合表达、同时检测,不做单独纯化;其次,在pH6pH9双条件下各设置32 个时间点,从 25 秒到 24 小时全覆盖,捕捉快慢不同的动力学过程;最后,通过一套完整的贝叶斯推断计算流程,从质谱信号中反推出每个可交换位点的交换速率与开放自由能。最终,每个蛋白都会得到一条 “能量指纹谱”:按稳定性从高到低排序,清晰显示哪些区域坚固、哪些区域脆弱。


1.氢氘交换速率与开放自由能的关系



速率kHX,i由局部结构开放自由能∆Gopen,i决定,值越小说明片段越稳定、越难打开。


2.全局折叠自由能由最稳定区段决定



整体稳定性由蛋白中最稳定的 5 个位点平均值决定,对应整体去折叠能垒。


3.平均开放自由能



数值越低说明整体波动越强、局部松散区域越多,协同性越差。


这组公式将看不见的构象波动,变成可测量、可比较、可建模的定量指标,让蛋白质动态第一次真正进入大数据时代。



图1 mHDX-MS 工作流程与能量景观原理示意图


三、三大颠覆性发现:改写我们对蛋白质结构与动态的认知



图2 蛋白稳定性与开放协同性全景分布图


在对近 6000 个结构域系统分析后,研究团队得出了一系列颠覆传统认知的结论,每一条都直接指向应用。


1. 结构几乎一样,动态可以完全不同


研究最令人意外的结论之一:折叠拓扑、全局稳定性几乎一样的蛋白质,能量景观可以天差地别。有些蛋白呈现高度协同的 “全有或全无” 式行为,几乎没有局部低能态;另一些则在远低于整体去折叠能量的位置,出现大量局部开放事件。这解释了一个长期困惑工业界的问题:为什么有些抗体序列结构接近、表达量类似,但储存稳定性、聚集倾向、免疫原性差异巨大。答案不在静态结构里,而在能量景观中。


2. 低协同蛋白的脆弱点不是零散残基,而是整条二级结构


研究通过 NMR 位点解析进一步证实:低协同性蛋白的不稳定区域通常是一整条 α 螺旋或一整段 β 折叠,而非零散残基。也就是说,蛋白质不是 “这里松一点、那里松一点”,而是 “某一整片结构单元随时可能松开”。这是导致蛋白药物聚集、降解、免疫原性升高的核心源头。过去我们靠经验盲目突变,现在可以直接定位、精准加固。



图3 低协同蛋白脆弱区段集中在整条二级结构


3. 机器学习成功预测协同性,并实现数据驱动稳定化设计


团队基于序列与结构特征训练模型,发现紧凑度、脯氨酸数量、螺旋末端电荷、非极性接触等特征与协同性显著相关,并据此设计双突变,定向加固脆弱区段。实验显示,设计突变体显著提升协同性与稳定性,且效果明显优于随机突变。这标志着人类第一次基于大规模动态数据,理性设计蛋白质波动特性



图4 决定蛋白开放协同性的关键结构特征


四、产业价值:抗体、酶、疫苗、蛋白药物全面进入 “动态优化” 时代


这项成果的产业价值极其直接,几乎覆盖所有蛋白产品领域。在抗体药物开发中,可以快速筛选动态温和、局部稳定、免疫原性低的候选分子,降低临床失败率。在工业酶领域,可精准加固易波动区段,提升高温、酸碱条件下的耐受性。在蛋白疫苗设计中,可以控制动态程度,既保证免疫暴露又不引发过度自身反应。在长效蛋白药物中,可以显著降低聚集与降解风险,延长半衰期。


过去,蛋白质优化主要围绕静态结构;未来,能量景观与动态协同性将成为核心设计指标。更稳定、更低波动、更可预测的新一代蛋白质将由此诞生。



图5 数据驱动突变提升蛋白协同性实验结果


五、量子计算加速蛋白能量景观预测


在 Nature 研究构建的大规模实验数据基础之上,传统机器学习仍然面临一个底层瓶颈:蛋白质能量景观本质是高维概率分布,其采样服从玻尔兹曼分布,而经典计算机做吉布斯采样极慢,很容易困在局部最优,无法高效遍历高能激发态与脆弱构象。


玻尔兹曼机(Boltzmann Machine)正是为学习这种分布而生的经典模型,它以能量函数为核心、以玻尔兹曼分布为概率准则,与蛋白质能量景观的物理本质高度契合。但在经典硬件上,玻尔兹曼机的采样与训练速度极慢,无法处理数千蛋白、百万突变体的规模。


玻色量子的相干光量子计算机(CIM)与自研的量子玻尔兹曼机(QBM),恰好从物理底层解决这一难题。玻色量子推出的驭量・山海 1000是国内首个千比特级相干伊辛机,通过光脉冲相位编码 “光学自旋”,以测量 — 反馈机制快速求解伊辛模型,天然适合做高效概率采样。


由于蛋白质能量景观可以直接映射为伊辛模型哈密顿量,量子系统可以在微秒量级完成一次高质量采样,速度比经典 MCMC 快百万倍。更重要的是,通过调节泵浦功率引入可控量子噪声,CIM 可以从 “优化器” 变成 “概率采样器”,直接输出符合玻尔兹曼分布的构象样本,完美匹配蛋白质动态的统计规律。


这一组合或能够让蛋白质动态设计真正从 “大数据时代” 迈向量子加速时代


六、总结


这项研究标志着蛋白质科学从静态结构时代正式进入动态能量景观时代。借助 mHDX‑MS 高通量技术,人类首次规模化观测、定量描述、理性设计蛋白质的隐形高能波动,揭示了协同性、局部稳定性、序列 — 结构 — 动态关系的底层规律。成果直接支撑抗体、酶、疫苗、蛋白药物的下一代研发,让更稳定、更安全、更高效的分子设计成为现实。量子计算技术的出现,则为这一革命提供了下一代算力底座,让蛋白质动态模拟与设计进入更快、更准、更海量的新阶段。



论文链接:https://www.nature.com/articles/s41586-026-10465-z


17
0
0
0
关于作者
相关文章
  • npj Comput Mater|AtomNet:物理信息驱动多边图神经网络用于晶 ...
    原文地址:https://doi.org/10.1038/s41524-026-02131-9代码地址:https://github.com/JieCoa/At ...
    了解详情 
  • StoL框架:化学增强扩散模型驱动的小分子到大分子构象生成新方法 ...
      研究背景与科学问题分子构象——即原子在三维空间中的精确排列—— ...
    了解详情 
  • 原子无序不再难解!AI + 蒙特卡洛框架精准预测无序材料宏观物性 ...
    本文解读ACS Nano 2025论文,提出等变图神经网络(GNN)与蒙特卡洛(MC)模拟相结合的一体化计算 ...
    了解详情 
  • 酶的「瘦身革命」—— 用蛋白质语言模型给工业酶精准减重 ...
    导读:一把剪刀剪掉多余的氨基酸,活性位点却丝毫不动 —— 这不是科幻,而是来自 Imp ...
    了解详情 
领取成功
本月5个550bit真机配额已发放给您,配额将在2个月后到期,请及时使用哦~
活动中心
联系我们
二维码
返回顶部
返回
活动中心

完成任务,轻松获取真机配额

×
每日必做
新手任务
长期任务
其他任务
快速回复 返回顶部 返回列表
玻色有奖小调研
填写问卷,将免费赠送您1个1000bit真机配额
(单选) 您是从哪个渠道得知我们的?*
您是从哪个社交媒体得知我们的?*
您是通过哪个学校的校园宣讲得知我们的呢?
取消

提交成功

真机配额已发放到您的账户,可前往【云平台】查看

量子AI开发者认证

考核目标

开发者能够成功搭建Kaiwu-PyTorch-Plugin项目基础环境,并成功运行示例代码,根据示例提示,输出指定的值并填写至相应的输入框中。

通过奖励

5个一年效期的1000量子比特真机配额

专属「量子AI开发者」社区认证标识

开发者权益

每月固定权益:5个550量子比特真机配额
前往考核

第一步

按照README提示成功安装Kaiwu-PyTorch-Plugin库环境依赖
前往GitHub

第二步

运行 community-assessment 分支下的 run_rbm.py 代码示例

第三步

理解示例代码,手动打印并填写如下数值:

正相采样的状态

负相采样的状态

正相的能量值

负相的能量值

*

提交答案

开发者权益

每月固定权益:5个550量子比特的真机配额

恭喜您完成考核

您将获得量子AI开发者认证标识及考核奖励

1000 bit*5

配额

Quantum AI Developer Certification

Assessment Objectives

Developers should successfully set up the basic environment for the Kaiwu-PyTorch-Plugin project, run the QBM-VAE sample code, and calculate the correct FID value based on the random seed value provided by the system.

Pass Rewards

10 quotas for 550-qubit real quantum machines with a one-year validity period

Exclusive "Quantum AI Developer" Community Certification Badge

Developer Benefits

Fixed Monthly Benefits: 5 quotas for 550-qubit real quantum machines
Proceed to Assessment

Step 1

Install the environment dependencies for the Kaiwu-PyTorch-Plugin library according to the README instructions
Go to GitHub

Step 2

Replace the Seed Value

Your seed value is

Step 3

Enter the FID Value You Calculated

*

Submit Answer

Developer Benefits

Fixed Monthly Benefits: 5 quotas of 550-qubit real machines

Congratulations on Completing the Assessment

You will receive the Quantum AI Developer Certification Badge and Assessment Rewards

550bit*10

Quotas