NMRMind:AI驱动的多维NMR谱图到分子结构的精准解析

Akkio
2025-11-13 17:39:50
生命科学
算法解析

核磁共振(NMR)波谱学一直被视为有机分子结构解析的“金标准”,然而,其传统解析流程高度依赖专业人员的经验,不仅耗时费力,在面对复杂天然产物或低信噪比样品时更显得效率不足。尽管人工智能技术已被尝试用于辅助NMR解析,但现有方法多局限于单维谱图匹配或局部结构片段拼接,尚未实现从原始多维NMR数据到完整分子结构的端到端精准推断。



近期,中国医学科学院药物研究所汪小涧研究团队联合相关课题组,提出了一种多维NMR解析模型——NMRMind,实现了从1D/2D NMR谱图直接生成分子结构的端到端智能解析。相关成果以“NMRMind: A Transformer-Based Model Enabling the Elucidation from Multidimensional NMR to Structures”为题发表于国际化学权威期刊《Analytical Chemistry》。



  NMRMind模型的核心创新


本研究研发了一种基于Transformer架构的深度学习模型——NMRMind,能够直接从多维NMR谱图(包括¹H、¹³C、COSY、HSQC、HMBC等)生成完整的分子SMILES结构(图1)。与传统计算机辅助结构解析(CASE)系统依赖规则或片段库不同,NMRMind通过大规模预训练与多模态微调,构建了从谱图信号到化学结构的“智能映射”。



图1. NMRMind模型架构与工作流程示意图。多维NMR谱图经离散化编码后输入Transformer编码器,解码器输出SMILES结构。输入谱图表示方式:1D谱以化学位移token表示(如H_7.21),2D谱以坐标对形式(如C_120.5|H_6.89)输入。模型应用于天然产物结构解析和有机合成中未知产物的结构推断。


研究团队构建了迄今最大规模的1D&2D NMR-结构配对数据集,包含220万条分子及其模拟的1D/2D NMR谱图,并利用4500万条¹H/¹³C谱图进行预训练。其次,NMRMind引入混合模态输入机制,可灵活整合分子式、结构片段等先验信息,并采用混合模态dropout策略增强模型在谱图缺失情况下的鲁棒性。


表1. NMRMind在不同输入条件下的准确性



  卓越的性能与实际应用验证


研究表明,NMRMind在多种输入条件下均表现出极高的准确性。如表1所示,在输入完整多维NMR数据时,其Top-1结构准确率高达92.07%,且单次解析耗时不足0.05秒。即便仅使用NMR谱图(不提供分子式),其准确率仍保持在85.10%的高水平。


更为重要的是,NMRMind在真实场景中得到了成功验证。在天然产物研究中,该模型辅助鉴定了厚朴提取物中的6个全新化合物。



图2. 真实实验验证:厚朴提取物中6个新天然产物的AI辅助解析结果。NMRMind预测结构与最终经人工验证的正确结构对比,显示高一致性。化合物6的PTP1B抑制活性验证,证实其药物潜力。


其中,化合物6被发现具有强效的PTP1B抑制活性(IC₅₀ = 1.97 μM),显示出显著的药物开发潜力。此外,在有机合成领域,NMRMind被用于识别反应中难以预料的副产物结构。这为快速阐明反应机理提供了强大工具,显著加速了合成路线优化。



图3. NMRMind迅速识别出由六个有机反应(a-f)产生的意外产物。


  总结与展望


本研究研发的NMRMind模型,成功突破了传统NMR结构解析的效率与精度瓶颈。其端到端的智能解析能力,不仅极大地缩短了分子结构鉴定周期,更在天然产物发现、反应机理解析及药物先导化合物筛选等领域展现出巨大的应用潜力。此项工作标志着化学结构表征正迈向“AI驱动”的新范式,并为全球化学智能社区的发展提供了重要的工具与数据基础。



参考资料


Xue, X., Sun, H., Sun, J., Patiny, L., Liu, X., Chen, K., Yan, J., Li, L., Liu, X., Xu, S. and Zhang, D., 2025. NMRMind: A Transformer-Based Model Enabling the Elucidation from Multidimensional NMR to Structures. Analytical Chemistry.


https://doi.org/10.1021/acs.analchem.5c03783





文章改编转载自微信公众号:DrugAI


原文链接:https://mp.weixin.qq.com/s/6r82KiENL5w9DO65-SiRvw

597
0
0
0
关于作者
相关文章
  • GPU 赋能晶体结构预测:CRYSIM 让超大晶体 “对称密码” 精准破 ...
    本文解读 Communications Physics 2025 年论文《Predicting symmetric structures of large crys ...
    了解详情 
  • 桥梁健康监测的未来:基于变分自编码器(VAE)与无监督学习(HUM ...
    研究背景:随着全球基础设施老化,桥梁作为交通的主要枢纽,其健康状况关系到社会的稳定与安全。 ...
    了解详情 
  • AI 逆向设计复合材料新突破:VAE-CDGM + 贝叶斯优化,精准生成高 ...
    同济大学团队在《Computer Modeling in Engineering & Sciences》2026 年 146 卷发表该研究,提 ...
    了解详情 
  • 综述:多尺度模拟与机器学习在高熵合金研究中的当前应用现状 ...
    上海交通大学与武汉理工大学团队在《Journal of Materials Research and Technology》2023 年 26 ...
    了解详情 
  • 物理学家用扩散模型(四):Score Matching + 加噪=NCSN ...
    上一篇:物理学家用扩散模型(三):反向SDE从噪声生成目标分布3.5 Score Matching3.5.1 Fisher ...
    了解详情 
领取成功
本月5个550bit真机配额已发放给您,配额将在2个月后到期,请及时使用哦~
活动中心
联系我们
二维码
返回顶部
返回
活动中心

完成任务,轻松获取真机配额

×
每日必做
新手任务
长期任务
其他任务
快速回复 返回顶部 返回列表
玻色有奖小调研
填写问卷,将免费赠送您1个1000bit真机配额
(单选) 您是从哪个渠道得知我们的?*
您是从哪个社交媒体得知我们的?*
您是通过哪个学校的校园宣讲得知我们的呢?
取消

提交成功

真机配额已发放到您的账户,可前往【云平台】查看

量子AI开发者认证

考核目标

开发者能够成功搭建Kaiwu-PyTorch-Plugin项目基础环境,并成功运行示例代码,根据示例提示,输出指定的值并填写至相应的输入框中。

通过奖励

5个一年效期的1000量子比特真机配额

专属「量子AI开发者」社区认证标识

开发者权益

每月固定权益:5个550量子比特真机配额
前往考核

第一步

按照README提示成功安装Kaiwu-PyTorch-Plugin库环境依赖
前往GitHub

第二步

运行 community-assessment 分支下的 run_rbm.py 代码示例

第三步

理解示例代码,手动打印并填写如下数值:

正相采样的状态

负相采样的状态

正相的能量值

负相的能量值

*

提交答案

开发者权益

每月固定权益:5个550量子比特的真机配额

恭喜您完成考核

您将获得量子AI开发者认证标识及考核奖励

1000 bit*5

配额

Quantum AI Developer Certification

Assessment Objectives

Developers should successfully set up the basic environment for the Kaiwu-PyTorch-Plugin project, run the QBM-VAE sample code, and calculate the correct FID value based on the random seed value provided by the system.

Pass Rewards

10 quotas for 550-qubit real quantum machines with a one-year validity period

Exclusive "Quantum AI Developer" Community Certification Badge

Developer Benefits

Fixed Monthly Benefits: 5 quotas for 550-qubit real quantum machines
Proceed to Assessment

Step 1

Install the environment dependencies for the Kaiwu-PyTorch-Plugin library according to the README instructions
Go to GitHub

Step 2

Replace the Seed Value

Your seed value is

Step 3

Enter the FID Value You Calculated

*

Submit Answer

Developer Benefits

Fixed Monthly Benefits: 5 quotas of 550-qubit real machines

Congratulations on Completing the Assessment

You will receive the Quantum AI Developer Certification Badge and Assessment Rewards

550bit*10

Quotas