PocketXMol原子级生成式AI大模型发布:统一3D小分子与多肽药物设计新范式

超能小量子
2026-06-10 15:58:41
人工智能
生命科学
行业动态
本帖最后由 超能小量子 于 2026-6-10 16:44 编辑


人工智能在分子结构预测与药物设计领域正经历着深刻的变革,但现有的主流模型往往受限于特定的分子类型或任务,缺乏通用的底层表示能力。针对这一核心挑战,清华大学等机构的联合团队发布了通用原子级生成式 AI 大模型 PocketXMol。该模型通过将一切分子抽象为原子和化学键的集合,首次在同一框架内实现了小分子与多肽 3D 结构预测和从头设计的大一统。在涵盖 13 项药物设计任务的严苛评估中,PocketXMol 击败了包括 AlphaFold 3 在内的 55 个前沿模型,并成功通过了湿实验验证,设计出具有高特异性的 Caspase-9 小分子抑制剂和高亲和力的 PD-L1 靶向抗癌多肽,展现了从计算到临床转化的巨大潜力。




 .研究背景


近年来,人工智能在分子结构预测与药物设计领域确实取得了革命性的进展,例如 AlphaFold 3 等模型的问世极大地推动了结构生物学的发展。然而,当前的主流 AI 生成模型往往局限于特定的分子类型或任务,例如专门用于小分子对接,或者专门用于多肽序列设计,它们高度依赖为特定任务量身定制的算法与先验分布。这种各自为战的局面源于一个核心挑战:不同类型的分子,如小分子与蛋白质,通常使用截然不同的底层表示方式,这本质上限制了模型在不同分子类型和任务之间的迁移与通用性。


此外,虽然自然语言提示在大型语言模型中大放异彩,但对于定义涉及复杂空间关系或多个分子片段的微观化学任务而言,自然语言显得过于模糊,不够精确。由于所有的分子交互任务归根结底都受制于基础的原子间相互作用物理法则,研究团队提出了一个核心设问:我们能否开发一个统一的、基于原子级别的 AI 基础模型,通过学习海量数据来捕捉最底层的分子相互作用,从而在一个框架内解决所有基于口袋的药物生成任务?


 .研究方法


为了打破现有模型的局限性,近日,清华大学马剑竹、首都医科大学宣武医院王子华、北京大学韩传辉、清华大学王新泉联合研究团队构建了 PocketXMol 模型。该模型摒弃了传统的氨基酸序列或特定化学基团的显式建模,直接将输入的分子抽象为最基础的原子化学键的集合。为了实现多任务的统一,模型引入了三个关键的技术组件。


 1.原子级任务提示(Task Prompt。研究团队创新性地使用二进制指示符来精确控制哪些原子或化学键是已知的,哪些是需要生成的。这种方法比文本提示更精确地定义了输入和输出的空间与结构关系,完美适配了微观化学任务的需求。


 2.通用去噪器(Universal Denoiser。该架构能够自动识别输入分子中不同任务对应的噪声类型和尺度。这使得不同任务的数据分布被映射到一个统一的噪声空间中,从而允许模型在不进行任何特定任务微调的情况下,直接进行联合多任务训练并应用于新任务。


 3.统一的原子级分子表示。无论是小分子还是线性/环状多肽,在模型眼中都是原子级别的三维排布。这种表示不仅无缝衔接了各类分子,还使其天然具备了设计非天然氨基酸(NAA)的能力,这对于现代多肽药物开发至关重要。


在训练阶段,研究团队构建了一个包含超 1100 万个小分子、数万个蛋白质-多肽以及蛋白质-小分子复合物的三维结构超大规模数据集对 PocketXMol 进行了联合训练。


 .研究结果与结论


在计算性能的验证上,研究团队对 PocketXMol 进行了全方位的评估。在涵盖小分子对接、多肽对接、3D 构象预测、基于结构的药物设计(SBDD)、PROTAC(蛋白降解靶向嵌合体)设计、片段连接与生长、分子优化、线性与环状多肽设计等 13 项计算生成任务中,PocketXMol 55 个基准模型进行了对比。结果显示,PocketXMol 在其中 11 项任务上取得了当前最佳(State-of-the-art)的表现,并在剩余 2 项任务中保持了极高的竞争力。


 为了验证该 AI 模型的真实临床转化潜力,研究团队针对具有高度挑战性的抗肿瘤靶点进行了严格的湿实验验证。在 Caspase-9 小分子抑制剂的设计中,现有的泛 Caspase 抑制剂难以对 Caspase 家族成员进行有效区分。研究团队利用 PocketXMol 专门设计了新型抑制剂,在合成的 16 种分子中,优化后的化合物(如 D12)不仅能强效抑制 Caspase-9 及下游 Caspase-3 的激活,其抑制效力甚至可与市面上的商业泛 Caspase 抑制剂(如 QVD)相媲美。酶学实验进一步证实,D12 不直接抑制 Caspase-3,展现出了高度的靶向特异性。


 在靶向 PD-L1 的抗癌多肽开发中,PocketXMol 直接从头设计了数十种候选多肽。在实验合成并测试的 382 种多肽中,有 15 种候选多肽对 PD-L1 的结合亲和力(KD)达到了惊人的 10⁻⁸M 级别,这一命中率远远超过了传统随机多肽文库的筛选效率。细胞实验证实,代表性多肽(如 P282)能够特异性地结合在 PD-L1 阳性肺癌细胞的细胞膜上,并有效阻断 PD-1 PD-L1 的相互作用。更为关键的是,活体动物荧光成像实验表明,通过静脉注射的荧光标记 AI 多肽能够快速、精准地在小鼠的肿瘤部位富集,展示了其作为肿瘤诊断探针及靶向治疗药物的巨大潜力。


 .总结与展望


这项工作标志着人工智能在微观分子世界基础大模型构建上迈出了里程碑式的一步。PocketXMol 模型通过学习最底层的原子级相互作用,成功弥合了 3D 结构预测与分子生成设计之间的鸿沟,首次证明了单一的 AI 基础模型足以胜任并统一涵盖小分子、多肽以及 PROTAC 等多种模态的药物设计任务。凭借其卓越的计算性能与已被实验证实的真实靶向药物设计能力,PocketXMol AI 驱动的创新药发现(AIDD)提供了一个强大而通用的平台,有望极大加速未来各类重大疾病新型疗法的研发进程。



原文地址:https://mp.weixin.qq.com/s/qQwOW4TyaGS0Hs2V03Syyw


43
0
0
0
关于作者
相关文章
  • JCTC | AI赋能分子晶体结构预测:基于类似物模板策略的高效采样 ...
    分子晶体结构预测(CSP)是材料发现领域的重要计算工具,但其核心瓶颈在于计算成本高昂,这主要 ...
    了解详情 
  • Kaiwu-PyTorch-Plugin v0.2.0发布|支持Q-Diffusion,生成任务能 ...
    摘要给扩散模型装上“能量导航”;蛋白质生成和单细胞分析任务更精准更新概览Kaiwu-Py ...
    了解详情 
  • MASTER:面向自主催化剂发现的分层多智能体大语言模型推理框架 ...
    异相催化剂在氢能制备、CO₂还原、氨合成、燃料电池及石油化工等领域具有广泛应用。传统的催化剂 ...
    了解详情 
  • 再不学量子编程就晚了!玻色量子发布学练考用全套秘籍让你从入门 ...
    2025年政府工作报告两度点名量子科技。玻色量子积极响应政府政策,推出国内首个“四阶成长& ...
    了解详情 
领取成功
本月5个550bit真机配额已发放给您,配额将在2个月后到期,请及时使用哦~
活动中心
联系我们
二维码
返回顶部
返回
活动中心

完成任务,轻松获取真机配额

×
每日必做
新手任务
长期任务
其他任务
快速回复 返回顶部 返回列表
玻色有奖小调研
填写问卷,将免费赠送您1个1000bit真机配额
(单选) 您是从哪个渠道得知我们的?*
您是从哪个社交媒体得知我们的?*
您是通过哪个学校的校园宣讲得知我们的呢?
取消

提交成功

真机配额已发放到您的账户,可前往【云平台】查看

量子AI开发者认证

考核目标

开发者能够成功搭建Kaiwu-PyTorch-Plugin项目基础环境,并成功运行示例代码,根据示例提示,输出指定的值并填写至相应的输入框中。

通过奖励

5个一年效期的1000量子比特真机配额

专属「量子AI开发者」社区认证标识

开发者权益

每月固定权益:5个550量子比特真机配额
前往考核

第一步

按照README提示成功安装Kaiwu-PyTorch-Plugin库环境依赖
前往GitHub

第二步

运行 community-assessment 分支下的 run_rbm.py 代码示例

第三步

理解示例代码,手动打印并填写如下数值:

正相采样的状态

负相采样的状态

正相的能量值

负相的能量值

*

提交答案

开发者权益

每月固定权益:5个550量子比特的真机配额

恭喜您完成考核

您将获得量子AI开发者认证标识及考核奖励

1000 bit*5

配额

Quantum AI Developer Certification

Assessment Objectives

Developers should successfully set up the basic environment for the Kaiwu-PyTorch-Plugin project, run the QBM-VAE sample code, and calculate the correct FID value based on the random seed value provided by the system.

Pass Rewards

10 quotas for 550-qubit real quantum machines with a one-year validity period

Exclusive "Quantum AI Developer" Community Certification Badge

Developer Benefits

Fixed Monthly Benefits: 5 quotas for 550-qubit real quantum machines
Proceed to Assessment

Step 1

Install the environment dependencies for the Kaiwu-PyTorch-Plugin library according to the README instructions
Go to GitHub

Step 2

Replace the Seed Value

Your seed value is

Step 3

Enter the FID Value You Calculated

*

Submit Answer

Developer Benefits

Fixed Monthly Benefits: 5 quotas of 550-qubit real machines

Congratulations on Completing the Assessment

You will receive the Quantum AI Developer Certification Badge and Assessment Rewards

550bit*10

Quotas