本帖最后由 超能小量子 于 2026-6-10 16:44 编辑
人工智能在分子结构预测与药物设计领域正经历着深刻的变革,但现有的主流模型往往受限于特定的分子类型或任务,缺乏通用的底层表示能力。针对这一核心挑战,清华大学等机构的联合团队发布了通用原子级生成式 AI 大模型 PocketXMol。该模型通过将一切分子抽象为原子和化学键的集合,首次在同一框架内实现了小分子与多肽 3D 结构预测和从头设计的“大一统”。在涵盖 13 项药物设计任务的严苛评估中,PocketXMol 击败了包括 AlphaFold 3 在内的 55 个前沿模型,并成功通过了湿实验验证,设计出具有高特异性的 Caspase-9 小分子抑制剂和高亲和力的 PD-L1 靶向抗癌多肽,展现了从计算到临床转化的巨大潜力。

一.研究背景
近年来,人工智能在分子结构预测与药物设计领域确实取得了革命性的进展,例如 AlphaFold 3 等模型的问世极大地推动了结构生物学的发展。然而,当前的主流 AI 生成模型往往局限于特定的分子类型或任务,例如专门用于小分子对接,或者专门用于多肽序列设计,它们高度依赖为特定任务量身定制的算法与先验分布。这种“各自为战”的局面源于一个核心挑战:不同类型的分子,如小分子与蛋白质,通常使用截然不同的底层表示方式,这本质上限制了模型在不同分子类型和任务之间的迁移与通用性。
此外,虽然自然语言提示在大型语言模型中大放异彩,但对于定义涉及复杂空间关系或多个分子片段的微观化学任务而言,自然语言显得过于模糊,不够精确。由于所有的分子交互任务归根结底都受制于基础的原子间相互作用物理法则,研究团队提出了一个核心设问:我们能否开发一个统一的、基于原子级别的 AI 基础模型,通过学习海量数据来捕捉最底层的分子相互作用,从而在一个框架内解决所有基于口袋的药物生成任务?
二.研究方法
为了打破现有模型的局限性,近日,清华大学马剑竹、首都医科大学宣武医院王子华、北京大学韩传辉、清华大学王新泉联合研究团队构建了 PocketXMol 模型。该模型摒弃了传统的“氨基酸序列”或特定化学基团的显式建模,直接将输入的分子抽象为最基础的“原子”和“化学键”的集合。为了实现多任务的统一,模型引入了三个关键的技术组件。
1.原子级任务提示(Task Prompt)。研究团队创新性地使用二进制指示符来精确控制哪些原子或化学键是已知的,哪些是需要生成的。这种方法比文本提示更精确地定义了输入和输出的空间与结构关系,完美适配了微观化学任务的需求。
2.通用去噪器(Universal Denoiser)。该架构能够自动识别输入分子中不同任务对应的噪声类型和尺度。这使得不同任务的数据分布被映射到一个统一的噪声空间中,从而允许模型在不进行任何“特定任务微调”的情况下,直接进行联合多任务训练并应用于新任务。
3.统一的原子级分子表示。无论是小分子还是线性/环状多肽,在模型眼中都是原子级别的三维排布。这种表示不仅无缝衔接了各类分子,还使其天然具备了设计非天然氨基酸(NAA)的能力,这对于现代多肽药物开发至关重要。
在训练阶段,研究团队构建了一个包含超 1100 万个小分子、数万个蛋白质-多肽以及蛋白质-小分子复合物的三维结构超大规模数据集对 PocketXMol 进行了联合训练。
三.研究结果与结论
在计算性能的验证上,研究团队对 PocketXMol 进行了全方位的评估。在涵盖小分子对接、多肽对接、3D 构象预测、基于结构的药物设计(SBDD)、PROTAC(蛋白降解靶向嵌合体)设计、片段连接与生长、分子优化、线性与环状多肽设计等 13 项计算生成任务中,PocketXMol 与 55 个基准模型进行了对比。结果显示,PocketXMol 在其中 11 项任务上取得了当前最佳(State-of-the-art)的表现,并在剩余 2 项任务中保持了极高的竞争力。
为了验证该 AI 模型的真实临床转化潜力,研究团队针对具有高度挑战性的抗肿瘤靶点进行了严格的湿实验验证。在 Caspase-9 小分子抑制剂的设计中,现有的泛 Caspase 抑制剂难以对 Caspase 家族成员进行有效区分。研究团队利用 PocketXMol 专门设计了新型抑制剂,在合成的 16 种分子中,优化后的化合物(如 D12)不仅能强效抑制 Caspase-9 及下游 Caspase-3 的激活,其抑制效力甚至可与市面上的商业泛 Caspase 抑制剂(如 QVD)相媲美。酶学实验进一步证实,D12 不直接抑制 Caspase-3,展现出了高度的靶向特异性。
在靶向 PD-L1 的抗癌多肽开发中,PocketXMol 直接“从头设计”了数十种候选多肽。在实验合成并测试的 382 种多肽中,有 15 种候选多肽对 PD-L1 的结合亲和力(KD)达到了惊人的 10⁻⁸M 级别,这一命中率远远超过了传统随机多肽文库的筛选效率。细胞实验证实,代表性多肽(如 P282)能够特异性地结合在 PD-L1 阳性肺癌细胞的细胞膜上,并有效阻断 PD-1 与 PD-L1 的相互作用。更为关键的是,活体动物荧光成像实验表明,通过静脉注射的荧光标记 AI 多肽能够快速、精准地在小鼠的肿瘤部位富集,展示了其作为肿瘤诊断探针及靶向治疗药物的巨大潜力。
四.总结与展望
这项工作标志着人工智能在微观分子世界“基础大模型”构建上迈出了里程碑式的一步。PocketXMol 模型通过学习最底层的原子级相互作用,成功弥合了 3D 结构预测与分子生成设计之间的鸿沟,首次证明了单一的 AI 基础模型足以胜任并统一涵盖小分子、多肽以及 PROTAC 等多种模态的药物设计任务。凭借其卓越的计算性能与已被实验证实的真实靶向药物设计能力,PocketXMol 为 AI 驱动的创新药发现(AIDD)提供了一个强大而通用的平台,有望极大加速未来各类重大疾病新型疗法的研发进程。
原文地址:https://mp.weixin.qq.com/s/qQwOW4TyaGS0Hs2V03Syyw
|