Kaiwu-PyTorch-Plugin v0.2.0发布|支持Q-Diffusion,生成任务能力再拓宽

超能小量子
2026-06-11 10:56:15
人工智能
生命科学
量子信息
行业动态


给扩散模型装上“能量导航”;蛋白质生成和单细胞分析任务更精准


更新概览


Kaiwu-PyTorch-Plugin于6月初正式发布v0.2.0版本,本次更新的核心为:把量子/经典能量模型的“判断力”注入到生成模型和表征学习中。具体如下:

 

一、新增Q-Diffusion功能,支持使用玻尔兹曼机作为能量模型优化扩散过程;

二、新增Q-Diffusion生成案例:基于DPLM的完整蛋白质序列生成工作流及效果对比;https://github.com/qboson/kaiwu-pytorch-plugin/tree/main/example/qdiffusion/dplm

三、新增Q-VAE单细胞表征学习案例:提供单细胞表征学习完整流程;https://github.com/qboson/kaiwu-pytorch-plugin/tree/main/example/qvae_cell

 

仓库地址:https://github.com/qboson/kaiwu-pytorch-plugin,欢迎体验!

 

一、Q-Diffusion


业务场景中很多数据不是连续的像素,而是离散的序列——如蛋白质序列、DNA/RNA序列、文本、图结构等,这类数据的特点是:组合空间巨大,约束条件复杂,靠人工规则筛选困难。传统的离散扩散模型能“生成”候选结果,但缺少一个判断“生成得是否好”的机制。Q-Diffusion(量子扩散模型)是KPP项目中用于能量引导离散扩散生成的通用模块,即在传统离散扩散模型的基础上添加能量引导,引导生成任务的执行。

 

相较于传统离散扩散模型主要依靠自身的去噪网络逐步从噪声token中恢复样本,Q-Diffusion的创新点在于把“扩散生成”和“能量引导”结合起来。扩散模型每一步产生候选序列后,会调用一个能量模型(如BM或RBM)对这些候选序列进行打分、重排和筛选,从而引导生成过程朝更符合目标方向演化。生成过程既保留了扩散模型的多步探索能力,又利用了能量模型的全局约束表达能力。

 

二、Q-Diffusion 蛋白质序列生成案例


背景介绍


蛋白质由20种常见的氨基酸组成,本质上是一类离散序列。一个蛋白质序列是否“合理”,不仅取决于每个氨基酸token本身是否常见,还取决于整条序列是否满足结构稳定性、功能相关性、进化保守性等约束。

 

结合思路


本案例采用的思路是:冻结预训练好的蛋白质扩散模型(后续简称DPLM,checkpoint:airkingbd/dplm_150m),让DPLM负责生成候选序列,另外训练一个BM能量模型,负责对候选序列进行整体评价和筛选。

 

在训练时,适配层将DPLM提取到的序列特征转换为BM可识别的表示BM学习真实蛋白序列与生成候选之间的差异,对候选序列进行能量打分;在生成时,BM对候选序列进行重排和筛选,选择更符合真实蛋白分布或目标约束的结果。

 


 

结果说明


使用ESM2模型Meta AI 开发的蛋白质语言模型,是生物 AI 领域的重要工具)将蛋白序列转换为embedding向量,比较生成序列和真实序列在向量空间里的距离。



 


baseline未加入BM,单独使用DPLM生成的结果;


guided加入Q-Diffusion后的生成结果;


余弦距离:衡量两个序列embedding的方向差异;


L2距离:表示欧氏距离,衡量两个embedding向量之间的整体距离。


余弦距离和L2距离均为越小越好。使用Q-Diffusion后,两项指标均明显下降,说明模型生成的蛋白序列在ESM2表征空间中更接近真实蛋白序列。


 



 

Q-VAE单细胞表征学习案例


背景介绍


单细胞RNA测序数据主要记录每个细胞中基因的表达水平,具有数据维度高、噪声强、易受批次效应影响等特点。实际分析中常关心的是模型是否能从这些复杂数据中提取出有用的低维表征,让相同类型的细胞聚在一起,不同类型的细胞区分开来。

结合思路


本案例将VAE的表征学习能力和BM能量建模能力结合,流程如下:

 

(1)通过编码器将高维基因表达矩阵压缩到低维潜在空间;

(2)解码器根据潜在表示重构原始表达数据;

(3)训练完成后,模型提取X_qvae作为单细胞低维表征,用于UMAP、聚类和分类评估,同时计算QVAE_Energy,用于观察不同细胞类型在能量空间中的分布差异。

 

在传统VAE的重构损失和KL约束之外,本例引入BM能量模型对潜在表示进行能量建模和约束——不仅要求模型重构有较高相似性,还要求低维潜在空间本身有合理的能量结构。

 

案例代码请参考:https://github.com/qboson/kaiwu-pytorch-plugin/tree/main/example/qvae_cell,案例展示了模型训练、表征提取、能量分析的完整流程。

结果说明


(1)性能表现

在多个单细胞数据集上,QBM-VAE在批次效应校正、表征聚类、分类等任务上均取得了SOTA结果:


(2)可视化效果

将提取的X_qvae表征用于单细胞可视化:



  • 按细胞类型(Cell Types)着色,不同类型细胞形成清晰的独立区域;



  • 按批次(Batches)着色,不同批次细胞混合均匀,没有与细胞类型存在对应关系。



 

这说明模型不仅成功学习到细胞的内在表征,将不同的细胞区分开来,同时有效减弱了批次的干扰。

 


 

(3)能量景观分析

Q-VAE模型的优势在于:不同细胞类型、不同分化程度的细胞会呈现出不同的energy分布。

能量值的下降对应了细胞分化过程,形成“能量景观图”,可帮助定位细胞在分化路径中的位置,这是经典VAE无法提供的视角。

 



arXiv论文链接:https://arxiv.org/abs/2508.11190


 

欢迎大家前来体验,同时欢迎大家提出意见及反馈!

62
2
0
0
关于作者
相关文章
  • JCTC | AI赋能分子晶体结构预测:基于类似物模板策略的高效采样 ...
    分子晶体结构预测(CSP)是材料发现领域的重要计算工具,但其核心瓶颈在于计算成本高昂,这主要 ...
    了解详情 
  • PocketXMol原子级生成式AI大模型发布:统一3D小分子与多肽药物设 ...
    人工智能在分子结构预测与药物设计领域正经历着深刻的变革,但现有的主流模型往往受限于特定的分 ...
    了解详情 
  • MASTER:面向自主催化剂发现的分层多智能体大语言模型推理框架 ...
    异相催化剂在氢能制备、CO₂还原、氨合成、燃料电池及石油化工等领域具有广泛应用。传统的催化剂 ...
    了解详情 
  • 再不学量子编程就晚了!玻色量子发布学练考用全套秘籍让你从入门 ...
    2025年政府工作报告两度点名量子科技。玻色量子积极响应政府政策,推出国内首个“四阶成长& ...
    了解详情 
领取成功
本月5个550bit真机配额已发放给您,配额将在2个月后到期,请及时使用哦~
活动中心
联系我们
二维码
返回顶部
返回
活动中心

完成任务,轻松获取真机配额

×
每日必做
新手任务
长期任务
其他任务
快速回复 返回顶部 返回列表
玻色有奖小调研
填写问卷,将免费赠送您1个1000bit真机配额
(单选) 您是从哪个渠道得知我们的?*
您是从哪个社交媒体得知我们的?*
您是通过哪个学校的校园宣讲得知我们的呢?
取消

提交成功

真机配额已发放到您的账户,可前往【云平台】查看

量子AI开发者认证

考核目标

开发者能够成功搭建Kaiwu-PyTorch-Plugin项目基础环境,并成功运行示例代码,根据示例提示,输出指定的值并填写至相应的输入框中。

通过奖励

5个一年效期的1000量子比特真机配额

专属「量子AI开发者」社区认证标识

开发者权益

每月固定权益:5个550量子比特真机配额
前往考核

第一步

按照README提示成功安装Kaiwu-PyTorch-Plugin库环境依赖
前往GitHub

第二步

运行 community-assessment 分支下的 run_rbm.py 代码示例

第三步

理解示例代码,手动打印并填写如下数值:

正相采样的状态

负相采样的状态

正相的能量值

负相的能量值

*

提交答案

开发者权益

每月固定权益:5个550量子比特的真机配额

恭喜您完成考核

您将获得量子AI开发者认证标识及考核奖励

1000 bit*5

配额

Quantum AI Developer Certification

Assessment Objectives

Developers should successfully set up the basic environment for the Kaiwu-PyTorch-Plugin project, run the QBM-VAE sample code, and calculate the correct FID value based on the random seed value provided by the system.

Pass Rewards

10 quotas for 550-qubit real quantum machines with a one-year validity period

Exclusive "Quantum AI Developer" Community Certification Badge

Developer Benefits

Fixed Monthly Benefits: 5 quotas for 550-qubit real quantum machines
Proceed to Assessment

Step 1

Install the environment dependencies for the Kaiwu-PyTorch-Plugin library according to the README instructions
Go to GitHub

Step 2

Replace the Seed Value

Your seed value is

Step 3

Enter the FID Value You Calculated

*

Submit Answer

Developer Benefits

Fixed Monthly Benefits: 5 quotas of 550-qubit real machines

Congratulations on Completing the Assessment

You will receive the Quantum AI Developer Certification Badge and Assessment Rewards

550bit*10

Quotas