物理学家用扩散模型(二):随机量子化+Score函数=扩散模型

Akkio
2026-01-16 02:43:42
人工智能
量子信息
算法解析
本帖最后由 Akkio 于 2026-1-16 02:47 编辑


本文衔接生成式模型基础,聚焦随机量子化与扩散模型的核心关联及机制。随机量子化通过引入虚构时间与Langevin方程,使量子场经布朗运动收敛至路径积分权重对应的平衡分布,Fokker-Planck方程验证了该平衡态的稳定性。扩散模型则通过正向加噪、反向去噪过程生成样本,其核心与随机量子化深度对接,Score函数对应Langevin方程中的有效力场,本质是概率分布的对数梯度。因正向加噪后分布难以解析,需通过神经网络学习Score函数,为扩散模型在格点场论采样中的应用奠定物理与理论基础。



上一篇:物理学家用扩散模型(一):生成式模型基础——KL 散度理论与格点场论采样需求



3.1 基础铺垫:随机量子化


3.1.1 核心思想


Parisi和吴咏时1981年提出随机量子化,为格点量子场论提供重要工具。其核心是引入虚构时间τ(Langevin时间),让量子场在该时间上做布朗运动,最终达到的平衡分布恰好等价于量子场论的路径积分权重。


3.1.2 Langevin方程与平衡分布


Langevin方程



其中,漂移项使系统沿作用量负梯度下降,趋于最小作用量;噪声项保证遍历所有场构型,满足


平衡分布:当τ→∞时,Langevin动力学达到平衡分布,量子涨落由噪声产生,作用量驱动系统向“量子平衡”收敛,这是随机量子化等价于传统路径积分的核心原因。



3.1.3 Fokker-Planck方程


Langevin随机微分方程(SDE)对应的概率密度满足Fokker-Planck方程,以一维情况为例:


一维Langevin方程



小步长Δτ下的离散形式:( 为标准正态分布变量)



其中,ε服从标准正态分布变量



将 Langevin 方程在一个小步长Δτ上积分





定义,其统计性质有





因此 ,ε是标准正态分布变量



Fokker-Planck方程



场论推广:将一维情况推广到场变量,Langevin方程变为 :



3.1.4 Langevin时间演化的稳定性验证


当τ→∞时,存在稳定平衡态Peq[Φ]满足∂τPeq=0 。物理直觉上,这是“热浴+力”的平衡:Φ为粒子坐标,S[Φ]为粒子势能,η为温度T=1的热浴,τ为真实时间,Langevin动力学长期行为必然是玻尔兹曼分布。


验证:将代入Fokker-Planck方程,可得:



,验证了平衡分布的正确性。


3.2 Diffusion Model的核心机制


3.2.1 与随机量子化的对接


随机量子化是真实的动力学微分方程演化,Diffusion Model是学习出来的概率生成器。


随机量子化:解真实的随机微分方程(SDE),依赖 ,每一步具有明确物理意义。


Diffusion Model:学习反向生成过程,仅需样本,中间步骤为计算工具,核心是学习“有效Langevin力”。


3.2.2 核心思想:正向过程与反向过程


正向扩散过程(Forward process):人为定义的加噪过程,从真实分布p0(Φ)出发,不断加入噪声(ξ为噪声变量,随时间衰减的系数αt∈(0,1)用于控制每步的噪声大小),使分布逐渐平坦:



反向扩散过程(Reverse process):机器学习的核心,理论上存在反向SDE:



Diffusion Model 用神经网络学习score函数,再从高斯噪声出发,通过反向SDE生成样本。



3.2.3 Score函数的物理意义


定义:对概率密度p(x),score函数为概率密度对变量的对数梯度:score(x)=▽x log p(x),该梯度指向概率更大的方向。


与随机量子化的关联:在随机量子化中,,因此,即score函数等于“负的作用量梯度”,恰好是Langevin方程中的力。


回顾 Langevin SDE,Langevin 就是沿着 score 方向漂移,再加噪声



score 函数是“概率分布在构型空间中的力场”,在随机量子化中,它是-δS/δΦ,在 Diffusion Model 中,它是被神经网络学习出来的。


3.2.4 Score函数的学习必要性与获取方式


权重函数,因高维、非线性强耦合、拓扑扇区分离等问题不可直接求解。Langevin方法虽仅需当前 ,但存在自关联时间长、隧穿慢、临界减速等缺陷。


在t=0处,若作用量S可算,则目标分布处p0(x)和score 函数已知。但在t≠0处,Forward diffusion重新定义了分布



因此在Diffusion Model中,正向扩散后的分布pt(x)是卷积后的分布,难以写出解析形式,score函数的分子、分母均为高维积分,计算成本极高,因此必须通过神经网络学习。



Diffusion Model中,需要获得score函数: Forward diffusion 中人为加噪声,pt(x)变得越来越平;Reverse diffusion 为了生成样本,需要解。但正向扩散的每一步的分布pt(x)是无法直接计算的(因为是加噪后的复杂分布),所以也不知道score 函数。解决办法是:用神经网络学习 score 函数—— 训练一个带参数θ的网络sθ(x,t),让它近似等于真实的 score 函数。



 




文章改编转载自知乎作者:NPSnps


原文链接:https://zhuanlan.zhihu.com/p/1993278533036963266

24
0
0
0
关于作者
相关文章
  • 物理学家用扩散模型(一):生成式模型基础——KL 散度理论与格 ...
    传统蒙特卡洛方法(如 HMC 等)在格点场论采样中面临临界减速、符号问题及反问题等核心挑战,亟 ...
    了解详情 
  • 量子模拟赋能化学研究:自由能计算、基态搜索挑战与动力学模拟突 ...
    2025年12月4日,多伦多大学的Philipp Schleich与Alán Aspuru-Guzik在《Science》期刊上发 ...
    了解详情 
  • 系统论驱动的 AI 整合框架:中医药整体物质基础研究的创新路径 ...
    中国药科大学曾敬其、贾晓斌教授在中国工程院院刊《Engineering》发表了题为“Systems Theo ...
    了解详情 
  • 为什么光子属于玻色子?解读玻色子与费米子的本质区别 ...
    万物由 17 种基本粒子构成,仅分为玻色子和费米子两类。1945 年狄拉克命名这两种粒子,分别致敬 ...
    了解详情 
联系我们
二维码
在本版发帖返回顶部
快速回复 返回顶部 返回列表
玻色有奖小调研
填写问卷,将免费赠送您5个100bit真机配额
(单选) 您是从哪个渠道得知我们的?*
您是从哪个社交媒体得知我们的?*
您是通过哪个学校的校园宣讲得知我们的呢?
取消

提交成功

真机配额已发放到您的账户,可前往【云平台】查看

量子AI开发者认证

考核目标

开发者能够成功搭建Kaiwu-PyTorch-Plugin项目基础环境,并成功运行示例代码,根据示例提示,输出指定的值并填写至相应的输入框中。

通过奖励

5个一年效期的1000量子比特真机配额

专属「量子AI开发者」社区认证标识

开发者权益

每月固定权益:5个550量子比特真机配额
前往考核

第一步

按照README提示成功安装Kaiwu-PyTorch-Plugin库环境依赖
前往GitHub

第二步

运行 community-assessment 分支下的 run_rbm.py 代码示例

第三步

理解示例代码,手动打印并填写如下数值:

正相采样的状态

负相采样的状态

正相的能量值

负相的能量值

*

提交答案

开发者权益

每月固定权益:5个550量子比特的真机配额

恭喜您完成考核

您将获得量子AI开发者认证标识及考核奖励

1000 bit*5

配额