物理学家用扩散模型（二）：随机量子化+Score函数=扩散模型

Akkio · 发表于 1768502622

本帖最后由 Akkio 于 2026-1-16 02:47 编辑

本文衔接生成式模型基础，聚焦随机量子化与扩散模型的核心关联及机制。随机量子化通过引入虚构时间与Langevin方程，使量子场经布朗运动收敛至路径积分权重对应的平衡分布，Fokker-Planck方程验证了该平衡态的稳定性。扩散模型则通过正向加噪、反向去噪过程生成样本，其核心与随机量子化深度对接，Score函数对应Langevin方程中的有效力场，本质是概率分布的对数梯度。因正向加噪后分布难以解析，需通过神经网络学习Score函数，为扩散模型在格点场论采样中的应用奠定物理与理论基础。

上一篇：物理学家用扩散模型（一）：生成式模型基础——KL 散度理论与格点场论采样需求

3.1 基础铺垫：随机量子化

3.1.1 核心思想

Parisi和吴咏时1981年提出随机量子化，为格点量子场论提供重要工具。其核心是引入虚构时间τ（Langevin时间），让量子场在该时间上做布朗运动，最终达到的平衡分布恰好等价于量子场论的路径积分权重。

3.1.2 Langevin方程与平衡分布

Langevin方程：

其中，漂移项使系统沿作用量负梯度下降，趋于最小作用量；噪声项保证遍历所有场构型，满足。

平衡分布：当τ→∞时，Langevin动力学达到平衡分布，量子涨落由噪声产生，作用量驱动系统向“量子平衡”收敛，这是随机量子化等价于传统路径积分的核心原因。

3.1.3 Fokker-Planck方程

Langevin随机微分方程（SDE）对应的概率密度满足Fokker-Planck方程，以一维情况为例：

一维Langevin方程：

小步长Δτ下的离散形式：（为标准正态分布变量）

其中，ε服从标准正态分布变量

将 Langevin 方程在一个小步长Δτ上积分

定义，其统计性质有

因此，ε是标准正态分布变量

Fokker-Planck方程：

场论推广：将一维情况推广到场变量，Langevin方程变为：

3.1.4 Langevin时间演化的稳定性验证

当τ→∞时，存在稳定平衡态P_eq[Φ]满足∂_τP_eq=0 。物理直觉上，这是“热浴+力”的平衡：Φ为粒子坐标，S[Φ]为粒子势能，η为温度T=1的热浴，τ为真实时间，Langevin动力学长期行为必然是玻尔兹曼分布。

验证：将代入Fokker-Planck方程，可得：

即，验证了平衡分布的正确性。

3.2 Diffusion Model的核心机制

3.2.1 与随机量子化的对接

随机量子化是真实的动力学微分方程演化，Diffusion Model是学习出来的概率生成器。

随机量子化：解真实的随机微分方程（SDE），依赖，每一步具有明确物理意义。

Diffusion Model：学习反向生成过程，仅需样本，中间步骤为计算工具，核心是学习“有效Langevin力”。

3.2.2 核心思想：正向过程与反向过程

正向扩散过程（Forward process）：人为定义的加噪过程，从真实分布p₀(Φ)出发，不断加入噪声（ξ为噪声变量，随时间衰减的系数α_t∈(0,1)用于控制每步的噪声大小），使分布逐渐平坦：

反向扩散过程（Reverse process）：机器学习的核心，理论上存在反向SDE：

Diffusion Model 用神经网络学习score函数，再从高斯噪声出发，通过反向SDE生成样本。

3.2.3 Score函数的物理意义

定义：对概率密度p(x)，score函数为概率密度对变量的对数梯度：score(x)=▽x log p(x)，该梯度指向概率更大的方向。

与随机量子化的关联：在随机量子化中，，因此，即score函数等于“负的作用量梯度”，恰好是Langevin方程中的力。

回顾 Langevin SDE，Langevin 就是沿着 score 方向漂移，再加噪声

score 函数是“概率分布在构型空间中的力场”，在随机量子化中，它是-δS/δΦ，在 Diffusion Model 中，它是被神经网络学习出来的。

3.2.4 Score函数的学习必要性与获取方式

权重函数，因高维、非线性强耦合、拓扑扇区分离等问题不可直接求解。Langevin方法虽仅需当前，但存在自关联时间长、隧穿慢、临界减速等缺陷。

在t=0处，若作用量S可算，则目标分布处p₀(x)和score 函数已知。但在t≠0处，Forward diffusion重新定义了分布

因此在Diffusion Model中，正向扩散后的分布p_t(x)是卷积后的分布，难以写出解析形式，score函数的分子、分母均为高维积分，计算成本极高，因此必须通过神经网络学习。

Diffusion Model中，需要获得score函数： Forward diffusion 中人为加噪声，p_t(x)变得越来越平；Reverse diffusion 为了生成样本，需要解。但正向扩散的每一步的分布p_t(x)是无法直接计算的（因为是加噪后的复杂分布），所以也不知道score 函数。解决办法是：用神经网络学习 score 函数—— 训练一个带参数θ的网络s_θ(x,t)，让它近似等于真实的 score 函数。

文章改编转载自知乎作者：NPSnps

原文链接：https://zhuanlan.zhihu.com/p/1993278533036963266