2.1 量子采样:从玻尔兹曼分布到量子玻尔兹曼机
采样
在现代科学和人工智能领域,采样是一个非常重要的数学工具,能够帮助理解复杂系统的行为,训练强大的神经网络,甚至发现新药物。然而,当系统规模变大时,经典计算机在处理某些采样问题的速度会急剧下降,陷入所谓的“维度灾难”。近年来,量子计算的兴起,为高效实现复杂采样提供了全新的解决路径。
采样最直观的例子是高尔顿钉板——一种展示随机现象的经典装置。一块竖直的木板上整齐地钉着许多排列成等腰三角形的钉子,从顶部入口放下一颗小球,小球在下落过程中会随机地向左或向右碰撞钉子,最终落入底部的某个槽中。如果投入大量小球,它们将在底部分布形成中间高、两边低的钟形曲线,即正态分布(高斯分布)。
高尔顿板的魅力在于:物理过程本身就是一次采样。每次小球下落,不需要计算经过的复杂路径,只需要观察最终结果。这正是采样思想的核心——通过物理过程代替复杂计算。
玻尔兹曼分布和玻尔兹曼采样
高尔顿板展示的是简单的正态分布,但现实世界中的分布要复杂得多。玻尔兹曼分布源于统计物理学,描述了一个由大量粒子组成的系统在热平衡时,各个能量状态出现的概率。简单来说,能量越低的状态,出现的概率越高;温度越高,概率分布越平坦(随机性越大),温度越低,系统越倾向于停留在低能量状态。
数学上,玻尔兹曼分布表示为:
其中,
玻尔兹曼采样即是从玻尔兹曼分布中抽取样本的过程,玻尔兹曼采样已在多个领域发挥了重要作用:
机器学习:玻尔兹曼机(Boltzmann Machine)和深度置信网络(Deep Belief Network)的训练依赖于从玻尔兹曼分布中采样,以估计模型参数的梯度;
统计物理:模拟复杂材料(如磁性材料)的平衡态行为,预测宏观性质;
组合优化:寻找能量函数的最小值,对应优化问题的最优解;
生成模型:学习数据的潜在分布,生成与真实数据相似的新样本。
基于Ising模型的玻尔兹曼采样
玻尔兹曼采样在实际计算中的关键在于对配分函数
相干伊辛机通过模拟物理系统的自然能量演化,为高效实现玻尔兹曼采样提供了新的解决路径。Ising模型与玻尔兹曼分布在数学上存在的映射关系,使得CIM凭借量子并行特性可高效处理以Ising模型定义的能量函数的玻尔兹曼分布采样,为经典玻尔兹曼机因采样计算高复杂度而无法高效训练的难点提供解决思路。
Ising模型能量函数表达式为:
其中自旋变量
玻色量子自研的相干光量子计算机的核心思想是将问题映射到Ising模型的能量函数上,然后让系统在物理演化中自动寻找最低能量状态。由于量子并行性,相干光量子计算机可以同时探索大量可能的状态,从而快速找到能量极小值,甚至全局最优解。因此量子采样具有更广泛的应用场景。
量子采样应用
量子原生AI:量子玻尔兹曼机(QBM)
玻尔兹曼机是一种基于能量的神经网络模型,由诺贝尔奖得主Geoffrey Hinton于1983年提出。作为能量神经网络发展的里程碑代表,玻尔兹曼机来源于其使用了玻尔兹曼分布来建模节点间的概率关系。
玻尔兹曼机通过模拟物理系统的能量最小化过程训练网络,使神经元状态按照玻尔兹曼分布(高温随机探索,低温稳定收敛)进行概率更新。训练玻尔兹曼机的目标是调整权重和偏置,使得模型能够学习到训练数据的概率分布,这一过程需要对玻尔兹曼分布进行反复采样,计算数据分布和模型分布之间的差异。因此,玻尔兹曼机的训练问题可转化为求解伊辛模型的采样问题。
玻尔兹曼机具有强大的表示能力、卓越的无监督学习能力,能够处理不确定性和噪声,可作为深度学习的基础模块。量子玻尔兹曼机(Quantum Boltzmann Machine, QBM)将经典玻尔兹曼机与量子采样相结合,用量子计算机(如CIM)替代经典采样步骤,快速从玻尔兹曼分布中获取样本,从而大幅提升训练效率。

参考案例:生物序列(Bio. seq.)生成
量子增强AI:QBM-VAE
当前生成式AI的发展具有一定的局限性:高斯先验假设与第一性原理的缺失。一方面高斯先验在数学底层倾向将复杂世界简化为“平均化”分布,导致自循环训练中出现“模型崩溃”,关键信息逐渐丢失;另一方面,第一性原理的缺失,使其更多强调基于海量数据的“相关性”,虽然精通模式的识别与重组,却缺乏对物理定律的因果理解。基于量子采样实现的量子增强AI带来了一定的启发性。
以变分自编码器(Variational Autoencoder, VAE)为例,VAE是一种具有代表性的Encoder-Decoder架构模型,被广泛应用于学习数据的潜在特征并生成与原始数据分布相似的新数据。通常情况下,VAE假设数据潜在特征服从高斯分布,导致对复杂分布数据建模能力不足,生成结果模糊或缺乏多样性。
QBM-VAE(Quantum Variational Autoencoder,QBM-VAE)是一种结合经典AI框架与量子计算的改进VAE算法,通过CIM采样玻尔兹曼分布(Boltzmann Distribution),对具有复杂分布的自然科学数据具有强大的建模能力和适应性,可提升数据表征能力和生成能力。其核心是通过量子采样更准确地拟合数据底层分布,替代传统VAE假设的简单高斯分布。

参考论文:Quantum-Boosted High-Fidelity Deep Learning
基于量子采样实现微观模拟
基于相干光量子计算机实现大规模高效玻尔兹曼采样的优势可赋能生物化学微观计算。
大分子构象具有高度动态性,模拟真实状态的分子构象变化和互作过程需要基于经典力学力场或量子力学力场学建立模拟体系,其速度和精度在经典计算下难以权衡。大分子构象变化状态服从能量分布,因此准确、全局的玻尔兹曼采样能实现精准的分子构象变化模拟,并能迅速地探查到低能量稳定构象,从而快速获取多分子折叠过程路径,有助于发现稀有构象状态和多路径转移形式。
将分子不同构象之间的转变路径转化成Ising模型表述出来,便可利用相干光量子计算机硬件采样能力得到每个可能路径出现概率。
参考案例:大分子不同构象转移路径预测
量子采样利用物理系统的自然演化,为高效探索复杂概率空间提供了新思路。基于量子采样实现的量子原生AI、量子增强AI、微观模拟作为连接物理与AI的桥梁,正逐步从理论走向实践,在未来的科学计算和人工智能探索中,用简单的物理过程,揭示复杂的分布规律。
