【讲座笔记】均衡传播与CIM驱动的神经网络创新应用

鸭鸭哔哔哔
2025-03-17 18:39:29

均衡传播算法借鉴生物神经网络的局部学习规则,通过模拟大脑突触的双阶段动态平衡,使玻尔兹曼机等能量模型摆脱传统对比散度的低效束缚。这种“神经动力学+概率建模”的耦合,不仅为生成式AI提供了更接近生物学习范式的训练框架,更在量子退火硬件上展现出指数级加速潜力,有望推动更高效、节能的神经计算硬件的发展。

主讲人:Anthony

致力实用化量子计算,负责SDK研发,持续研发和集成内置算法和实用工具,以简化从问题建模到量子计算机求解的流程,探索量子计算在人工智能、金融分析等领域的潜在应用。

主要内容:

    1. Ising模型的基本概念
    2. 均衡传播算法原理
    3. 该算法在Ising机上的实现方式
    4. 应用场景展望与未来发展

直播回放:


1. Ising模型

1.1 伊辛模型的基本概念

Ising模型最初是为解释铁磁相变现象提出的经典物理模型。其核心结构由二维晶格上的离散自旋系统构成:每个晶格节点i(i=1,2,3,...)具有±1两种自旋状态,相邻节点间通过耦合权重Jij连接。系统总能量可表示为:

其中求和范围覆盖所有连接节点对。

以图示的三节点系统为例:节点s1与s2、s1与s3分别通过权重为2和5的边连接,当自旋状态分别为(+1,+1,-1)时,系统总能量计算为:

1.2 伊辛模型与神经网络

接下来我们来看一下它和神经网络之间的一些联系。Ising模型的自旋演化机制与神经网络神经元更新规则存在深刻关联。在Ising系统中,相邻自旋通过耦合作用相互影响:

当耦合系数Jij>0时,系统倾向于使相邻自旋方向一致(铁磁耦合);当Jij<0时则促使自旋方向趋于相反(反铁磁耦合)。系统会逐渐演化到平衡态,这个过程中系统能量会降低。而对于神经网络而言,神经元的更新规则类似于自旋的演化:

若输入神经元激活值为+1且连接权重为正,则该信号将促使下游神经元趋向正激活状态。以水果分类任务为例,构建包含重量、颜色两个输入特征,隐藏层及苹果/橘子输出层的神经网络。该网络通过层级连接权重计算特征组合,最终实现分类决策。值得注意的是,这种网络拓扑结构既可表征传统神经网络,也可映射为Ising模型的晶格结构,揭示了两者在计算本质上的相通性。

实际上,Ising模型的求解是很困难的,属于NP-hard组合优化问题,传统算法面临指数级复杂度挑战。本文后面将详细讨论Ising模型的高效求解方案——相干Ising机(Coherent Ising Machine, CIM)。2018年《Science》报道的研究显示,CIM的光学计算架构在求解2000自旋问题时,速度较经典模拟退火算法提升近两个数量级,为复杂优化问题提供了物理计算的新的解决方案。

2. 均衡传播

2.1 均衡传播与反向传播

为深入理解均衡传播(Equilibrium Propagation, EP)的创新性,需系统对比其与传统反向传播(Backpropagation, BP)的算法差异。传统反向传播算法需要构建完整的计算图,通过链式法则将输出端的误差信号逐层逆向分解,每个神经元的权重更新都严格依赖于后续层的梯度信息:给定损失函数L(θ)=𝔼[ℓ(f_θ(x),y)],其梯度计算遵循∂L/∂θ=∂ℓ/∂fθ · ∂fθ/∂θ

与反向传播相比,均衡传播具有如下图所示的优势。均衡传播建立在能量基模型(Energy-Based Models, EBMs)框架下,将网络视为动态系统,其状态演化由能量函数$E(s,θ)$驱动,最终收敛于能量极小点:

在能效比和硬件友好性方面,均衡传播均表现优异,而且这种只依赖局部信息的学习规则,和我们的真真实实的人类神经更加符合。

2.1 均衡传播的训练过程

均衡传播的训练过程主要分为四个阶段:初始化参数、自由阶段、约束阶段和更新权重阶段。

1). 初始化参数:网络由节点(神经元或自旋变量)和连接权重构成,节点状态 si∈{-1, +1}  表示激活状态,权重Jij定义节点间的相互作用强度。初始时,权重Jij随机赋值,输入层节点固定为数据x,输出层目标为y。

2). 自由阶段(Free Phase): 系统在输入数据x驱动下自发演化至平衡态。此阶段能量函数仅包含网络内部相互作用,不进行约束也没有任何标签输入: 
节点状态遵循梯度动力学方程:
随着时间t的增加,系统收敛至稳态 s0,此时输出层 sY为网络对输入x的自然响应(无监督预测)。该阶段演化过程如下图所示:

3). 引导阶段(Nudge Phase):在自由阶段基础上,对输出层施加目标约束,修正能量函数:

其中约束项将输出层节点sY拉向目标标签y。对其计算梯度可得:
因此,其动力学方程为:
参数 β > 0控制目标约束强度。系统演化至新平衡态 sβ ,输出层被“牵引”至目标y。值得注意的是,由于隐层节点的反向传播效应,输入层状态也会发生适应性调整,也即模型的全网络的共同优化特性。该阶段演化过程如下图所示:

4). 参数更新:通过对比两阶段的差异,计算梯度:
通过比较两个阶段的平衡状态,能够捕捉到目标信号对网络状态的调整,反映了网络输出与目标输出之间的误差信息。权重更新方向使约束项 C(sY, y) 最小化,推动网络输出逼近目标。理论分析表明(Scellier et al., 2022),当约束强度β和参数更新步长ε满足ε,β →0时,更新量收敛于传统梯度:也就是说,尽管均衡传播仅利用局部信息,其梯度方向与反向传播的全局梯度一致,但规避了链式求导的计算开销。

注记:上述结论源于对于小量β,ε的扩展能量泛函:

的优化过程。交替求解:

从定理可以看出,两次求解做差得到的梯度与C的梯度一致。

3. 均衡传播与Ising机

3.1 借助Ising机实现均衡传播

将均衡传播映射到Ising机硬件实现时,需解决连续梯度与离散状态的适配问题。Ising机通过物理系统的稳态演化实现均衡传播(EP):耦合权重θij作为可训练参数保持连续值域,支持梯度更新;而神经元状态si在Ising机实现中被离散化为±1(光学相干Ising机通过0/π相位编码),但在微分方程框架下可保留连续激活值,使算法在硬件部署时利用二值状态的高能效特性,同时在软件仿真时保持传统神经网络的表达能力。 梯度计算通过自由阶段(s0)与引导阶段(sβ)的状态差异实现,具体公式为: 

其中β为输出约束强度。以光学相干Ising机为例,每个光学参量振荡器对应神经元,其振荡相位编码±1状态。训练过程通过马赫-曾德尔干涉仪调制耦合强度:自由阶段锁定输入光子模式记录稳态相位s⁰,扰动阶段注入调控光强诱导新平衡态sβ,梯度通过光电探测器测量两阶段外积差异并反馈更新权重。 

在Ising机硬件上实现均衡传播的实证研究中,讲者构建了面向MNIST手写数字识别的专用架构。输入层采用28×28=784个光学参量振荡器,其相位状态直接编码图像像素强度(+1对应墨迹区域,-1表示空白)。隐层设置120个可调谐耦合节点,输出层创新性地采用40节点扩展编码方案——每个数字类别分配4个节点,通过多数表决机制提升分类鲁棒性。详细内容见下文3.3节。

3.2 伊辛模型与玻尔兹曼机

玻尔兹曼机(BM)与均衡传播(EP)均以能量最小化为核心范式,但其建模目标与实现路径存在本质差异。玻尔兹曼机的概率分布定义为:  

其中可见层v与隐藏层h的状态服从概率分布,训练目标为最大化可见层数据的对数似然:
使对训练集中的数据模型更倾向于生成低能量状态,本质上属于无监督特征学习。与之对比,均衡传播则构建监督学习导向的能量函数:
其中 β 项引入目标导向的约束势场。其训练通过自由阶段(β=0)与引导阶段(β>0)的平衡态差异生成确定性梯度:  

玻尔兹曼机的能量形式与Ising模型一致。

 

3.3 实验架构与结果

本部分使用MNIST进行伊辛机实现均衡传播的实证研究。MNIST 数据集是机器学习和深度学习领域中最经典的基准数据集之一,由 Yann LeCun 等研究者于 1998 年创建,包含60,000个训练样本和10,000个测试样本,主要用于手写数字识别任务。每个样本是28×28像素的灰度图像,对应0到9的数字类别。

针对MNIST/100的子集(1000训练样本,100测试样本)构建专用架构:

    输入层:28×28=784个光学参量振荡器,相位编码像素强度(+1为墨迹,-1为空白)。 
    隐藏层:120个可调谐耦合节点。 
    输出层:40节点扩展编码(每数字类别分配4节点)。

实验结果表明,EP算法在训练集上达到了98.8%的准确率,在测试集上达到了88.8% 的准确率。

4. 应用与展望

4.1 均衡传播的应用

均衡传播(EP)的发展深度融合了硬件创新与算法优化,已经在跨学科领域展现独特优势。
图片生成:结合均衡传播(EP)和Hopfield网络的变分自编码器(VAE)训练,用于生成建模任务。研究利用Hopfield网络的对称性,设计了一个模型同时作为编码器和解码器。实验表明,该方法在生成图像质量上与传统反向传播训练的VAE相当。

612
0
0
0
关于作者
相关文章
  • 超越经典的缠结:从玻尔的预言到量子信息的新时代 ...
    尽管量子纠缠一词早已成为公众语境中的高频表达,仿佛它天然指向某种神秘莫测的“瞬时联动& ...
    了解详情 
  • 基于图结构的谱聚类方法
    聚类是无监督学习中一项基础而关键的任务,其核心目标在于发现数据中的潜在结构,并将相似对象划 ...
    了解详情 
  • 基于量子压缩的相干光计算系统
    摘要:相干光计算是一种基于量子光学的非冯诺依曼框架的专用计算方法,是有望在后摩尔时代突破计 ...
    了解详情 
  • 从量子到经典:量子叠加、相干性与退相干的物理机制 ...
    量子力学是用于描述微观世界的理论,常被视为近代物理学的开端。近年来,量子力学的理论被应用在 ...
    了解详情 
  • 使用量子退火算法(QUBO)解决车辆路径问题(VRP):Python建模 ...
    量子退火作为解决组合优化问题的利器,车辆路径问题是最经常被提起的现实应用。车辆路径问题 (VR ...
    了解详情 
在本版发帖返回顶部
快速回复 返回顶部 返回列表
玻色有奖小调研
填写问卷,将免费赠送您5个100bit真机配额
(单选) 您是从哪个渠道得知我们的?*
您是从哪个社交媒体得知我们的?*
您是通过哪个学校的校园宣讲得知我们的呢?
取消

提交成功

真机配额已发放到您的账户,可前往【云平台】查看