玻尔兹曼机

离子
2024-12-06 10:37:06
人工智能
量子科普
本帖最后由 离子 于 2025-1-23 16:46 编辑


玻尔兹曼机


Hopfield神经网络中,如果发生串扰和陷入局部最优解,网络将不能正确回忆模式,而玻尔兹曼机的出现避免了局部最优解。 玻尔兹曼机网络的结构和Hopfield一样,如上图所示。


各神经单元之间相互连接,两单元之间的权重是对称的,即w i j = w j i,且没有到自身的连接,即w i i = 0,同时,每个神经单元的状态只能是0/1(也可用1/-1表示)。


玻尔兹曼机和Hopfield神经网络最大的区别是前者的输出是按照某种概率分布确定的,概率分布公式如下:



如何训练玻尔兹曼机



训练步骤如下


1.初始化连接权重w i j 和阈值b i


2.选取一个神经单元i,计算u i


3.根据u i 计算输出x i


4.按照同样的步骤计算出x j ,根据输出x i 和x j 的值,调整连接权重w i j 和阈值b i


重复上述2-4步骤。


步骤中u i 的计算与Hopfield神经网络一样,x i的值也同Hopfield,即当u i >0时x i = 1,当u i < 0 时x i = 0 ,当u i = 0时x i = x i 。然后根据x的值,利用公式(1)计算出x i取值为1或0的概率,然后调整x i 的值,以同样的步骤计算x j ,如果x i 和x j均为1,那么增大w i j ,网络中其它的神经单元按找同样的方法处理。


然后再向网络输入任意的模式,按照同样的步骤计算x i 和x j  ,这次如果x i 和x j 均为1,那么降低w i j,网络中其余的神经单元按照同样的方法进行处理。这种先增大权重再减小的处理方式叫做模拟退火算法。


那么,权重w i j 和偏置b i 的调整值如何调整?


这里使用似然函数导出:



这里,θ 是表示所有的权重和偏差,其中概率分布p ( x n ∣ θ ) 的定义如下:



这个概率分布成为玻尔兹曼机,E 表示能量函数,Z ( θ ) 是一个归一化常数,能保证所有概率分布总和为1,



为了便于运算,式(2)转换为对数函数,如下:



其实通过式(5)调整权重和偏置的过程就是求式(5)的梯度的过程,但目前由于计算量过大,不能快速实时计算,因此人们又提出了一种对比散度算法,这将在之后进行说明。


受限玻尔兹曼机



除了上面所说的玻尔兹曼机的网络结构之外,还有一种网络结构是将一部分神经单元隐藏起来,那么整个网络变成由可见单元与隐藏单元组成,但这使得似然函数的计算更加困难,为了解决这个问题,辛顿等人在玻尔兹曼机中加入了"层内单元之间无连接"的限制,这便成为受限玻尔兹曼机(RBM)。我们把可见变量记作v ,隐藏变量记作h,那么受限玻尔兹曼机的能量函数表示如下:



这里,θ是表示所有权重和偏置,b i 表示第i个可见神经单元的偏置,c j 表示第j个隐藏神经单元的偏置。


在受限玻尔兹曼机中,状态( v , h )的联合概率分布为:



如何训练?


受限玻尔兹曼机的结构可以表示如下:



和玻尔兹曼机一样,训练过程中对权重w i j 和偏置b i , c j 的调整也需要使用对数似然函数,表示如下:



对各参数的调整使用的是误差反向传播算法,分别计算各参数的偏导得:



然后,各参数得更新如下:



但是上式中得∑ v p ( v ) 表示所有输入模式的总和,这使得整个公式得计算量大大增加,同样的,为了解决这个问题可以使用对比散度算法。


 



对比散度算法


算法训练过程


1.  使用随机数初始化权重和偏置;


2.在可见层v ( 0 ) 设置输入模式;


3.根据概率分布公式调整隐藏层中h ( 0 ) 的值;


4.根据输出x i 和x j 的值,调整连接权重w i j 、偏置b i 和c j  


最后,重复步骤2-4。


这里,步骤2-3描述的过程的计算公式为(以通过初始可见层计算隐藏层的值为例):



那么接下来:



这里σ 表示sigmoid激活函数,为:



按照同样的规律迭代步骤2-3。一般在对比散度算法中,只迭代一次足够。


最终,连接权重w i j 、偏置b i 和c j 的调整值变为了:



这里,η和神经网络一样,表示学习率。此时我们根据上式计算所有训练样本的参数,最后取平均值就是网络最后的参数。


深度信念网络


深度信念网络的结构不像受限玻尔兹曼机一样只有两层,而是由一层可见层和多层隐藏层组成,训练时使用对比散度算法先训练可见层与第一层隐藏层之间的参数,然后将这些参数作为下一层隐藏层的输入,计算第二层隐藏层,如此循环下去,直到训练到最后一层。


各层的条件概率分布如下:



计算第二层隐藏层,如此循环下去,直到训练到最后一层。


各层的条件概率分布如下:





————————————————


本文转载自CSDN博主:!Polaris


版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。


原文链接:https://blog.csdn.net/qq_40905198/article/details/120146422

922
0
0
0
关于作者
相关文章
  • 量子玻尔兹曼机:高效生成高维数据分布的量子计算方法 ...
    本文提出了一种利用量子玻尔兹曼机(QBM)生成高维数据分布的方法,解决了经典玻尔兹曼机在处理 ...
    了解详情 
  • Nature Biotechnology|蛋白质结构预测精度超越AlphaFord3 ...
    《Deep-learning-based single-domain and multidomain protein structure prediction with D-I- ...
    了解详情 
  • 诺奖背后的物理基因:玻尔兹曼机、伊辛模型与人工智能的跨世纪联 ...
    本文通过探讨Hinton和Hopfield获得诺贝尔物理学奖的事件,深入剖析了人工神经网络与物理学的紧密 ...
    了解详情 
  • 量子人工智能:推动行业变革的算法与应用前景 ...
    计算领域的进步正在重塑行业格局,并释放出前所未有的潜力。本文探讨了量子人工智能(QAI),即 ...
    了解详情 
  • 人工智能之Hopfield神经网络(HNN)
    了解详情 
在本版发帖返回顶部
快速回复 返回顶部 返回列表
玻色有奖小调研
填写问卷,将免费赠送您5个100bit真机配额
(单选) 您是从哪个渠道得知我们的?*
您是从哪个社交媒体得知我们的?*
您是通过哪个学校的校园宣讲得知我们的呢?
取消

提交成功

真机配额已发放到您的账户,可前往【云平台】查看