开物量子开发者社区

Kaiwu-PyTorch-Plugin

量子奇点计划

量子计算云平台

人工神经网络（ANN）及BP算法

2024-10-18 17:34:29

人工智能

算法解析

本帖最后由离子于 2025-1-23 16:33 编辑

1 什么是神经网络

1.1 基本结构

说明：

1. 通常一个神经网络由一个input layer，多个hidden layer和一个output layer构成。

2. 图中圆圈可以视为一个神经元（又可以称为感知器）

3. 设计神经网络的重要工作是设计hidden layer，及神经元之间的权重

4. 添加少量隐层获得浅层神经网络SNN；隐层很多时就是深层神经网络DNN

1.2 从逻辑回归到神经元

LinearRegression模型：

$z=b+{w}_{1}{x}_{1}+{w}_{2}{x}_{2}$

sigmoid函数：

$a=g(z)=\frac {1} {(1+{e}^{-z})}$

LR可以理解为如下结构：

所以逻辑回归是一个单层感知器（没有隐层）结构。

2 为什么需要神经网络

首先，神经网络应用在分类问题中效果很好。工业界中分类问题居多。

LR或者linear SVM更适用线性分割。如果数据非线性可分（现实生活中多是非线性的），LR通常需要靠特征工程做特征映射，增加高斯项或者组合项；SVM需要选择核。而增加高斯项、组合项会产生很多没有用的维度，增加计算量。GBDT可以使用弱的线性分类器组合成强分类器，但维度很高时效果可能并不好。

2.1 非线性可分怎么办

如下图非线性可分

从逻辑回归看，单层感知器只能解决线性问题。要解决非线性问题，需要引入多层感知器（加入隐层）。

这时使用两个线性分类器，再求逻辑与就可以达到分类的效果。注意，最开始的两个线性分类器都是部分正确的分类器

2.2 神经元完成逻辑与

前面说可以使用两个线性分类器的逻辑与可以完成上例的非线性分割。暂时不管两个线性分类器，现在先使用神经元（感知器）达到逻辑与的效果

假设

${x}_{1},{x}_{2}\in 0,1$

$y={x}_{1}\cap {x}_{2}$

$z=-30+20{x}_{1}+20{x}_{2}$

${h}_{\Theta }(x)=g(z)=\frac {1} {(1+{e}^{-z})}$

这样，g(z)完成逻辑与：

调整z的参数，可以实现逻辑或等操作

2.3 流程图

可以看到，先有imput layer生产两个线性分类器，在通过两个线性分类器的权重组合构成逻辑与，完成非线性分类。

注意，训练两个线性分类器需要imput的权重，逻辑与又需要两个线性分类器的权重。

2.4 效果

对线性分类器的逻辑与和逻辑或的组合可以完美的对平面样本进行分类

隐层决定了最终的分类效果

由上图可以看出，随着隐层层数的增多，凸域将可以形成任意的形状，因此可以解决任何复杂的分类问题。实际上，Kolmogorov理论指出：双隐层感知器就足以解决任何复杂的分类问题。

3 神经网络表达力与过拟合

1. 理论上，单隐层神经网络可以逼近任何连续函数（只要隐层的神经元个数足够）

2. 虽然从数学上看多隐层和单隐层表达能力一致，但多隐层的神经网络比单隐层神经网络工程效果好很多

3. 对于一些分类数据（比如CTR预估），3层神经网络效果优于2层神经网络，但如果把层数不断增加（4，5，6层），对最后的结果的帮助没有那么大的跳变

4. 图像数据比较特殊，是一种深层的结构化数据，深层次的卷积神经网络能更充分和准确的把这些层级信息表达出来

5. 提升隐层数量或者隐层神经元个数，神经网络的“容量”会变大，空间表达能力会变强

6. 过多的隐层和神经元结点会带来过拟合问题

7. 不要试图降低神经网络参数量来减缓过拟合，用正则化或者dropout

4 神经网络结构

4.1 网络结构

n个输入；输出m个概率

4.2 传递函数/激活函数

前面每一层输入经过线性变换wx+b后还用到了sigmoid函数，在神经网络的结构中被称为传递函数或者激活函数。

除了sigmoid，还有tanh、relu等别的激活函数。激活函数使线性的结果非线性化。

4.2.1 为什么需要传递函数

简单理解上，如果不加激活函数，无论多少层隐层，最终的结果还是原始输入的线性变化，这样一层隐层就可以达到结果，就没有多层感知器的意义了。

所以每个隐层都会配一个激活函数，提供非线性变化。

4.2.2 介绍两种激活函数

双S函数又被称为tanh函数

5 BP算法

5.1 网络结构

1. 正向传播求损失，反向传播回传误差

2. 根据误差信号修正每层的权重

3. f是激活函数；f(netj)是隐层的输出； f(netk）是输出层的输出O; d是target

5.2 如何反向传播

以三层感知器为例：

结合BP网络结构，误差由输出展开至输入的过程如下：

有了误差E，通过求偏导就可以求得最优的权重。（不要忘记学习率）

BP算法属于δ学习规则类，这类算法常被称为误差的梯度下降算法。这类算法要求变换函数可导（sigmoid是满足的)

5.3 举例

图中元素：

两个输入；

隐层: b1, w1, w2, w3, w4 (都有初始值）

输出层：b2, w5, w6, w7, w8（赋了初始值）

5.3.1 前向运算计算误差

则误差：

5.3.2 反向传播

求误差对w5的偏导过程

参数更新：

求误差对w₁的偏导

注意，w₁对两个输出的误差都有影响

通过以上过程可以更新所有权重，就可以再次迭代更新了，直到满足条件。

————————————————

本文转自CSDN平台博主：一个人的场域

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

原文链接：https://blog.csdn.net/leiting_imecas/article/details/60463897

979

0

0

0

关于作者

相关文章

数据高效且可解释！解耦变分自编码器开启逆向材料设计新时代 ...

本文解读研究——基于解耦变分自编码器（Disentangled Variational Autoencoder, DVAE ...
了解详情
告别“快不准、准不快”：粗粒度玻尔兹曼生成器 CG-BG，重新定义 ...

本文解读研究《 Coarse-Grained Boltzmann Generators 》。该模型统一了粗粒度降维与玻尔兹曼生 ...
了解详情
Cell | D-SPIN：基于Ising物理模型的可解释生成式基因调控网络推 ...

当下Perturb-seq数据爆发期从扰动数据出发的可解释、可生成的GRN推断框架的空白有待填补Replogle ...
了解详情
Cell ：D-SPIN 从单细胞转录组构建调控网络，解析细胞扰动响应底 ...

本文解读Cell 2026的研究《 D-SPIN constructs regulatory network models from scRNA-seq ...
了解详情
用量子计算机算命？一个程序员的疯狂实验

"大师，我今年运势如何？""你八字火旺，宜往南方发展……"——这是算命。 ...
了解详情

开物量子开发者社区

Copyright 2021-2026 开物量子开发者社区版权所有 All Rights Reserved. 相关侵权、举报、投诉及建议等，请发E-mail: business@boseq.com

活动中心

联系我们

二维码

返回顶部

每日必做

新手任务

长期任务

其他任务

快速回复 返回顶部 返回列表

玻色有奖小调研

填写问卷，将免费赠送您1个1000bit真机配额

(单选) 您是从哪个渠道得知我们的？*

您是从哪个社交媒体得知我们的？*

您是通过哪个学校的校园宣讲得知我们的呢？

取消

完善个人信息，立享配额奖励

跳过

填写有效姓名和单位，方便我们更好地服务和帮助您的使用，还将免费赠送您1个CPQC-1000的真机配额

姓名 *

姓名不能为空

职务

学校/企业名称 *

学校/企业名称不能为空

所属行业

提交成功

真机配额已发放到您的账户，可前往【云平台】查看

量子AI开发者认证

考核目标

开发者能够成功搭建Kaiwu-PyTorch-Plugin项目基础环境，并成功运行示例代码，根据示例提示，输出指定的值并填写至相应的输入框中。

通过奖励

5个一年效期的1000量子比特真机配额

专属「量子AI开发者」社区认证标识

开发者权益

每月固定权益：5个550量子比特真机配额

前往考核

第一步

按照README提示成功安装Kaiwu-PyTorch-Plugin库环境依赖

前往GitHub

第二步

运行 community-assessment 分支下的 run_rbm.py 代码示例

第三步

理解示例代码，手动打印并填写如下数值：

正相采样的状态

负相采样的状态

正相的能量值

负相的能量值

*

提交答案

开发者权益

每月固定权益：5个550量子比特的真机配额

恭喜您完成考核

您将获得量子AI开发者认证标识及考核奖励

1000 bit*5

配额

Quantum AI Developer Certification

Assessment Objectives

Developers should successfully set up the basic environment for the Kaiwu-PyTorch-Plugin project, run the QBM-VAE sample code, and calculate the correct FID value based on the random seed value provided by the system.

Pass Rewards

10 quotas for 550-qubit real quantum machines with a one-year validity period

Exclusive "Quantum AI Developer" Community Certification Badge

Developer Benefits

Fixed Monthly Benefits: 5 quotas for 550-qubit real quantum machines

Proceed to Assessment

Step 1

Install the environment dependencies for the Kaiwu-PyTorch-Plugin library according to the README instructions

Go to GitHub

Step 2

Replace the Seed Value

Your seed value is

Step 3

Enter the FID Value You Calculated

*

Submit Answer

Developer Benefits

Fixed Monthly Benefits: 5 quotas of 550-qubit real machines

Congratulations on Completing the Assessment

You will receive the Quantum AI Developer Certification Badge and Assessment Rewards

550bit*10

Quotas