前馈神经网络

您所在的位置：网站首页 › BP神经网络的正向过程主要计算哪个值 › 前馈神经网络

前馈神经网络

2024-07-13 18:50| 来源: 网络整理| 查看: 265

2、多层感知机（前馈神经网络）

2.1 定义

2.2 神经元

2.3 激活函数

2.3.1 sigmoid函数

2.3.2 tanh函数

2.3.3 relu函数

2.4 计算

2.4.1 前向传播

2.4.2 反向传播

2、多层感知机（前馈神经网络） 2.1 定义

多层感知机（MLP）是一种前馈神经网络模型。

前馈神经网络（feedforward neural network），又称作深度前馈网络（deep feedforward network）、多层感知机（multilayer perceptron，MLP）

除了输入输出层，它中间可以有多个隐层，最简单的MLP只含一个隐层，即三层的结构，如下图：（图片来自《动手学深度学习》）

2.2 神经元

人工神经元简称神经元，是构成神经网络的基本单元，其主要是模拟生物神经元的结构和特性，接受一组信号并产生输出。假设一个神经元接受了一组输入后，这些输入又会分别各自做出加权和偏置操作，最后得出一个值称之为净输入，这时我们的净输入需要经过一个非线性函数f(·)后，得到神经元的活性值a,其中的非线性函数称为激活函数。

2.3 激活函数

2.3.1 sigmoid函数

特点：

它能够把输入的连续实值变换为0和1之间的输出，特别的，如果是非常大的负数，那么输出就是0；如果是非常大的正数，输出就是1.

缺点:

缺点1：在深度神经网络中梯度反向传递时导致梯度爆炸和梯度消失，其中梯度爆炸发生的概率非常小，而梯度消失发生的概率比较大

缺点2：Sigmoid 的 output 不是0均值（即zero-centered）。这是不可取的，因为这会导致后一层的神经元将得到上一层输出的非0均值的信号作为输入。产生的一个结果就是：如x>0, x>0, f= ,那么对w求局部梯度则都为正，这样在反向传播的过程中w要么都往正方向更新，要么都往负方向更新，导致有一种捆绑的效果，使得收敛缓慢。当然了，如果按batch去训练，那么那个batch可能得到不同的信号，所以这个问题还是可以缓解一下的。因此，非0均值这个问题虽然会产生一些不好的影响，不过跟上面提到的梯度消失问题相比还是要好很多的。

缺点3：其解析式中含有幂运算，计算机求解时相对来讲比较耗时。对于规模比较大的深度网络，这会较大地增加训练时间。

2.3.2 tanh函数