人工神经网络(ANN)模型简介

作为深度学习的基础，神经网络模型发挥着很重要的作用。

我们来看一下ANN的定义：

神经网络是由具有适应性的简单单元组成的广泛并行互联的网络，它的组织能够模拟生物神经系统对真实世界物体所作出交互反应。

我们知道，生物神经网络的简单单元由生物神经元组成，那么在ANN模型中，简单单元由什么组成呢？

在经典ANN模型中，简单单元，即M-P神经元模型。我们知道感知机和Logistic回归都是线性分类模型，它们的不同点在于分类函数的选取是不一样的。
我们令 $z = w^{T} x$ 。感知机的分类决策函数： $f (x) = g (z) = s i g n (z)$
其中 $s i g n (\cdot)$ 为阶跃函数： $s i g n (z) = 1 i f z \geq 0 e l s e 1$
Logistic回归的分类决策函数则是Sigmoid函数： $f (x) = g (z) = \frac{1}{1 + e^{- z}}$ ，它表示的是将样本分类成正例和负例的几率比。也是一个阶跃函数的替代函数。

具体地请参考我的博客
https://blog.csdn.net/wuyanxue/article/details/80205582

典型的M-P神经元模型的输入与输出和Logistic回归一样，不过在这里Sigmoid是作为激活函数而存在的。也就是说，Sigmoid表示的只是一个神经元的输出，不代表整个ANN的输出。一张图形象地表示该MP神经元：

我们知道生物神经网络是由非常多的生物神经元连接而成。类似地，ANN也是由多个神经元模型按照一定的规则连接构成。下图展示了一个全连接（Full Connected, FC）神经网络（FC-NN）：

我们可以发现FC-NN具有以下特点：
1. 神经元按照层来布局。如上图，最左边称为输入层（Input layer），中间称为隐藏层（Hidden layer），最右边称为输出层（Output layer）
2. 同一层的神经元没有连接。
3. 第N层的每个神经元都第N-1层的所有神经元连接（这就是Full connected的含义），第N-1层神经元的输出就是第N层神经元的输入。
4. 每个神经元的连接都具有一个权值。注意到，这里的 $X = (x_{1}, x_{2}, x_{3})$ 表示的是一个输入向量， $Y = (y_{1}, y_{2})$ 表示的是输出向量。
5. 另外，隐藏层可以是多层。
为了统一符号，我们假设一个输入向量为 $x$ ，输出向量为 $y$ 。
令
$w_{4} = (w_{41}, w_{42}, w_{43})^{T}$
$w_{5} = (w_{51}, w_{52}, w_{53})^{T}$
$w_{6} = (w_{61}, w_{62}, w_{63})^{T}$
$w_{7} = (w_{71}, w_{72}, w_{73})^{T}$
$W_{1} = (w_{4}, w_{5}, w_{6}, w_{7})$
$a = (a_{4}, a_{5}, a_{6}, a_{7})^{T}$
那么隐藏层的值为：
$a = f (W_{1}^{T} x)$ ，其中 $f (z) = (f (z_{1}), \dots, f (z_{n}))^{T}$ ，而 $f (\cdot)$ 为Sigmoid函数。
又令
$w_{8} = (w_{81}, w_{82}, w_{83}, w_{84})^{T}$
$w_{9} = (w_{91}, w_{92}, w_{93}, w_{94})^{T}$
$W_{2} = (w_{8}, w_{9})$
那么输出层的值为：
$y = f (W_{2}^{T} a)$

现在，我们知道了在FC-NN中的每个神经元输入输出的计算方法。那么如何来训练呢？

继续更新。。。。

文章来源: 人工神经网络(ANN)模型简介

标签

人工神经网络

sigmoid