动手学深度学习——多层感知机
多层感知机 多层感知机是一种简单的神经网络,包含输入层、隐藏层以及输出层。如下图所示。 多层感知机的计算过程 输入层为小批量样本 X ∈ R n × d \boldsymbol{X} \in \mathbb{R}^{n \times d} X ∈ R n × d ,批量大小为 n n n ,输入个数为 d d d 。上述图的多层感知机为单隐藏层,隐藏层输出为 H H H , H ∈ R n × h \boldsymbol{H} \in \mathbb{R}^{n \times h} H ∈ R n × h , h h h 为隐藏层单元个数。网络各层之间全连接,设隐藏层的权重参数和偏差参数分别为 W h ∈ R d × h \boldsymbol{W}_{h} \in \mathbb{R}^{d \times h} W h ∈ R d × h , b h ∈ R 1 × h \boldsymbol{b}_{h} \in \mathbb{R}^{1 \times h} b h ∈ R 1 × h 。输出层的权重和偏差参数分别为 W o ∈ R h × q \boldsymbol{W}_{o} \in \mathbb{R}^{h \times q} W o ∈ R h × q , b o ∈ R 1 × h \boldsymbol{b}_{o} \in \mathbb{R}^