动手学习深度学习 3-2 Softmax-regression
Softmax Regression 1. softmax 回归 softmax 回归主要是解决分类问题,输出是离散值,区别于线性回归,输出单元从一个变成了多个。 注: 需要在notebook文件地址下打开jupyter notebook,如果在子文件夹 04 chapter-deep-learning-basics 下打开,则无法访问 notebook/img 中的图片 1.1 softmax回归模型 softmax回归将输入特征与权重做线性叠加,输出值个数等于标签里的类别数。假设有4种特征和3种输出动物类别,所以权重包含12个标量(带下标的 \(w\) )、偏差包含3个标量(带下标的 \(b\) ),且对每个输入计算 \(o_1, o_2, o_3\) 这3个输出: \[ \begin{aligned} o_1 &= x_1 w_{11} + x_2 w_{21} + x_3 w_{31} + x_4 w_{41} + b_1,\\ o_2 &= x_1 w_{12} + x_2 w_{22} + x_3 w_{32} + x_4 w_{42} + b_2,\\ o_3 &= x_1 w_{13} + x_2 w_{23} + x_3 w_{33} + x_4 w_{43} + b_3. \end{aligned} \] softmax回归是一个单层神经网络