机器学习03-线性回归
文章目录 1. 问题背景 2. 数据表示 2.1. 特征向量 2.2. 特征矩阵 2.3. 样本标记 3. 模型 4. 训练 4.1. 损失函数和代价函数 4.2. 优化目标 4.3. 梯度下降 5. 正规方程 6. 波士顿房价求解 7. 参考 1. 问题背景 波士顿房价 数据集包含506条波士顿的城镇信息,每一条城镇信息都包含了14个属性的值,希望从该数据集找到城镇 房价中位数 与其它13属性之间存在的关系或规律,使得给出波士顿的一个城镇的前13个属性的值,就能够预测出该城镇的房价中位数。 这是一个典型的可以用 线性回归 (linear regression)算法解决的问题。线性回归算法是一种回归算法,属于监督学习算法,它使用的数据集既有特征又有标记,样本标记和预测结果都是连续值。 2. 数据表示 2.1. 特征向量 使用用特征向量表示数据集中的一个样本,一个样本的特征向量包含了该样本所有特征(feature)的值,但不包含需要预测的那一个属性的值: x ( i ) = ( x 1 ( i ) x 2 ( i ) ⋮ x n ( i ) ) \boldsymbol{{x}^{(i)}} = \begin{pmatrix} x_{1}^{(i)} \\ x_{2}^{(i)} \\ \vdots \\ x_{n}^{(i)} \end{pmatrix} x ( i ) = ⎝ ⎜