Machine Learning第二课
本节课的主题 ( 1 ) Linear Regression ( 2 ) Gradient Descent ( 3 ) Normal Equation l Linear Regression 这节课用一个房价预测的例子来完整的过一遍有监督机器学习中预测模型的数学基础和数学理论支持。 首先先约定公式中的 Notation : m 训练集合中的样本个数 x 输入变量或特征 y 输出变量或目标结果 (x,y) 表示一个样本 ( ) 表示第i个样本 然后我们来看房价预测的例子,假设我们已知房子的大小以及其对应的价格,那么我们可以在二维空间上做出下面的图示。 问题是给出某个 size 预测对应的 price ,对于这个问题,根据上节课学到的知识,我们知道这是一个有监督学习问题,因为每个样本中都有明确的输入和输出,同时它又是一个回归问题,我们需要预测出一个实数,一个 price 值。确定了问题的一些特征后,我们接下来一个重要的工作便是考虑用什么数学模型或者 hypothesis 来表示这个问题。 而这个问题,我们如何来表示 h ?我们发现图中的点似乎都逼近于一条直线 ( 当然更像是一个二次函数 ) ,然后我们尝试用最简单的数学模型: 线性模型来表示这个 h ,所以 如果我们发现还有其他输入如房间个数,那么线性方程则变为 ,我们可以假设 =1 ,所以 那么我们的问题就转化为,根据已有的 (x,y