【吴恩达机器学习】正则化 Regularization
正则化 (Regularization) 过拟合问题(The Problem of Overfitting) 左边的算法没有很好地拟合训练集,这个问题称作 欠拟合(underfitting) ,也可以说该算法具有 高偏差(high bias) 中间的算法拟合效果不错,是理想的模型 右边的算法几乎完美地拟合了训练集,它的代价函数也可能接近于0,但是它最后给出的模型并不好。这就是 过拟合(Overfitting) 问题,也称该算法具有 高方差(high variance) 解决过拟合问题的方法 减少选取特征的数量 手动删去部分特征变量 模型选择算法(Model Selection Algorithm) 正则化(Regularization) 保留所有的特征变量,但是减少参数 θ j \theta_j θ j 的量级或数值大小 代价函数(Cost Function) 正则化的思路就是减少参数 θ j \theta_j θ j 的量级或数值大小 理想的情况下,我们选出一些影响较小的特征,并减小它们对应的参数,假设是 θ 3 , θ 4 \theta_3,\theta_4 θ 3 , θ 4 ,我们可以修改代价函数来达到这个效果: J ( θ ) = 1 2 m ∑ i = 1 m ( h θ ( x i ) − y ( i ) ) + λ 3 θ 3 2 + λ 4 θ 4