最小二乘法
一、 最小二乘法的由来 1805年,法国数学家Legendre发表了最小二乘法的第一个清晰简洁的论述; 1809年,德国数学家高斯发表了《天体运动论》,并声称自1795年以来就使用了最小二乘法。导致了与Legendre的优先权争议。 1829年,高斯提供了最小二乘法的优化效果强于其他方法的证明(高斯-马尔可夫定理) 二、参数估计——最小二乘法(正规方程) 1. 一元线性回归 对于一元线性回归模型 ,其中 e i 表示误差,可得 假设从总体中获取了n组观察值(X1,Y1),(X2,Y2), …,(Xn,Yn)。对于平面中的这n个点,可以使用无数条曲线来拟合。要求样本回归函数尽可能好地拟合这组值。综合起来看,这条直线处于样本数据的中心位置最合理。 选择最佳拟合曲线的标准可以确定为: 使总的拟合误差(即总残差)达到最小 。有以下三个标准可以选择: (1)用“残差和最小”确定直线位置是一个途径。但很快发现计 算“残差和”存在相互抵消的问题。 (2)用“残差绝对值和最小”确定直线位置也是一个途径。但绝对值的计算比较麻烦。 (3)最小二乘法的原则是以“残差平方和最小”确定直线位置。用最小二乘法除了计算比较方便外,得到的估计量还具有优良特性。这种方法对异常值非常敏感。 最常用的是 普通最小二乘法( Ordinary Least Square,OLS)