最小二乘、加权最小二乘(WLS)、迭代加权最小二乘(迭代重加全最小二乘)(IRLS)
最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。最小二乘法还可用于曲线拟合。
X=⎣⎢⎢⎡x11x21x31...x12x22x32............xmn⎦⎥⎥⎤ Y=⎣⎡y1...ym⎦⎤ θ=⎣⎡θ1...θn⎦⎤
X中每一列为特征,每一行代表一个样本;Y为标签;θ是参数
有优化问题:f(θ)=21∣∣Xθ−Y∣∣2
f(θ)=21(θTXTAθ−θTATY−YTAθ+YTY)
对函数f(θ)关于参数θ求偏导:∂θ∂f(θ))=ATAθ−ATY=0
θ=(ATA)−1ATY
得到θ的解析解。
- 加权最小二乘(WLS):
加权最小二乘是在普通最小二乘的基础上对每个样本引入权重,调整不同样本误差对损失函数的贡献率。
加权最小二乘法是对原模型进行加权,使之成为一个新的不存在异方差性的模型,然后采用普通最小二乘法估计其参数的一种数学优化技术。
异方差性是相对于同方差而言的。所谓同方差,是为了保证回归参数估计量具有良好的统计性质,经典线性回归模型的一个重要假定:总体回归函数中的随机误差项满足同方差性,即它们都有相同的方差。
X、Y、θ定义如上,引入对角矩阵W
W=⎣⎢⎢⎡w110...0...w22...00.........00...wmm⎦⎥⎥⎤
损失函数变为:f(θ)=21∥W(Xθ−Y)∥2
f(θ)=21(WθTXTAθ−WθTATY−WYTAθ+WYTY)
对函数f(θ)关于参数θ求偏导:∂θ∂f(θ)=−XTWTWY+XTWTWXθ=0
θ=(XTWTWX)−1XTWTWY