- 上一篇牛顿法(Newton Method)中介绍了牛顿法的基本思路,牛顿法具有二阶收敛性,相比较最速下降法,收敛的速度更快。
- 但是牛顿法也有一个缺点就是:求解Hessian矩阵复杂度比较大
- 对于函数,其中为向量。在牛顿法的求解过程中,首先是将函数在处展开,并且令函数在处的梯度为:
- 泰勒展开为:
- 的Hesse矩阵,省略高价无穷小量:
- 对求导,并令导数为:
- 求出:
- 由于求解Hessian矩阵复杂度比较大,于是下面我们利用上一步即第步的信息来求Hessian矩阵:
- 上面得到公式:
- 我们令:
- 利用上面公式我们可以使用来模拟出Hesse矩阵的构造过程,此方法便称为拟牛顿法(QuasiNewton)。
- 在拟牛顿法中主要包括:DFP拟牛顿法,BFGS拟牛顿法。这里我们讲解DFP拟牛顿法。
- 化解上面式子:
- 令得:
- 假设下面式子成立:
- 这样只要我们求出就就可以得到,这样我们就将其带入上面的方程中:
- 令矩阵用下面式子构造:其中Ϊ的向量。
- 令::