SVM的推导和理解
主要记录了SVM思想的理解,关键环节的推导过程,主要是作为准备面试的需要. 1.准备知识-点到直线距离 点 \(x_0\) 到超平面(直线) \(w^Tx+b=0\) 的距离,可通过如下公式计算: \[ d = \frac{w^Tx_0+b}{||w||}\] 因为公式分子部分没有带绝对值,因此计算得到的d有正负之分.因为超 \(w^Tx+b=0\) 将空间分为两部分(以2维为例,直线 \(w_1x+w_2y+b=0\) ,将二维空间划分为上下两部分),其中一部分d大于0,另一部分d小于0. 上面距离公式的简单推导过程如下: 超平面 \(w^Tx+b=0\) 的一个法向量为 \(w\) : 因为对于超平面上任意不同的两点 \(x_0,x_1\) ,他们所构成的向量 \((x_1-x_0)\) ,与 \(w\) 的内积为: \[\begin{align} w^T(x_1-x_0) &= w^Tx_1-w^Tx_0\\ &= -b-(-b)\\ &= 0 \end{align}\] 即, \(w\) 与超平面上任意向量(直线)正交,即 \(w\) 为超平面的法向量, \(\frac{w}{||w||}\) 为超平面的单位法向量. 点 \(x_0\) 到超平面 \(w^Tx+b=0\) 的距离等于,平面上任意一点 \(x_1\) 与点 \(x_0\) 构成的向量在单位法向量上的投影,即: