SVM是通过超平面将样本分为两类。
在超平面
确定的情况下,可以相对地表示点距离超平面的远近。对于两类分类问题,如果,则的类别被判定为1;否则判定为-1。所以如果
,则认为的分类结果是正确的,否则是错误的。且的值越大,分类结果的确信度越大。反之亦然。所以样本点
与超平面之间的函数间隔定义为但是该定义存在问题:即
和同时缩小或放大M倍后,超平面并没有变化,但是函数间隔却变化了。所以,需要将的大小固定,如,使得函数间隔固定。这时的间隔也就是几何间隔 。几何间隔的定义如下
实际上,几何间隔就是点到超平面的距离。想像下中学学习的点
到直线的距离公式所以在二维空间中,几何间隔就是点到直线的距离。在三维及以上空间中,就是点到超平面的距离。而函数距离,就是上述距离公式中的分子,即未归一化的距离。
定义训练集到超平面的最小几何间隔是
SVM训练分类器的方法是寻找到超平面,使正负样本在超平面的两侧,且样本到超平面的几何间隔最大。
所以SVM可以表述为求解下列优化问题
以上内容在《统计学习方法》中,均有详细的讲解。
作者:Jason Gu
链接:https://www.zhihu.com/question/20466147/answer/28469993
文章来源: https://blog.csdn.net/ctrigger/article/details/90475213