几何间隔、函数间隔和||W||

匿名 (未验证) 提交于 2019-12-02 23:34:01

SVM是通过超平面将样本分为两类。

在超平面

确定的情况下,

可以相对地表示点

距离超平面的远近。对于两类分类问题,如果

,则

的类别被判定为1;否则判定为-1。

所以如果

,则认为

的分类结果是正确的,否则是错误的。且

的值越大,分类结果的确信度越大。反之亦然。

所以样本点

与超平面

之间的函数间隔定义为

但是该定义存在问题:即

同时缩小或放大M倍后,超平面并没有变化,但是函数间隔却变化了。所以,需要将

的大小固定,如

,使得函数间隔固定。这时的间隔也就是几何间隔 。

几何间隔的定义如下

实际上,几何间隔就是点到超平面的距离。想像下中学学习的点

到直线

的距离公式


所以在二维空间中,几何间隔就是点到直线的距离。在三维及以上空间中,就是点到超平面的距离。而函数距离,就是上述距离公式中的分子,即未归一化的距离。

定义训练集到超平面的最小几何间隔是

SVM训练分类器的方法是寻找到超平面,使正负样本在超平面的两侧,且样本到超平面的几何间隔最大。
所以SVM可以表述为求解下列优化问题


以上内容在《统计学习方法》中,均有详细的讲解。


作者:Jason Gu
链接:https://www.zhihu.com/question/20466147/answer/28469993

文章来源: https://blog.csdn.net/ctrigger/article/details/90475213
标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!