间隔与支持向量 给定训练样本集 D = { ( x 1 , y 1 ) , ( x 2 , y 2 ) ⋯ , ( x n , y n ) } , y i ∈ { − 1 , + 1 } D=\{(x_1,y_1),(x_2,y_2)\cdots, (x_n,y_n)\},y_i\in \{-1, +1\} D = { ( x 1 , y 1 ) , ( x 2 , y 2 ) ⋯ , ( x n , y n ) } , y i ∈ { − 1 , + 1 } ,分类学习的最基本的思想就是基于样本空间中找个一个划分超平面,将不同类别的样本分开,但是超平面可能有很多种 直观上应该找最中间的划分超平面,因为该超平面对训练样本局部的扰动的容忍最好的。由于训练集的局限性或噪声的因素,训练集外的样本可能更接近两个类的分隔界,这个划分超平面所产生的分类结果是最鲁棒的,对未见的示例泛化能力最强。 超平面的线性方程描述: ω T x + b = 0 {\rm\pmb{\omega}}^Tx + b = 0 ω ω ω T x + b = 0 其中 ω = ( ω 1 ; ω 2 ; ⋯ ; ω d ) \pmb\omega=(\omega_1;\omega_2;\cdots;\omega_d) ω ω ω = ( ω 1 ; ω 2 ; ⋯ ; ω d