遥感怎么分类的
题目:Support vector machines for classification in remote sensing
作者:M. PAL,P. M. MATHER 英国诺丁汉大学地理学院
一、综述
文章旨在比较SVM、最大似然法(ML)及人工神经网络(ANN)在分类任务中的准确率。使用的数据为Landsat-7 ETM+(多光谱数据)和DAIS(高光谱数据),实验区域为:英格兰东部和西班牙中部。
1995年Vapnik提出了SVM替代神经网络分类器,后有人将其应用在遥感数据分类上。SVM基于统计学习理论,确定分类边界,得到理想的分类结果。比如,在线性可分的二分类模式识别问题中,SVM从大量线性决策边界中选取最小化泛化误差的边界。被选择的边界应在两类之间留下最大空白区域,这个区域的宽度为超平面到两类最近点的距离之和。使用标准二次规划(QP)优化方法可以达到空白区域最大化。离超平面最近的数据点用来测量空白区域,成为支持向量,数量很小。
如果二分类线性不可分,SVM会尝试寻找既能最大化空白区域又能最小化错分误差的超平面。用户定义一个常量来平衡空白区域和误差。SVM也可处理非线性,Boser(1992)使用核函数将输入数据映射到高维空间,并明确表达了线性分类器的方法。Vapink(1995)有更多的讨论。
对于N分类问题,SVM需要划分N个超平面,建立N个QP优化问题,每个QP都将一个类别从其余类别中分离出来,称为“one against the rest”。或者,从N个类的训练集中评估所有可能的两类分类器,每个分类器仅在N个类中的两个上训练,给出总共n(n-1)/ 2个分类器。 将每个分类器应用于测试数据向量,对获胜类别进行一次投票。票数最多则为哪一类,称为“one against one”。
二、研究内容与方法
使用2000年6月19日获取的ETM+数据,分为7类:小麦、土豆、甜菜、洋葱、豌豆、生菜和豆类。高光谱图像(2000.6.29)识别8类:小麦、水体、干盐湖、水生蔬菜、葡萄、裸地、牧场及建筑区。
RHUL_SVM既可使用“one against the rest”又可使用“one against one”比较分类。LIBSVM只能做“one against one”。这些SVM分类的结果将与ML和ANN方法作比较。
对着两个区域的数据采样。将像素分为两组:区域1(ETM+ 数据)2700训练集,2307测试集;区域2(高光谱数据)800训练集,3800测试集。ANN训练时,每类随机选取60像素作为验证数据。
三、实验结果及分析
SVM中的核可扩展容量解决非线性问题。截至改论文发表之时没有文献明确研究出关于核大小及参数选取的规则,只能通过大量实验测试,因此文章选取5个不同的核,不同的参数设置测试模型分类准确率。实验发现,得到的准确率最高。表1列举了训练次数和准确率,表2显示了ML和ANN的分类结果:
实验第二部分:使用高光谱数据(800+光谱波段特征)研究SVM、ML及ANN,维度增加(为什么)降低了需要计算概率的统计参数估测的可靠性,根据Hughes(1968),这会降低ML的准确率。由于ANN不依赖于统计参数,因此影响不大。DAIS共有72个波段,由于其中7个存在严重的band问题,这里只使用了65个。初始值为5,每5一循环。结果如下所示:
四、感悟
来源:https://blog.csdn.net/u011582187/article/details/81319068