上一篇(RSD处理高分5号高光谱(GF5 AHSI)数据(三)——从GF5 AHSI 高光谱样本数据搜索光谱库)我们使用从高光谱数据集提取到的样本数据搜索光谱库,查找与之最相似的地物光谱,并列出相似程度从高到低的一个清单。这里我们将这个过程反过来,搜索高光谱数据集中有没有与光谱库特定光谱相似的高光谱对象。
下面通过例子说明使用RSD实现这种搜索的过程。
使用的数据集GF5_AHSI_E117.12_N40.19_20190501_005208_L10000043254.tar来自高分中心,30m分辨率。光谱库数据选自USGS splib07a的一个白皮松的光谱数据splib07a_WhitebarkPine_YNP-WB-2_frst_AVIRISb_RTGC。
GF5 AHSI高光谱数据集是2019年5.1期间平谷县境内山林,光谱数据使用的是美国白皮松的光谱。要是有本地树种的光谱当然好了,由于我没有,就随便找一个代替的。是说搜一搜平谷有没有美国白皮松生长?开个玩笑了,当然没有,我们就搜索一下光谱最接近的地物对象吧。
1. 加载GF5 AHSI 高光谱数据集,并进行大气校正
这部分在前面几篇已经讲了。
2. 对象分割
勾选高光谱数据层,在主窗口滚动鼠标滚轮直至光标变成黑箭头,右击出现一个弹出菜单。从菜单中选择“分类对象分割->基于图像特征的分割”,点击后出现一个对话框(图1)。
图1 对象分割的参数
新版RSD对图像分割这部分又进行了求精,具体的参数设置和说明以后单独介绍,按照这样参数点击确定就可以,分割结果见图2。这里是早期介绍RSD对象分割的博文,更详细的说明参阅RSD有关对象分割的介绍。
图2 对象分割结果
3. 打开光谱库
图3 选择光谱库
4. 开始搜索
点击图4菜单
图4 开始从数据集搜索相似光谱数据
出现图5的对话框,在该对话框点击确定开始搜索。
图5 搜索相似光谱数据的参数设置
搜索结果见图6。这是一个单独弹出的一个窗口,显示了所有搜索得到的数据对象。实际上在层列表窗口搜索的结果同时创建了一个新层,结果和这个窗口相同。保留这个窗口是为了便于多结果进行修改。
图6 相似系数(光谱向量夹角余弦)大于0.932时的结果
5. 修改光谱向量夹角余弦不同置信水平
修改光谱向量夹角余弦不同置信水平的结果。在图6红框中修改该值,结果如下。
图7 部分原始影像
图8 相似系数0.99
图9 相似系数0.98
图10 相似系数0.97
图11 相似系数0.96
在平谷县我们检测到有美国白皮松的树种了吗?当然没有,RSD做为一个数据处理平台不做“是”或者“不是”这种断言,但是给你提供了一个详细分析检测的工具和手段。也许我们用油松或者橡树等树种进行检验会得到令人惊喜的效果。
用训练样本搜索数据集
现在我们会自然想到用自己建立的光谱库对高光谱数据集进行搜索了。我们在上述数据集中采集一些样本,用该样本建立一个光谱数据,然后再用该光谱数据对高光谱数据集进行搜索,看看会发生什么。
1. 采集样本
(在上一篇中已经介绍了如何采集样本数据),这里采集了一些山林的样本(红色的块)。
2. 将样本数据保存到自建光谱库
按照图12操作。
图12 高光谱样本保存到光谱库
3. 打开保存到光谱库的样本
打开保存到光谱库(图13)样本,并在层列表勾选高光谱数据集。
图13 私有光谱库选择保存的样本数据
4 开始搜索
点击图4菜单,参见图5、图6。 然后开始搜索,结果如下。
图14 相似系数0.99
图15 相似系数0.98
图16 相似系数0.97
我们再回头看一下,从高光谱数据集采集训练样本;然后构造各种不同类型的指标(最大似然估计、光谱向量夹角、各种距离、各波段权重…);然后从数据集提取相同的类别…。这不就是监督分类吗?是这样的,这可以得到需要的某一类,也可以一类一类分下去。实际上RSD提倡一种一分类分类法,而不是一下子划分出所有类。至于叫判别还是决策还是分类还是其它什么名字都只是称呼而已,目标是区分出你需要的数据类别。RSD比较倾向于称之为“一分类分类法”,在RSD有关分类的部分我们再详细讨论。
下面再看一个有趣的事情。图17是相似系数(光谱向量夹角余弦)为0.997时的搜索结果。图18是选取的样本数据对象位置。
图17相似系数(光谱向量夹角余弦)为0.997时的搜索结果
图18选取的训练样本(红色斑块)
从图17、18可见搜索结果并不包含所有训练样本,也就是说训练样本没有被正确分类。其实这在实际分类实践中也不是很奇怪的事情。
现在来总结下如下几种情况:
- 如果我们将样本数据做为验证数据(实际上验证数据可以包含但不仅限于样本数据)。可以看出,图18中三块蓝箭头标记的对象在相似系数0.997(图17)时没有入选,分类精度不到50%。
- 相似系数在0.97时(图16),仍然使用样本数据做为验证数据,此时分类精度为100%。
- 如果仅取1个对象为训练样本,绝大多数相似系数取值都可以保证分类精度是100%。
- 放宽分类阈值的划分标准,就可以提高表观的分类精度。
这不就出了问题了吗?不管使用何种分类精度的检验方法,最后给你的分类精度不就是可以任意操控的了吗?那样我们还要精度检验有何用?
一些常用的分类精度检验方法对检验分类方法(注意我说的是“方法”)的准确性是有效的,比方医学上的诊断方法(实际上每个医生都可以认为在使用不同的诊断方法包括自己的经验),同样的病例使用不同的诊断方法可以得出不同的分类精度,这是一种检验方法的有效的手段。但是在遥感分类的一些应用中是使用某些固定方法来检验所谓的实际类别划分精度,这种精度检验并不是在检验你的分类精度,而是检验了你的训练样本的精度或者说是你的验证数据的精度,并不是分类的精度。这样的分类精度检验实质上变成了可任意操控的“数字游戏”,实际上是没有意义的。
个人观点,欢迎批评。关于分类的问题还需要进一步深入讨论,这里仅仅提到了一些现象。
加QQ群136965427,在这里下载软件和发布、讨论有关RSD技术问题。
来源:CSDN
作者:副组长
链接:https://blog.csdn.net/gordon3000/article/details/104174337