如何评价红外图像DDE算法的好坏(个人理解)

懵懂的女人 提交于 2019-12-11 19:22:35

写在前面

最近在不断地调研一些新的红外图像增强算法,优化与仿真实现了一些不同算法框架下的图像效果,在各种算法框架的取舍中,陷入了困惑。

归根到底,那就是对一个看似简单实却难以说清楚的基础问题,没有理解透彻,因此我决定就这问题学习并总结一番。

这个问题就是:什么是一张好图像。

明确了这个问题,进而才能理解:什么是一个好的红外图像可视化算法。

冈萨雷斯在其《数字图像处理》第二章最开始,引用这么一段话。

要想成功,就必须弄清基础问题。

—亚里士多德

对本质上的东西搞明白了,有了一定的知识框架,做事情也就条理清晰,章法有度了。

正文中也就这两个问题加以展开。

问题1:什么是一张好图像?

问题2:什么是一个好的红外图像可视化算法?

进入正文

1.什么是一张好图像?

这是一个看似很简单的问题,有人说不就是图像好看不好看呗。其实这个就是图像的评价。图像的评价有包含两方面:美学评价和技术评价。前者是艺术家的事情,这里不讨论。对于我们做相机的工程师来说,更偏向了后者。

关于技术评价,个人觉得这里面又包含两方面,一种是基于实验室环境的相机性能评价,典型的就是:EMVA1288标准;另一种是对于实际场景图像质量的评价。

1.1 基于实验室环境的相机性能评价

最为典型的是相机界大名鼎鼎的EMVA1288标准,它是由欧洲机器视觉协会(EMVA)建立,主要的图像传感器与相机生产商均参与其中。它是基于实验室环境下,我们对光照,色温等等参数,通过设备是可控的,甚至可以定量的明确。明确外部参数的理想实验室环境,变量得到了有效控制,再进行有效合理的理想化数学建模,采集明场暗场的相机图像,进行测试与计算,可以得到一些很客观的数字形式的指标。

图 1 EMVA1288

图2 EMVA1288

EMVA1288中,给出了一些性能指标的定义、测量方法与计算。这些指标有:灵敏度、线性度、噪声、信噪比、暗电流、非均匀性等。

详见《EMVA1288-3.1rc》

1.2 实际场景图像质量的评价

我们自然场景是丰富多样的,是复杂多变的,并不能像实验室测试那样的外部参数可控。

关于这种实际场景图像质量的含义包括两个方面:图像的逼真度和图像的可懂度。多年来,人们希望能够找出图像逼真度和可懂度的定量测量方法,但是人们对人类的视觉特性仍没有充分理解,特别是人眼视觉的心理特性还难以找出定量的描述方法。因此,这里的评价还没有完全定量。不过,还是有一些认同度很高的评价方法,包括客观评价方法和主观评价方法。

1.2.1 客观评价方法

传统的图像质量评价方法包括均方差(MSE,mean squared error)和峰值信噪比(PSNR,peak signal to noise rate)。

(1)均方误差法(MSE)首先计算原始图像和失真像象素差值的均方值,然后通过均方值的大小来确定失真图像的失真程度。

其中M、N为图像的长和宽。

(2)PSNR,它是基于通信理论而提出,是最大信号量与噪声强度的比值。由于数字图像都是以离散的数字表示图像的像素,因此采用图像的最大象素值来代替最大信号量。

(3)RMSC(root-mean-square contrast)

1.2.2 主观评价方法

国际上已有一些成熟的主观评价和国际标准,例如 ITU-TRec. P.910规定了多媒体应用的主观评价方法;BT.500-11 规定了电视图像的主观评价方法,就视频质量主观评价过程中的测试序列、人员、距离以及环境做了详细规定。提出了主观质量评分法(MOS Mean Opinion Score)。这是图像质量最具代表性的主观评价方法,它通过对观察者的评价图像质量。

MOS主观质量评分法又可以分为绝对评价和相对评价两种类型。

(1)绝对评价是将图像直接按照视觉感受分级评分,国际上规定的5 级绝对尺度,包括质量尺度和妨碍尺度。

对一般人来讲,多采用质量尺度;

对专业人员来讲,则多采用妨碍尺度。

相对评价是由观察者将一批图像从好到坏进行分类,将它们相互比较得出好坏,并给出相应的评分。

详细内容请查看《ITU Radio-communication Sector, Methodology for the subjective assessment of the quality of television pictures, International Telecommunication Union, BT.500-11 2002.》

2.什么是一个好的红外图像可视化算法效果?

2.1 提前应知道与说明

(1)关于红外图像可视化算法的引入等问题,请阅读我之前的文章《红外图像处理:DDE数字细节增强算法的缘由与效果》。

(2)这里片面一点,只针对图像效果,不考虑计算复杂度等其他算法要素。

(3)图像增强算法的最根本前提:原始图像时有信息的,只是人眼观察不到或者很难观察到的而已。看不见并不代表不存在。

2.2 横向和纵向的两个评价维度

图3 框图

可以看出DDE算法是16bit到8bit 图像的桥梁。

框图很简单,三个元素:输入,“桥梁”,输出。DDE算法是16bit到8bit 图像的桥梁。

我觉得,输出图像要分两个维度去比较:

(1)经过不同算法的输出结果图像之间的横向比较。

(2)输入与输出图像的纵向比较,是否丢细节,是否放大噪声。

2.3 横向比较

横向评价是不同算法的输出结果图像的比较,也分为主观客观。

2.3.1 主观评价

汇总各论文的评价,举例说明:

(a)直接看图的

图4 直接看不同算法图像信息

(b)按照MOS方法论

图5 按照MOS方法论进行打分

2.3.2 客观数值计算

(a)计算PSNR值

图6 计算PSNR值

(b)计算RMSC值

图7 计算RMSC值

(c)计算其他值,如EMEE和AME

The quantitative evaluationis being conducted by two of the standard objective image quality metrics: measure of enhancement by Weberdefinition (EMEE) and measure of enhancement by Michelson definition (AME).

图8 计算AME值和EMEE值

2.4 纵向比较

图9 原图手动AGC调整

图10 原图手动AGC调整

图11 原图手动AGC调整

图12 DDE后的图像

做个总结

说了很多,屡一下思路。

首先是一幅图像的评价,有美学评价和技术评价,只讨论技术评价。

技术评价涉及两个对象,一个是实验室,一个是实际场景。只讨论实际场景,这里又分主客观。客观是数值计算,主观特别强调MOS方法论。

然后是一个红外DDE算法的评价,分横向与纵向。横向里面又分主客观,通过查找整理一些论文来说明。纵向是原图和输出图的对比,引用FLIR对DDE的定义说明文档。

最后,我觉得客观的数值,这种只能在一种程度上表现说明,但不是那么的完备。DDE算法目的是显示,最终端是人眼。实景图像是主观的,还是BT.500-11-MOS方法论靠谱点,值得借鉴到红外DDE算法图像效果评价中。

引用说明

[1] 图4、图7来源于《Display and detail enhancement for high-dynamic-range infrared images》

[2] 图6来源于《A New Approach for Contrast Enhancement of Infrared Images Based on Contrast Limited Adaptive Histogram Equalization》

[3] 图8来源于《Infrared image enhancement using adaptive trilateral contrast enhancement》

[4] 图9、图10、图11、图12 来源于《FLIR technical note, what is DDE》

写作仓促,还望指正。谢谢~

20191211

文章的图像,详细请在我的微信公众号查看:
一莫闲记

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!