写在前面
最近在不断地调研一些新的红外图像增强算法,优化与仿真实现了一些不同算法框架下的图像效果,在各种算法框架的取舍中,陷入了困惑。
归根到底,那就是对一个看似简单实却难以说清楚的基础问题,没有理解透彻,因此我决定就这问题学习并总结一番。
这个问题就是:什么是一张好图像。
明确了这个问题,进而才能理解:什么是一个好的红外图像可视化算法。
冈萨雷斯在其《数字图像处理》第二章最开始,引用这么一段话。
要想成功,就必须弄清基础问题。
—亚里士多德
对本质上的东西搞明白了,有了一定的知识框架,做事情也就条理清晰,章法有度了。
正文中也就这两个问题加以展开。
问题1:什么是一张好图像?
问题2:什么是一个好的红外图像可视化算法?
进入正文
1.什么是一张好图像?
这是一个看似很简单的问题,有人说不就是图像好看不好看呗。其实这个就是图像的评价。图像的评价有包含两方面:美学评价和技术评价。前者是艺术家的事情,这里不讨论。对于我们做相机的工程师来说,更偏向了后者。
关于技术评价,个人觉得这里面又包含两方面,一种是基于实验室环境的相机性能评价,典型的就是:EMVA1288标准;另一种是对于实际场景图像质量的评价。
1.1 基于实验室环境的相机性能评价
最为典型的是相机界大名鼎鼎的EMVA1288标准,它是由欧洲机器视觉协会(EMVA)建立,主要的图像传感器与相机生产商均参与其中。它是基于实验室环境下,我们对光照,色温等等参数,通过设备是可控的,甚至可以定量的明确。明确外部参数的理想实验室环境,变量得到了有效控制,再进行有效合理的理想化数学建模,采集明场暗场的相机图像,进行测试与计算,可以得到一些很客观的数字形式的指标。
图 1 EMVA1288
图2 EMVA1288
EMVA1288中,给出了一些性能指标的定义、测量方法与计算。这些指标有:灵敏度、线性度、噪声、信噪比、暗电流、非均匀性等。
详见《EMVA1288-3.1rc》
1.2 实际场景图像质量的评价
我们自然场景是丰富多样的,是复杂多变的,并不能像实验室测试那样的外部参数可控。
关于这种实际场景图像质量的含义包括两个方面:图像的逼真度和图像的可懂度。多年来,人们希望能够找出图像逼真度和可懂度的定量测量方法,但是人们对人类的视觉特性仍没有充分理解,特别是人眼视觉的心理特性还难以找出定量的描述方法。因此,这里的评价还没有完全定量。不过,还是有一些认同度很高的评价方法,包括客观评价方法和主观评价方法。
1.2.1 客观评价方法
传统的图像质量评价方法包括均方差(MSE,mean squared error)和峰值信噪比(PSNR,peak signal to noise rate)。
(1)均方误差法(MSE)首先计算原始图像和失真像象素差值的均方值,然后通过均方值的大小来确定失真图像的失真程度。
其中M、N为图像的长和宽。
(2)PSNR,它是基于通信理论而提出,是最大信号量与噪声强度的比值。由于数字图像都是以离散的数字表示图像的像素,因此采用图像的最大象素值来代替最大信号量。
(3)RMSC(root-mean-square contrast)
1.2.2 主观评价方法
国际上已有一些成熟的主观评价和国际标准,例如 ITU-TRec. P.910规定了多媒体应用的主观评价方法;BT.500-11 规定了电视图像的主观评价方法,就视频质量主观评价过程中的测试序列、人员、距离以及环境做了详细规定。提出了主观质量评分法(MOS Mean Opinion Score)。这是图像质量最具代表性的主观评价方法,它通过对观察者的评价图像质量。
MOS主观质量评分法又可以分为绝对评价和相对评价两种类型。
(1)绝对评价是将图像直接按照视觉感受分级评分,国际上规定的5 级绝对尺度,包括质量尺度和妨碍尺度。
对一般人来讲,多采用质量尺度;
对专业人员来讲,则多采用妨碍尺度。
相对评价是由观察者将一批图像从好到坏进行分类,将它们相互比较得出好坏,并给出相应的评分。
详细内容请查看《ITU Radio-communication Sector, Methodology for the subjective assessment of the quality of television pictures, International Telecommunication Union, BT.500-11 2002.》
2.什么是一个好的红外图像可视化算法效果?
2.1 提前应知道与说明
(1)关于红外图像可视化算法的引入等问题,请阅读我之前的文章《红外图像处理:DDE数字细节增强算法的缘由与效果》。
(2)这里片面一点,只针对图像效果,不考虑计算复杂度等其他算法要素。
(3)图像增强算法的最根本前提:原始图像时有信息的,只是人眼观察不到或者很难观察到的而已。看不见并不代表不存在。
2.2 横向和纵向的两个评价维度
图3 框图
可以看出DDE算法是16bit到8bit 图像的桥梁。
框图很简单,三个元素:输入,“桥梁”,输出。DDE算法是16bit到8bit 图像的桥梁。
我觉得,输出图像要分两个维度去比较:
(1)经过不同算法的输出结果图像之间的横向比较。
(2)输入与输出图像的纵向比较,是否丢细节,是否放大噪声。
2.3 横向比较
横向评价是不同算法的输出结果图像的比较,也分为主观客观。
2.3.1 主观评价
汇总各论文的评价,举例说明:
(a)直接看图的
图4 直接看不同算法图像信息
(b)按照MOS方法论
图5 按照MOS方法论进行打分
2.3.2 客观数值计算
(a)计算PSNR值
图6 计算PSNR值
(b)计算RMSC值
图7 计算RMSC值
(c)计算其他值,如EMEE和AME
The quantitative evaluationis being conducted by two of the standard objective image quality metrics: measure of enhancement by Weberdefinition (EMEE) and measure of enhancement by Michelson definition (AME).
图8 计算AME值和EMEE值
2.4 纵向比较
图9 原图手动AGC调整
图10 原图手动AGC调整
图11 原图手动AGC调整
图12 DDE后的图像
做个总结
说了很多,屡一下思路。
首先是一幅图像的评价,有美学评价和技术评价,只讨论技术评价。
技术评价涉及两个对象,一个是实验室,一个是实际场景。只讨论实际场景,这里又分主客观。客观是数值计算,主观特别强调MOS方法论。
然后是一个红外DDE算法的评价,分横向与纵向。横向里面又分主客观,通过查找整理一些论文来说明。纵向是原图和输出图的对比,引用FLIR对DDE的定义说明文档。
最后,我觉得客观的数值,这种只能在一种程度上表现说明,但不是那么的完备。DDE算法目的是显示,最终端是人眼。实景图像是主观的,还是BT.500-11-MOS方法论靠谱点,值得借鉴到红外DDE算法图像效果评价中。
引用说明
[1] 图4、图7来源于《Display and detail enhancement for high-dynamic-range infrared images》
[2] 图6来源于《A New Approach for Contrast Enhancement of Infrared Images Based on Contrast Limited Adaptive Histogram Equalization》
[3] 图8来源于《Infrared image enhancement using adaptive trilateral contrast enhancement》
[4] 图9、图10、图11、图12 来源于《FLIR technical note, what is DDE》
写作仓促,还望指正。谢谢~
20191211
文章的图像,详细请在我的微信公众号查看:
一莫闲记
来源:CSDN
作者:Alex_malimo
链接:https://blog.csdn.net/hahahahhahha/article/details/103497155