logo资料库

基于梯度的结构相似度的图像质量评价方法.pdf

第1页 / 共4页
第2页 / 共4页
第3页 / 共4页
第4页 / 共4页
资料共4页,全文预览结束
2 2 基于梯度的结构相似度的图像质量评价方法 杨春玲  旷开智  陈冠豪  谢胜利 (华南理工大学 电子与信息学院 , 广东 广州 510640) 2 2 3   第 34卷 第 9期 2006年 9月 2 2 2 华 南 理 工 大 学 学 报 ( 自 然 科 学 版 ) Journal of South China University of Technology (Natural Science Edition) Vol. 34 No. 9 Sep tember 2006 565X (2006) 09 0022 04 文章编号 : 1000 摘  要 : 虽然基于结构信息的图像质量评价方法 ———结构相似度 ( SSIM )模型结构简单 、 评价性能优于峰值信噪比 ( PSNR )或均方误差 (MSE)模型 ,但 SSIM 模型不能较好地评价 严重模糊的降质图像.文中提出了一种基于梯度的结构相似度 ( GSSIM )图像质量评价方 法 ,该方法将梯度作为图像的主要结构信息. 实验结果表明 , GSSIM 模型比 SSIM 和 PSNR (MSE)模型更符合人眼视觉系统特性 ,能较好地评价模糊图像的质量. 关键词 : 图像质量 ; 评价 ; 结构相似度 ; 基于梯度的结构相似度 ; 人眼视觉系统 中图分类号 : TN 911 73    文献标识码 : A   图像质量评价方法分为两种 :主观评价方法和 客观评价方法. 人眼视觉系统 ( HVS)是图像处理的 终端 ,所以最合理的图像质量评价方法是主观评价 方法. 然而 ,主观评价需要组织观察者对失真图像进 行评分 ,从而使劳动强度增加 ,费时费力 ,且不能直 接应用于图像处理系统中 ,以便随时改善图像处理 算法. 客观评价方法采用数学模型计算失真图像和 原始图像的相似度 (或失真度 ) ,得到评价结果 ,因 而具有简单 、便于内置于图像处理系统中的优点. 峰 值信噪比 ( PSNR )和均方误差 (MSE)是多年来应用 最广泛的客观评价标准 [ 1 2 ] ,原因在于其计算复杂 度低 ,物理意义清晰. 但在 20世纪 70年代 ,人们就 已发现均方误差不能很好地和视觉质量相吻合 [ 3 ] , 因为它没有充分地考虑人眼的视觉特性 ,这对图像 这种最终信宿为人眼的信号而言是非常不合理的. 近几十年来 ,许多研究者致力于寻找符合人眼 视觉系统特性的数学模型 ,并提出了一些有效的算 法 ,如 D. J. Sakrison的多通道图像感知尺度 [ 4 ] , Lu bin提出的视觉差分图 (VDM )模型 [ 5 ]等. 但这些方 法大多是基于人眼视觉系统的视觉误差理论 ,即图 像的视觉失真是和图像的误差信号的可见性相关  收稿日期 : 2005 11 21 基金项目 : 国家自然科学基金资助项目 (60402015) ;国家 杰出青年自然科学基金资助项目 (60325310)  作者简介 : 杨春玲 ( 1970 视频处理方面的研究. E ) ,女 ,副教授 ,主要从事图像和 mail: eechlyang@scut. edu. cn 的. 虽然视觉误差理论在国际上已被广泛接受 ,但其 发展受到了很大的限制 ,原因在于 : ( 1)人眼视觉系 统的复杂性 ; ( 2)人眼视觉实验都是基于较简单的 图像 ,而实际的自然图像相对要复杂得多 ,因此这些 实验结论对于自然图像的描述往往显得力不从心 ; (3)人眼视觉系统模型相对较复杂 ,作为图像质量 评价标准不实用. 因此 ,这些基于视觉误差理论的图 像和视频质量评价方法并不能取代目前被广泛采用 的最简单的图像质量评价标准 ———均方误差 [ 6 ]. 最近几年 ,人们对人眼视觉系统的研究有了新 的突破 ,W ang等认为人眼视觉系统的主要功能是提 取图像和视频中的结构信息 [ 7 8 ] ,并在文献 [ 8 ]中提 出了结构相似度 ( SSIM )的图像质量评价方法 ,通过 仿真证明了它优于 PSNR 方法. 虽然 SSIM 算法简 单 、评价性能较好 ,但是 , SSIM 算法不能较好地评价 严重模糊图像的质量 [ 9 10 ]. 有鉴于此 ,文中提出了一 种基于梯度的结构相似度 ( GSSIM )的图像质量评价 方法. 1 结构相似度 文献 [ 8 ]中提出的 SSIM 包括亮度 、对比度和结 构 3个方面 ,其模型定义为 SS IM ( x , y) = l ( x , y) c ( x , y) s ( x , y) l ( x , y) = c ( x , y) = 2μxμy + C1 x +μ2 μ2 y + C1 2σxσy + C2 x +σ2 σ2 y + C2 ( 1) ( 2) ( 3) ' 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
9 9 9 9 9 9 2  第 9期 杨春玲 等 : 基于梯度的结构相似度的图像质量评价方法 32 s ( x , y) = σx y + C3 σxσy + C3 (4) g (x, y) = 2 j i Gx ( i, j) Gy ( i, j) +C3 [Gx ( i, j) ]2 + [Gy ( i, j) ]2 +C3 j i j i 式中 : x 和 y分别为原图像块和降质图像块 ; l ( x , y) , c ( x , y) , s ( x , y)分别为 x 和 y的亮度函数 、对比 度函数和结构函数 ;μx 和 μy 分别为 x 和 y的均值 ; σx 和 σy 分别为 x 和 y的标准差 ;σx y为 x 和 y的协 方差 ; C1 , C2 , C3 是为了避免分母为零而设的小常 数 , C1 = ( K1L ) 2 , C2 = ( K2L ) 2 , C3 = C2 /2; K1 , K2 << 1; L 是像素值的动态范围 (若是 8 位灰度图像则 L = 255) . 结构相似度的值越高 ,图像块 x 和 y越相似. 对所有图像块的 SSIM 求均值 , 得到整幅图像 的结构相似度 : M SS IM ( X , Y) = 1 M M j = 1 式中 :M 为图像块的数量. SS IM ( x j, yj ) (5) 2 基于梯度的结构相似度 文献 [ 7 8 ]中的实验结果表明 , SSIM 比 PSNR 或 MSE更符合人眼视觉系统特性. 但对于严重模糊 的降质图像 , SSIM 的评价结果很不合理 [ 7 ]. 另外 ,式 (4)中 σxy的取值范围为 (- ∞, + ∞) ,会造成某些情 况下 SSIM < 0. 而两个图像块的结构相似度为负值 的现象很难解释. 由于人眼对图像的边缘非常敏感 , 而梯度可以 很好地反映出图像中微小的细节反差和纹理特征变 化 ,可以用来评价图像的清晰程度 ,因此文中提出将 梯度作为图像的主要结构信息 , 进而提出基于梯度 的结构相似度的图像质量评价方法.   文中的梯度计算采用 Sobel算子 ,包括垂直边 缘算子 V 和水平边缘算子 H (见图 1) . 图 1 Sobel算子 Fig. 1 Sobel operator   梯度幅值 : Gx ( i, j) = j) x ( i, i + j) x ( i, j (6) 式中 : x ( i, i j) , j) x ( i, j 分别为用水平边缘算子 H 和垂直边缘算子 V 计算得到的梯度分量. 图像块 x 和 y的梯度相似度 g ( x , y)为 ( 7) j)分别为原图像块 x 和降质图 j) , Gy ( i, j)处的梯度幅值. 式中 : Gx ( i, 像块 y在 ( i,   将式 ( 1)中的 s ( x , y)用梯度相似度 g ( x , y)代 替 ,得到基于梯度的结构相似度 : GSS IM ( x, y) = α   [ l ( x , y) ] β [ c ( x, y) ] γ [ g ( x, y) ] ( 8) 式中 :α,β和 γ为常数 , 用于调整各分量的重要程 度. 文中 ,简单地取 α =β =γ = 1. 由式 ( 6) ~ ( 8)可 知 , Gx ( i, j)都是不小于 0的实数 ,因此所 有的 GSSIM ≥0. 整幅图像基于梯度的结构相似度可 由各子图像块的 GSSIM 的均值得到 : j)和 Gy ( i,   M GSS IM ( X , Y) = 1 M M j = 1 3 实验结果及分析 GSS IM ( x j, yi ) ( 9) 用美国 TEXAS大学图像和视频工程实验室提 供的图像质量估计数据库进行仿真实验 , 并从非线 性回归条件下的绝对误差均值 (MAE) 、均方差的平 方根 (RMS)和离散率 (OR ) 3个方面比较了 GSSIM , SSIM 和 PSNR 的性能. 非线性回归函数采用文献 [ 6 ]中的 Logistic函数. MAE和 RMS值越小 ,说明该 客观评价模型越好. OR 表示客观评分对主观评分 的估计值和主观评分一致性的参量 ,其值越小表示 客观评价模型越好. 实验中用到的两个子图像库分 别为不 同 误 码 率 条 件 下 的 JPEG2000 压 缩 图 像 ( Fastfading)库和高斯模糊图像 ( Gblur)库. 每个图 像库中有 145幅不同质量的降质图像及其平均主观 评分差值 (DMOS). DMOS是主观评分均值 (MOS) 和满分 ( 100 )的差值 (DMOS = 100 - MOS) ,因此 , DMOS值越大表示图像质量越差 , DMOS值越小表 示图像质量越好 ,且 DMOS的取值范围为 [ 0, 100 ].   图 2为 PSNR , SSIM 和 GSSIM 模型对 Fastfading 图像评价的 DMOS散点图. 从图 2可知 ,无论是从数 据样本的分散度还是从主客观评分的相关性来分 析 , GSSIM 模型均优于 SSIM 模型 ,而 SSIM 模型优 于 PSNR模型.   表 1为 PSNR , SSIM 和 GSSIM 模型评价 Fastfa ding和 Gblur图像的性能比较. 由表 1 可见 , GSSIM 模型对 Fastfading和 Gblur图像的评价性能均优于 SSIM 模型 ,而 SSIM 模型优于 PSNR模型. © 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
42 华 南 理 工 大 学 学 报 (自 然 科 学 版 ) 第 34卷 图 2   PSNR, SSIM 和 GSSIM 模 型 评 价 Fastfading 图 像 的 DMOS散点图 Fig. 2 Scatter p lots of DMOS for PSNR, SSIM and GSSIM mo dels assessing Fastfading images 表 1 PSNR, SSIM 和 GSSIM 模型评价 Fastfading和 Gblur图 像的性能比较 Table1 Comparison of performance for PSNR, SSIM and GSSIM models assessing Fastfading and Gblure images 评价模型 PSNR SSIM Fastfading图像 Gblur图像 MAE RMS OR / % MAE RMS OR / % 7. 756 1 9. 776 5 4. 830 5. 831 5 7. 530 8 5. 553 4. 101 4 5. 176 1 4. 830 4. 941 3 6. 365 7 6. 210 GSSIM 3. 883 4 4. 904 2 4. 140 4. 711 6 5. 963 7 4. 830   为更直观地比较这 3个客观评价模型 ( PSNR, SSIM 和 GSSIM ) ,从两个图像库中各选一幅降质图 像 ,相应的原图 、主观评分及 GSSIM 和 SSIM 的客观 评分值见图 3. 从图 3 可知 , GSSIM 的评分比 SSIM 更加符合主观评分. GSSIM 对模糊图像能取得更好 的评价效果 ,原因在于 GSSIM以梯度作为图像的主 图 3 仿真实验结果比较 Fig. 3 Comparison of simulation results 要结构信息 ,能更好地反映图像的边缘和纹理变化 情况 ,符合人眼视觉系统对灰度跃变较敏感的性能. 对于严重模糊失真图像 ,其纹理特性已经受到了严 重的破坏 , SSIM 中的结构函数 s ( x , y)不能很好地 反映这种变化 ,而梯度却能如实地反应图像中这种 纹理特征的变化. 实验中还发现 , GSSIM 对非模糊降 质图像质量的评价性能和 SSIM的评价性能差不多. © 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
2  第 9期 杨春玲 等 : 基于梯度的结构相似度的图像质量评价方法 52 4 结论 本文在 SSIM 基础上 ,提出了一种新的图像质 量评价方法 GSSIM. GSSIM 在理论上克服了 SSIM 算 法中出现负值的现象 ;由于利用梯度作为结构信息 , 与人眼视觉系统的高层次感知理论比较符合 ,能较 好地估计模糊图像的质量 ,对其他类型降质图像的 评价性能和 SSIM 差不多. 仿真实验也证明了 GSSIM 模型优于 SSIM 和 PSNR模型. GSSIM 模型中只用到 了梯度的幅值 ,而梯度方向对图像质量的评价结果 也有影响 ,因此如何更全面地利用梯度以更好地评 价图像质量是下一步的研究目标. 参考文献 : [ 1 ]  许志良 ,谢胜利. 一种基于 MRF的自适应块效应去除 算法 [ J ]. 华南理工大学学报 : 自然科学版 , 2005, 33 (7) : 15 Xu Zhi li. An adap tive deblocking algo rithm based on MRF [ J ]. Journal of South China Univer sity of Technology: Natural Science Edition, 2005, 33 (7) : 15 19. liang, Xie Sheng 19. [ 2 ]  梁亚玲 ,杨春玲 ,余英林 ,等. 基于人眼视觉特性的任 意形状 RO I编码 [ J ]. 华南理工大学学报 :自然科学 版 , 2005, 33 (3) : 44 lin, et al. A rbi L iang Ya trary shaped RO I image coding based on HVS [ J ]. Jour nal of South China University of Technology: Natural Sci ence Edition, 2005, 33 (3) : 44 ling, Yang Chun ling, Yu Ying 49. 49. [ 3 ]  Mannos J L, Sakrison D J. The effects of a visual fidelity IEEE Trans on criterion on the encoding of images [ J ]. Information Theory, 1974, 20 (4) : 525 536. [ 4 ]  Sakrison D J. On the role of the observer and a distortion IEEE Trans on COM , measure image transm ission [ J ]. 1977, 25 (11) : 1 251 1 267. [ 5 ]  Lubin J. A visual discrim ination model for imaging system design and evaluation [M ] ∥Pelied E. V ision Models for Target Detection and Recognition. New York: World Sci entific Publishing Co Pte L td, 1995. [ 6 ]  VQEG. Final report from the video quality experts group on the validation of objective models of video quality assess 05). http: ∥www. vqeg. org/. ment [ EB /OL ]. (2000 03 [ 7 ]  W ang Zhou, Bovik A C, Lu L i gang. W hy is image quality assessment so difficult? [ C ] ∥Proc of IEEE Int Conf on Acoustics, Speech, and Signal Processing.O rlando: [ s. n. ], 2002: IV 3 316. 3 313 IV [ 8 ]  W ang Zhou, Bovik A C, Sheikh H R, et al. Image quality assessment: from error visibility to structural sim ilarity [ J ]. IEEE Trans on Image Processing, 2004, 13 (4) : 600 612. [ 9 ]   Pan Xiao ling, Xie Sheng zhou, Yang Chun li. An im p roved structural sim ilarity for image quality assessment [ C ] ∥ Proc of SP IE. W uhan: [ s. n. ] , 2005: 60441 I 1 6044 l I 9. [ 10 ]  Cadik M , Slavik P. Evaluation of two p rincipal app roa ches to objective image quality assessment [ C ] ∥Proc of the 8 th International Conference on Information V isuali sation. London: IEEE Computer Society, 2004: 513 518. Gradient Based Structural Sim ilarity for Image Qua lity Assessment Yang Chun ling Kuang Ka i zh i Chen Guan hao X ie S heng li ( School of Electronic and Information Engineering, South China Univ. of Tech. , Guangzhou 510640, Guangdong, China) this paper p roposes a gradient there still remain some deficiencies in assessing badly blurred images. Abstract: A lthough the SSIM ( Structural Sim ilarity) model, an assessment model of image quality based on the structural information, has been p roved to be better than the PSNR ( Peak Signal to Noise Ratio) or the MSE (Mean Square Error) model, In order to solve this p rob based structural sim ilarity (GSSIM) model that takes the gradient as the main struc lem , tural information of an image. Experimental results show that the p roposed GSSIM model is more consistent with human visual system and can assess the quality of blurred images more p recisely than the SSIM and PSNR (MSE) models. Key words: system based structural sim ilarity; human visual structural sim ilarity; gradient image quality; assessment; © 1994-2010 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net 责任编辑 : 许花桃
分享到:
收藏