logo资料库

论文研究-基于自适应非局部均值滤波的图像去块算法 .pdf

第1页 / 共8页
第2页 / 共8页
第3页 / 共8页
第4页 / 共8页
第5页 / 共8页
第6页 / 共8页
第7页 / 共8页
第8页 / 共8页
资料共8页,全文预览结束
5 10 15 20 25 30 35 40 中国科技论文在线 http://www.paper.edu.cn 基于自适应非局部均值滤波的图像去块 算法# 王慈,刘书* (上海交通大学电子信息与电气工程学院,上海 200240) 摘要:JPEG 和 MPEG 等压缩标准导致的块效应是图像降质的主要表现。以往研究提出了各 种降低量化噪声的方法,但都基于噪声大小已知的假设。这种假设的不合理性在于绝大多数 我们获得的降质图像是不包含噪声信息的,这使得现有的去块算法的有效性大打折扣。本文 利用机器学习来确定和优化参数,使得非局部均值滤波可以做到自适应处理,最后通过实验 证明本文提出的算法优于同类的其它算法。 关键词:信号与信息处理;图像去噪;机械学习 中图分类号:TP391 Image Deblocking with Adaptive Non-local Means Filter Wang Ci, Liu Shu (Shanghai Jiaotong University, ShangHai 200240) Abstract: Common image compression standards such as JPEG and MPEG lead to blocking artifacts which causes serious image degradation. Assuming that noise magnitude is given, many researchers have proposed deblocking algorithms by reducing quantization noise. However, in most applications, the user only gets inferior image copy, without any side information about noise distribution, therefore the efficiency of existing denoise algorithms is significantly reduced. In this paper, we exploit nonlocal means filter for deblocking and optimize its parameters adaptively by machine learning. Finally, we prove with experimental results that the proposed algorithm constantly outperforms the peer ones on all kinds of images. Keywords: Signal Processing; image denoise; machine learning 0 引言 为了便于传输和存储,视频和图像通常被压缩成 JPEG, MPEG-x,H.26x 等标准格式。 这些有损压缩标准降低了图像信息量,造成图像的细节信息的丢失,从而产生块效应。随着 编码码率的降低,量化变得粗糙,在块的边界会出现不连续,形成重建图像的明显缺陷,称 为块效应。 为了降低这种噪声,学者们提出了大量的后处理算法。这些算法可以分成两种, 迭代法和非迭代法。基于凸集投影(POCS)的理论,迭代算法将压缩后的图像投影到量化 约束集和先验约束集[1][2],这类算法带来极高的计算成本,很难做到实时处理。因此,有学 者提出非迭代法,主要用于在空间域和其它变换域处理图像,这类算法因其较低的运算成本 被广泛应用。 一般来说,变换域算法的执行速度要比空间域快得多,但空间域运算因其良好的效果而 被广泛应用。一种原始的空间域去块方法是在块边界应用高斯滤波[3],但这种做法会使得图像 边缘模糊。Minami 等[4]根据最小均方差(MSDS)标准做去块,而没有考虑到块内信息的丢 失。Sun 等[5]和 Averbuch 等[6]把块效应视为加性高斯噪声,并以此为先验信息进行滤波。然 而,实际的量化噪声在空间上既不满足均匀分布,也不满足高斯分布,并且压缩程度越大这 一问题就越明显。因此上述方法去块的效果并不稳定。 上述方法从不同的角度实现在去块的同时保边的目的,但是相对于如非局部均值滤波来 基金项目:教育部博士点新教师基金(20090073120030);自然科学基金 (60902072) 作者简介:王慈,(1976-),男,副教授,图像处理。E-mail: wangci@sjtu.edu.cn - 1 -
45 50 55 60 65 70 中国科技论文在线 http://www.paper.edu.cn 说,实现架构的过于复杂。非局部均值滤波法是一种能够保留边界的平滑器,考虑到其逻辑 的简单性,它非常易于在特定用途集成电路(ASIC)上实现,但它的控制变量选择仍然是 一个未解的问题[7]。在文献[8]中,Nath 基于量化参数(Quantity parameter, QP)根据经验推 断控制变量进而改善去块效果。然而,滤波器的选择不仅与量化参数相关而且与图像内容相 关,所以 Nath 的实验结果也并非最优。最近,Milanfar 等[9]提出了一种基于块的维纳滤波方 法,该方法利用图像子块的信息冗余实现降噪。此方法的效果优于同种类似方法,但是其运 算复杂度极高。 本文首先选用非局部均值滤波,为了弥补其控制变量选择的缺陷,我们利用机器学习的 方法,通过训练,得到一个简单并快速的线性模型用以调节非局部均值滤波的控制参数,最 终实现自适应去块滤波。实验结果表明这种做法优于其他现存的去块方法。 1 非局部均值滤波 令 非局部均值滤波最早是由 Buades 提出的[10],它是一种在平滑的同时保留边信息的滤波 方法。其原理是用边块的加权平均值来修改当前块的像素值,滤波权重由边块和当前块的相 似度来决定。 )(i f 表示当前块第 i 个像素点的观察值, iN 表示以点 i 为中心的正方形区域,S 表 示方形搜索窗,非均值局域滤波器在 S 范围内搜索相似块。这样,可以得到滤波后当前点 i 的像素值 )(~ f i (1) Nv ) ( i − 2 h j )( − e 2) j Nv ( f ∈∑= Sj 1 iZ )( 其中 iNv ( ) 为 iN 的向量化表示, iZ )( = Nv ( ) i 2) j Nv ( − 2 h ∑ ∈ Sj − e 为归一化因子, h 被用来控 制滤波程度的标量参数. (1)式中搜索窗的尺寸 S 和滤波程度 h 都可以是我们参数优化的目标。增大 S 可以加强 滤波的效果,然而,当 S 超过一定阈值(例如 5x5 个像素)后,它的边界增益不断减小而运 算复杂度却呈指数倍上涨。所以 S 的选择取决于实际应用中运算能力的限制。参数 h 在很大 程度上决定了滤波降噪的效果,它是本文讨论的重点。 (a) (b) (c) 图 1 不同 h 下的去块效果. (a) h=30, (b) h=90, (c) h=180. Fig.1 Deblocking with different hs, (a) h=30, (b) h=90, (c) h=180. 为了证明上述结论,我们首先按照质量得分 QS(Quality Score)为 10 的 jpeg 标准压缩 “Lena”,使其产生块效应,再用不同参数 h(h=30, 60, 90, 120, 150, 180)的非局部均值滤波 - 2 -
中国科技论文在线 http://www.paper.edu.cn 75 做去块滤波。可以看出,当 h=30 时,去块效果并不明显;然而当 h=180 时,图像模糊程度 大幅增加,从而丢失了很多细节信息,Lena 的帽子处尤其明显。即使 h 被赋值为适中的常 数(如 h=90),我们仍然不能得到满意的去块的结果,如图 1(b)所示,很多平滑区域的 量化噪声没有完全滤掉,而细节部分又被模糊掉了。 80 85 90 图 2. 去块效果 v.s. 滤波参数. 图片均为同样的 QS 压缩 Fig 2. Deblocking performances v.s. filter parameters. Images are compressed with the same QS. 为了不失一般性,我们对 Barbara 和 Baboon 做了用同样的 QS 做了相同的实验。在滤波 时,我们给定不同的 h,并绘制出峰值信噪比(PSNR)随 h 变化的曲线,如图 2 所示。从 图 中 可 以 看 出 , 对 这 些 图 像 , 它 们 对 应 的 最 佳 滤 波 器 参 数 h 分 别 是 h 体的图像内容相关。 2 块效应衡量方法 。这说明滤波参数选择不仅取决于量化参数,还与具 ,150 ,80 h = 100 = Lena h Baboon = Babara 随着量化尺度的增大,块效应也愈加明显。我们可以把当前块和其周围的 8 个相临块对 比从而估计其量化噪声。文献[11]中,Queiroz 等假定 DCT 参数符合拉普拉斯概率分布,由 DCT 子带估计量化噪声。以外,我们可以通过计算当前块的 MSDS 来从空间域判断量化噪 声[12]。在此,我们通过计算 MSDS 和信息能量残差的方法来评估压缩图像的量化噪声。 - 3 -
中国科技论文在线 http://www.paper.edu.cn (i,j+1) U L (i,j) R (i-1,j) MSDS (i+1,j) D (i,j+1) 图.3 MSDS计算示意图 Fig.3 MSDS calculation. 95 2.1 最小均方差(MSDS) 文献[13]中,Yang 等推导出块效应的统计规律,并发现量化噪声主要集中分布在图像块 的边界。文献[14]中,Robertson 等证实了量化误差并非是空间无关的,分布在边界和角的噪 声远远大于块的中间区域噪声。因此本文利用块边界附近的像素评估量化噪声大小。 100 MSDS 定义为当前块与相邻块交界处的像素灰度值梯度,由于它很好的衡量了量化噪声 的影响,因此广泛应用于各种去块算法中。令(i,j)表示当前块的位置坐标, L,R, U, D 分别 表示当前块的上,下,左,右方向的相邻块,我们定义块(i,j)的 MSDS 如下 MSDS (2) MSDS MSDS MSDS MSDS + + + = jiR ,, jiU ,, ji , jiL ,, jiD ,, 105 其中,MSDSL,i, j 定义如(3)式,其它三个方向依次类推。 MSDS = jiL ,, N k = 1∑ − ⎡ ⎢⎣ 2 N×N 为块尺寸, 1 0 ( 3 x ji , k )0,( − x ji , k )1,( ) − ( 3 1 2 x ji , 1 − Nk ,( )1 −− x ji , 1 − Nk ,( − )2 ) 2 ⎤ ⎥⎦ (3) nmx ji (, ), 为坐标为(m,n)的像素灰度值, (m,n) 为块内像素点相对 110 115 于(i,j)的位置。 2.2 块内信息能量残差 虽然 MSDS 对块效应是一个很好的评估,但将其用在参数选择上它尚且不足,原因是 MSDS 的值与图像质量并非是成正比的。如果仅仅依据 MSDS,势必会造成对图像的过度滤 波。 统计意义上来说,平滑区域的块效应比细节多的区域的块效应要明显得多,因此我们引 2 ( ji , ||) 入一个量来区分不同的图像内容,它可以表示成 BH=Δ ij || (4) 其中(i,j)表示块 ijB 的下标,H 表示高频滤波, 2 表示二阶范数。在本文中,高频滤波 i,Δ 的做法是去掉当前块的直流分量。当图像块没有细节信息,即像素点灰度完全相同时, j = 0,随着图像内容细节部分的增多, j i,Δ 也不断变大。 - 4 -
中国科技论文在线 http://www.paper.edu.cn 因此,当前块的块效应 jiT , 可以写成 MSDS , ji 和 i,Δ 的函数。 j 120 3 自适应非局部均值滤波 块效应 jiT , 直接决定了滤波的程度,对于非局部均值滤波器来说,即决定了 h 的取值。 通过上一部分的讨论,我们得到对于某一个图像块来说,最佳 h 可以写成 i,Δ 和 j 的函数,然而它们之间的关系为隐函数,不能解析求取。本文使用机器学习的方法来训练出 h 与 和 i,Δ 的关系。 MSDS , ji MSDS , ji j 125 3.1 训练数据的选择 本文中,训练集由数据库[15]中的标准测试图像组成,其覆盖了图像的各类特征,并且 i,Δ 和输出 jih , 。 具有代表性。对于任意一个图像块(通常是 8x8)来说,存在输入 MSDS , ji 、 j h i j , 在训练数据中我们的 jih , 由(5)式得到 arg min(|| ( ) || ) 2 = 2 其中, i, jB original B ,_ i j original B B h D i j i j , , i jB h 表示当前块, , ( ) D − _ (5) 表示用参数为 h 的非局部均值滤波方法滤波后的块, 表示原图(没有块效应的图)中对应的(i,j)块。这样通过遍历,可以得到滤波 后与原图最接近的 h 值。 3.2 训练方法 在众多机器学习方法中,我们选择了效率较高的线性回归[16]。回归模型为 其中 H 为 n×1 的列向量,X 包含了 cβ= + H X MSDS , ji 和 j i,Δ 两个特征,为 n×2 的矩阵,n 代表数据量。因此相对应的β为 12× 的行向量,其表达式如上式所示 130 135 140 因此在滤波过程中,我们算出 145 的值 4 仿真结果 1 − T T = X X ) 和 ˆ X H ( β MSDS , i,Δ 两个特征以后,便可以由上式估算出 h ji ˆ ˆ h Xβ= j 150 在实验中,我们首先依照 JPEG 标准将数据库中的原始图像压缩成不同质量评分(QS) 的图,QS 从 10 遍历到 30 作为训练集,其中每一个图像块作为训练数据。一般来说,当 QS>30 时,肉眼已经看不出明显的块效应,而 QS<10 在现实生活中几乎没有应用。因此在本文中, 我们遍历 10
160 165 170 175 中国科技论文在线 http://www.paper.edu.cn 本文将 PSNR 作为主观评估标准。我们选取了尺寸为 512×512 的 Lena 等图作为原始 图,其中,Lena 和 Pepper 是整体较平坦的图,Barbara,Baboon, Bridge 和 Man 包含了足够 的纹理,而 Jet 是各方面比较适中的一张图。我们分别用 QS1=15, QS2=20, QS3=25, QS4=30 的质量评分对上图原始图进行压缩,得到的图像序列作为测试数据,搜索窗选取为 7×7 的 正方形区域。 PSNR 对比结果[17][9]如表 I 所示。文献[17]中,Zhai 等利用形状自适应的滤波器降低量化 噪声,并且通过参数归一化和量化限制使得去块程度保持在一个合理的范围内。近期, Milanfar 等[14]提出一种基于块的维纳滤波方法,该方法利用了图形子块的冗余信息实现降 噪。实验对照组选择的原因是 Zhai 算法的自适应性,而 Milanfar 的算法是最新提出的,且 效果最好。文献[17][9]的源代码均在网络上公开。 表 I. 不同去块方法的 PSNR 对比 Table I.PSNR comparison of different algorithms Method Image Quality Zhai [17] Milanfa[9] Linear Regression Linear Regression (QP is given) (Blind) 32.4 33.3 34.0 34.5 27.5 28.9 30.0 30.9 32.0 32.7 33.1 33.4 32.4 33.5 34.3 35.0 24.8 25.6 26.2 26.8 27.0 27.8 28.4 28.9 29.9 30.7 31.3 31.9 32.5 33.5 34.2 34.7 27.3 28.8 30.1 31.2 32.1 32.8 33.2 33.5 32.4 33.5 34.3 34.5 24.8 25.6 26.2 26.8 27.0 27.8 28.4 28.9 29.9 30.8 31.4 31.9 Lena Babara Pepper Jet Baboon Bridge Man QS1 QS2 QS3 QS4 QS1 QS2 QS3 QS4 QS1 QS2 QS3 QS4 QS1 QS2 QS3 QS4 QS1 QS2 QS3 QS4 QS1 QS2 QS3 QS4 QS1 QS2 QS3 QS4 32.2 33.1 33.8 34.3 27.0 28.1 29.2 30.0 32.0 32.6 33.0 33.3 32.1 33.2 34.0 34.7 24.7 25.4 26.0 26.6 26.9 27.7 28.3 28.8 29.8 30.6 31.2 31.7 31.9 32.9 33.9 34.5 27.1 28.4 29.5 30.4 31.7 32.4 32.9 33.4 31.9 33.2 34.1 34.8 25.0 25.8 26.4 26.9 27.3 28.1 28.7 29.2 29.9 30.9 31.5 32.1 实验结果表明,无论是在 QS 已知还是未知的情况下,其在各类图像上的应用均可得到 较好的效果,且本文提出的算法在所有测试序列中均好于 Zhai 的方法。对于纹理较丰富的 图,如 Barbara, 本文的算法对 PSNR 有大幅的提升,约 0.8dB,同时对于纹理较少的图,如 Pepper,Lena,仍有 0.2-0.3dB 的提升。对于较平整的图像,本文算法的 PSNR 比 Milanfar 高出 0.1-0.2dB 左右,原因是,其充分利用了周边相似块的信息。相反,由于 Milanfar 的算 法牺牲了运算复杂度,在全局范围搜索相似块,因此在全图范围存在相似细节的图像中,如 Baboon 的绒毛,Bridge 的树叶倒影,Milanfar 的效果较本文算法高出 0.2dB 左右。 - 6 -
中国科技论文在线 http://www.paper.edu.cn 180 185 (a) (b) (c) 图 3 Barbara 部分. (a) Zhai 算法效果图, (b) Milanfa 算法效果图, (c) 本文算法效果图. Fig 3. Barbara part. (a) Zhai algorithm, (b) Milanfa algorithm, (c) Proposed algorithm. 作为主观评价素材,Barbara 首先被压缩为质量评分为 20 的图像,图 3 为三种不同算法 恢复后的效果图对比。可以看出,本文提出的算法不仅有效的抑制了量化噪声,并且未造成 图像的模糊和失真。图 3 显示,Zhai 的算法不仅造成了围巾条纹的不连续性,并且靠近边 缘部分的噪声几乎没有滤掉,如图 3 中标记的部分。在同类算法中,Milanfar 在去噪中表现 的最为突出,尤其是图 3 的右下角,Barbara 的膝部,完全去掉了量化噪声。然而其不合适 的门限选择造成的结果就是过度滤波,使得很多纹理部分看起来不够自然,甚至丢失。 190 195 200 205 (a) (b) (c) 图 4 Lena 部分. (a) Zhai 算法效果图, (b) Milanfar 算法效果图, (c)本文算法效果图. Fig 4. Lena part. (a) Zhai algorithm, (b) Milanfa algorithm, (c) Proposed algorithm. 图 4 的 Lena 被严重压缩。Zhai 的算法在 Lena 嘴巴和鼻子的部分,仍残留着很明显的块 效应。Minanfar 的算法虽然在这些部分恢复的很好,但其完全丢失了头发部分的细节信息, 并且在 Lena 的脸颊部分,仍能看出明显的块效应。相比之下,本文的算法对上述两种方法 做了很合理的折中。 最后,我们对比了三种算法的执行速度。系统配置为 i5-2430M CPU @ 2.4GHz ,1G memory。Zhai 的算法执行速度最快,在 Matlab 平台上完成 7 幅 512×512 测试图像的处理 只需 20s。在程序优化后,本文提出的算法需要 24s,略差于 Zhai 的算法。而 Milanfar 的算 法需要巨大的缓存来存储整帧图片以搜索相似块,因此其执行的最慢,即使在 C 语言加速 情况下仍需 120s 来完成同样的工作。 基于上述分析,我们提出的算法是性能和执行效率上一个很好的平衡,适合投入到实际 应用中去。 5 总结 本文首先引入非局部均值滤波算法用于去块,接下来,我们提出衡量块效应的参数,并 - 7 -
中国科技论文在线 http://www.paper.edu.cn 且通过机器学习的方法得到其与非局部均值滤波的参数的关系,从而使得非局部均值滤波法 可以自适应的调节而不需要人为干涉,实验结果表明本文提出的方法优于其他最新提出的算 法。 [参考文献] (References) [1] Lee S K, Edge Statistics-based Image Scale Ratio and Noise Strength Estimation in DCT-coded Images [J] IEEE Trans Consumer Electronics, 2009, 55(4): 2139-2144, . [2] Jang I H , Kim N C and So H J, Iterative blocking artifact reduction using a minimum mean square error filters in wavelet domain [J], Signal Processing 2003, 83(12):2607-2619 . [3] Reeve H C, Lim J S, Reduction of blocking artifacts in image coding [J], Opt. Eng.,1984 vol. 23, no. 1:34-37, . [4] Minami S, Zakhor A, An optimization approach for removing blocking artifacts in transform coding[J] IEEE Transactions on Circuit and Systems for Video Technology,1995, vol. 5, no. 2:74-82. [5] Sun D and Cham W K , Postprocessing of low bitrate block DCT coded images based on a fields of experts prior[J] IEEE Trans. Image Process,2007. vol. 16, no. 11: 2743-2751. [6] Averbuch A Z , Schclar A, Donoho D L, Deblocking of block transform compressed images using weighted sums of symmetrically aligned pixels[J] IEEE Transactions on Image Processing, 2005 vol. 14, no.2:200-212. [7] Zhang M, Gunturk B K , Multiresolution bilateral filtering for image denoising[J] IEEE Transactions on Image Processing, 2008, vol. 17, no. 12:2324-2333. [8] Nath V K , Hazarika D, Mahanta A, Blocking artifacts reduction using adaptive bilateral filtering [C] 2010 International Conference on Signal Processing and Communications, July 2010:1-5. [9] Chatterjee P, Milafar P, Patch-based near-optimal image denoising[J] IEEE Transactions on Image Processing,2012, vol. 21, no. 4:1635-1649. [10] Buades A, Coll B, and Morel J M , A non-local algorithm for image denoising [C] in Proc. IEEE Conf. on Comp. Vis. and Pattern Recog., 2005: 60-65. [11] Queiroz R L D , Processing JPEG-compressed images and documents [J] IEEE Trans. Image Processing, 1998, vol. 7:1661-1672. [12] Minami S and Zakhor A, An optimization approach for removing blocking effects in transform coding[J] IEEE Trans. Circuits Syst. Video Technol.1995, vol. 5:74-82. [13] Yang J, Choi H, and Kim T. Noise estimation for blocking artifacts reduction in DCT coded images [J]. IEEE Trans.Circuits and Systems for Video Technology, . 2000, 10(7):1116-1120. [14] http://www.petitcolas.net/fabien/watermarking/image_database/ [15] Robertson M A and Stevenson R L, DCT quantization noise in compressed images [C], Int. Conf. Image Process.,2001, vol. 1:185 - 188. [16] Chatterjee S and Hadi A S. Influential Observations, High Leverage Points, and Outliers in Linear Regression [B], Statistical Science. 1986, Vol. 1:379-416. [17] Zhai G, Zhang W, Yang X, Lin W and Xu Y, Efficient deblocking with coefficient regularization, shap-adaptive filtering, and quantization constraint [J] IEEE Trans. Multimedia,2008, Vol. 10, Issue 5:735 -745. 210 215 220 225 230 235 240 245 - 8 -
分享到:
收藏