logo资料库

基于小波变换的语音信号去噪.pdf

第1页 / 共4页
第2页 / 共4页
第3页 / 共4页
第4页 / 共4页
资料共4页,全文预览结束
2 Ξ 第 15 卷 第 2 期 2002 年 6 月 盐城工学院学报 Journal of Yancheng Institute of Technology Vol. 15 No. 2 Jun. 2002 基于小波变换的语音信号去噪 李蕴华 (南通工学院 信息工程系 ,江苏 南通  226007) 摘  要 :讨论了离散小波变换在语音去噪中的应用 。根据语音中浊音段和清音段的特点 ,采 用了不同的阈值方案 ,可以保证在失真较小的前提下 ,获得更好的去噪效果 。 关键词 :小波变换 ; 语音去噪 ; 阈值 中图分类号 :TN850. 5    文献标识码 :A    文章编号 :1671 - 5322 (2002) 02 - 0032 - 04   语音信号的去噪是语音处理的一个重要课 题 。当噪声与语音的频谱相似时 ,传统的单纯时 域滤波或频域滤波往往无法达到很好的效果 。离 散小波变换是一种时 频分析法 ,在时频两域都能 表征信号的局部特性 。利用小波变换实现信号的 去噪 ,具有较好的效果 。 在本文中 ,笔者将语音信号划分成浊音和清 音两部分 ,根据它们各自的特点 ,在采用小波变换 进行去噪时 ,选择了不同的阈值方案进行了性能 测试 。 1  离散小波变换理论 有限序列 s ( n) 的离散小波变换 (DWT) 定义 为 : DWT( s , 2 j , k2 j ) = Dj , k = ∑ n ∈Z s ( n) hj 1 ( n - 2 j k) , s ( n) hj 0 ( n - 2 j k) Cj , k = ∑ n ∈Z ( j , k , n ∈Z) 反变换 IDWT 定义为 : s ( n) = ∑ Dj , k gj 1 ( n - 2 j k) + J ∑ n ∈Z j = 1 0 ( n - 2 j k) Cj , k gj ∑ n ∈Z 式中 h0 ( n) 和 g0 ( n) 分别被称为尺度序列 和对偶尺度序列 , h1 ( n) 和 g1 ( n) 分别被称为小 波序列和对偶小波序列。低通滤波器 h0 及带通 滤波器 h1 形成了一对镜像滤波器组 h1 ( n) = ( - 1) 1 - n h0 (1 - n) 。Cj , k 和 Dj , k 分别被称为 2 - j 分 辨率下的离散逼近信号 (低频系数) 和离散细节信 号 (高频系数) 。 Dj , k和 Cj , k 可由 Mallat 塔式算法算出 , 运算过程 为 : 输入 : C0 ,n (输入序列 s ( n) ) , J (分解层次) 运算过程 :for j = 1 to J  { Dj , k = ∑ n ∈Z  Cj , k = ∑ n ∈Z h1 ( n - 2 k) Cj - 1 , n ; h0 ( n - 2 k) Cj - 1 , n ;  } 输出 : Cj , k , Dj , k 。( Cj , k , Dj , k 分别为第 j 个分解层 次上第 k 个点的逼近信号和细节信号) 。 通过滤波器 h1 和 h0 ,将信号分解成低频空 间 C1 和高频空间 D1 ,然后每次只对低频空间进 一步分解 ,对每层的高频系数不再继续分解。 对于小波的各层高频系数可采用一定的阈值 进行量化处理 ,以去除噪声 。然后根据各层低频 系数及量化后的高频系数 ,实现信号的重构 。 2  小波去噪中阈值的选择 在对小波系数进行量化时 ,选用何种阈值规 则 ,会影响到最终去噪效果的好坏 。在保证失真 小的前提下 ,尽可能提高信噪比是选择合适阈值 的原则 。阈值方案一般有两种 :硬阈值法及软阈 值法 。前者主要保留信号的低频成分 ,衰减了大 部分高频成分 ,使得主要表现为高频信号的噪声 收稿日期 :2001 - 03 - 18  作者简介 :李蕴华 (1965 ) ,女 ,江苏南通市人 ,南通工学院讲师 ,硕士 ,研究方向为数字信号处理 。
第 2 期 李蕴华 :基于小波变换的语音信号去噪     ·33· 部分能被有效去除 ,但语音中的大量高频部分 (如 清音) 也被去掉 ,产生失真 。故我们采用软阈值处 理 。软阈值方法有 : (1) 采用 Stein 的无偏似然估 计原理 (SURE) 进行阈值选择 。对一个给定的阈 值 t ,得到它的似然估计 ,再将非似然 t 最小化 , 就得到了所选的阈值 ; (2) 用极大极小原理 (Min imaxi) 选择阈值 。它以处理后信号与原始信号的 最大概率逼近为约束条件 ; (3) 启发式阈值选择 。 它是一种最优预测变量阈值选择方法 ; (4) 固定阈 值形式 ,其值为 2lg(length ( s) ) ,其中 length ( s) 为 信号的长度 。在这 4 种方法中 ,前两种阈值选取 规则比较保守 (它只将部分系数置 0) ,当信号的 高频信息有一部分在噪声范围内时 ,采用这两种 阈值 ,可以将弱小信号提取出来 ;后两种阈值在去 除噪声时 ,显得更为有效 ,但有可能把有用的高频 特征当作噪声去除 。 语音信号可以被分成浊音段及清音段两部 分 ,这两部分的主要区别是 : 浊音呈现出准周期 性 ,其周期即为该段的基音周期 ,且含有较多的低 频成分 ,容易和高频噪声区别开 。清音的信号波 形类似于白噪声 ,与浊音相比 ,频率较高且无周期 性 。若语音中掺入了含高频成分的噪声 ,对浊音 段和清音段应采用不同的阈值方案 ,才能获得最 佳的去噪效果 。由前面的分析可知 ,对于清音 ,可 采用 (1) 、(2) 两种阈值规则 ,不至于损失过多的有 用信号 ,而对于浊音 ,可采用 (3) 、(4) 两种阈值规 则 ,更有效地去除噪声 。 3  浊音段和清音段的划分 由于针对清 、浊音我们采用不同的阈值方案 , 故准确划分清 、浊音段是一个关键性的问题 。逆 滤波法可以有效的判别是否浊音段 ,并可确定基 音周期 。逆滤波法过程见图 1 : 图 1  清音和浊音的区分 Fig. 1  Division of unvoiced and voiced speech   对于浊音来说 ,由于其具有准周期性 ,归一化 变形自相关函数在基音周期可能存在的 2. 5~15 ms 处会出现尖峰 (峰点值大于 0. 25) ,该尖峰位置 其实就是基音周期判断的依据 。而对于清音来 说 ,则无明显峰起 。用这种方法可以准确的区分 出清浊音 。 在整个过程中 ,分析窗的最小长度的选取 ,应 是两倍的基音周期 ,太小无峰点出现 ,而太大则引 入了不希望有的平滑 。 另外 ,通过实验我们发现 ,利用该方法也能准 确的区分含噪语音的清 、浊音段 。 4  去噪实验及结果 利用话筒将语音信号采集到计算机 ,并人为 掺入高斯白噪声 ,生成数据文件供实验使用 。 在去噪实验中 ,我们选用了 Biorthogonal 函数 作为小波函数 ,它具有线形相位特性 ,主要用于信 号的重构中 。实验表明 ,采用这种函数能得到较 好的去噪效果 。小波分解层次 J = 6 。 在对高频小波系数量化中 ,对于浊音段及清 音段我们比较了各种不同的软阈值方案 ,发现采 用固定阈值 2lg(length ( s) ) 形式 ,由于去掉了较 多的高频成分 ,引入了平滑 ,无论是对于清音还是 浊音 ,都存在较大失真 (如图 2) ,故在语音去噪中 我们不采用该阈值 。 为得到较好的去噪效果 ,经实验发现 ,对于浊 音段 ,可采用启发式阈值方案 ,而对于清音段 ,则 采用 SURE 阈值方案 。图 3 及图 4 是采取不同的 阈值法下的浊音 、清音的原始波形和去噪后波形 。 从图 3 和图 4 可以看出 ,对于浊音 ,采用启发 式阈值法比采用 SURE 阈值法可获取更强的去噪 效果 ,但是对于频率成分与噪声很相似的清音 ,启 发式阈值法会去掉一些有用的清音 ,产生失真 ,而 应用 SURE 阈值则可保留这部分清音 。由此可 见 ,针对浊 、清音不同特点 ,浊音部分选取启发式 阈值方案 ,清音部分选取 SURE 阈值方案 ,可使整 个语音段能达到最佳去噪效果 。 我们用话筒录下语音“工学院”3 个字 ,采样 频率为 20 kHz ,数据长 30 000 点 。加入白噪声 ,构 成含噪信号 (信噪比 RSN = 1 dB) 。利用逆滤波法 将含噪语音分成浊 、清音段 ,浊音段约有 1 400 点 , 剩余的是清音段及无声段 。在利用小波变换进行
·43·    盐城工学院学报 第 15 卷 分解及信号重构中 ,对于浊音段 ,我们采用启发式 阈值 ,清音及无声段则采用 SURE 阈值规则 。去 噪后的语音波形如图所示 (见图 5) 。从图 5 可以 看到 ,去噪后的信号中 ,不管是清音或浊音段 ,失 真都较小 ,且其中噪声部分得到了较大程度的削 减 ,测试结果其信噪比约提高了 8 dB 。 图 2  采用固定阈值时去噪效果 Fig. 2  The effect of denoising by using stable threshold 图 3  不同阈值时浊音段去噪分析 Fig. 3  The denoising of voiced speech by using defferent threshold 图 4  不同阈值时清音段去噪分析 Fig. 4  The denoising of unvoiced speech by using defferent threshold
第 2 期 李蕴华 :基于小波变换的语音信号去噪     ·53· 图 5  一段语音信号的去噪分析 Fig. 5  The denoising analysis of a speech segment 5  结束语 本文根据语音清音段及浊音段的不同特点 , 参考文献 : 采用了不同的阈值进行小波去噪 ,并获得了较好 的去噪效果 。 1 秦前清. 实用小波分析 M . 西安 :西安电子科技大学出版社 ,1998. 2 拉宾那 L R. 语音信号数字处理 M . 北京 :科学出版社 ,1984. 3 张贤达. 现代信号处理 M . 北京 :清华大学出版社 ,1998. 4 李世雄. 小波变换及其应用 M . 北京 :高等教育出版社 ,1997. Speech Signal Denoising based on Wavelet Transform (Department of information Engineering of Nantong Institute of Technology ,Jiangsu Nantong 226007 ,China) LI Yun hua Abstract : In this paper , an application of wavelet transform for speech signal denoising is discussed. According to the properties of voiced segment and unvoiced segment in speech signal , we use different thresholds. And a better effect of denoising is derived with less distortion. Keywords :wavelet transform ; speech signal denoising ; threshold
分享到:
收藏