高噪声环境下基于自适应滤波语音降噪技术的研究
关键词:语音信号,自适应滤波技术,信噪比
作者:郑海啸 刘 珩
摘要:本文选取原始输入的延时信号作为参考噪声输入的单声道系统,构建基于线性预测的
自适应语音滤波器,并对 LMS 算法作出改进,被噪声污染的语音信号通过该滤波器滤波,
噪声得到有效抑制,显著提高了信噪比。
1 引 言
在实际环境中,语音信号在声电转换时不可避免地要受到周围环境的影响,高背景噪声会严
重地影响语音信号质量。语音通信系统中的一个重要工作就是从带噪语音信号中提取纯净的
原始语音、抑制背景噪声。各种语音降噪算法正处于广泛的研究中。
其中,利用自适应滤波技术进行语音降噪是一种效果较好的方法。自适应滤波能在输入信号
与噪声的统计特性未知或变化的情况下,自动估计出所需的统计特性,并以此为依据自动调
整滤波参数,以达到最佳的滤波效果。
传统的自适应噪声抵消法多采用双声道(多声道)系统,以得到一个或多个参考噪声作为辅助
输入,这势必造成系统结构复杂等一系列问题。所以本文选取原始输入的延时信号作为参考
噪声输入的单声道系统,构建基于线性预测的自适应语音滤波器,并对 LMS 算法作出改进,
被噪声污染的语音信号通过该滤波器滤波,噪声得到有效抑制,显著提高了信噪比。
1 原 理
基于线性预测的 FIR 自适应语音滤波器的系统结构形式如图 1 所示。
在自适应语音滤波器的计算中,本文采用 LMS 算法,μ 的选取参考文献[4]中介绍的计算公
式,即:
μ=1/(10×L×Px)
式中:L 为线性预测阶数,即自适应 FIR 滤波器的长度;Px 为输入信号功率。
μ 计算公式的稳定性保险系数比较大,而且自适应语音滤波器又主要工作在强干扰噪声状态
下,可直接选取 Px 为环境噪声的平均功率。
该系统是利用了信号的相关性和噪声的不相关性,使原始信号中的相关部分得到加强,而不
相关部分得到削弱,从而提取出有用的信号,所以信号的相关性和噪声的不相关性对于信噪
比的提高影响很大。延迟时间不同则信噪比的改善程度也不相同,这是因为信号在不同时刻
的相关性不同,t 时刻的信号 s0 和 t+τ 时刻的信号 s1 相关性越强,则信号越容易从噪声中
提取出来。
以采样周期 T 对语音波形进行采样,得到语音信号 5(k)(k=0,1,2,…)。当前时刻的样本
值 s(k)与邻近的 L 个过去时刻的样本值 s(k-1),s(k-2),…,s(k-L)相关,即 s(k)可由 s(k-i)(i=1,
2,…,L)的线性组合近似表示为:
通常情况下,语音信号 sk 被加性的环境宽带噪声 nk 污染,实际采样得到的信号 xk 可以表
示为 xk=sk+nk。虽然语音信号受到宽带噪声的影响,但在一定程度上,实际信号仍然保存
着语音信号所存在的相关性,只是由于噪声干扰,使得相关性有所减弱。因此,采用作为
sk 线性预测的近似值。
系数权向量 Ak 通过均方误差性能函数测度法调节,使得:
为最小。由于宽带噪声与语音信号不相关,且宽带噪声在不同时刻的自相关系数也非常小。
因此:
从上式可以看出,ε(Ak)是一个 Ak 的二次性能函数,必然存在全局最佳点。当 Ak=Akopt 时,
ε(Ak)达到最小,则
也达到最小,因此
,最逼近 Sk 值。
一般梯度估值的自适应算法要从统计样本中进行估计。实时情况难以实现梯度估值计算。
LMS 算法是直接利用单次采样数据|εk| 2 来代替期望值 E[|εk|2]的简化方法来进行梯度估值
计算。
2 算法改进
LMS 算法的计算复杂度主要来自于在进行系数更新时执行的乘法运算,以及对自适应滤波
器输出的计算。在需要自适应滤波器高速工作的应用中,如语音降噪,使硬件的复杂度最小
是很重要的。同时,噪声种类的多样性导致语音降噪的复杂性,这对算法的收敛性也提出了
更高的要求。
为了简化 LMS 算法并加速算法的收敛性以达到更好的降噪效果,结合基于线性预测的 FIR
自适应滤波器的特点,本文对 LMS 算法作出改进:
式中:sgn[·]为符号函数,参数 α 和 β 是 2 的幂,是用来修正系数向量的,当 α>1,增大系
数向量的调整;当 α<1,则减小系数向量的调整;β 的作用同 α,如何选择要视输入信号信
噪比情况而定。选择合适的 α 和 β 有助于改善算法的收敛特性。系数向量的初始化要尽可
能接近或者在滤波器正常工作时的系数变化范围之内,这有助于自适应滤波器的性能稳定,
缩短收敛时间。由于参数 α 和 β 是 2 的幂,则系数的更新可以利用简单的乘法来实现,基
本上是由比特移位和相加运算组成的,降低了 LMS 算法的计算复杂度。
算法的程序流程图如图 2 所示。
3 仿真及结果分析
为验证基于线性预测的自适应语音滤波器的有效性和改进算法的效果,本文采用 MATLAB
软件进行仿真,仿真计算后的降噪效果用下面的语音信号波形说明。
采用在 4 种背景噪声下现场录制的带噪语音(采样频率均为 8 kHz)进行仿真实验,图 3~10
的降噪效果仿真图中,(a)为带噪语音信号波形,(b)为采用原 LMS 算法滤波后的语音信号波
形,(c)为采用改进的 LMS 算法滤波后的语音信号波形。
第一种,背景噪声为白噪声,噪声类型属理想的平稳宽带噪声;
第二种,背景噪声为电台噪声,噪声类型属近似平稳宽带噪声;
图 3、4 分别为信噪比约 9 dB、6 dB 的白噪声降噪效果仿真图,图 5、6 分别为信噪比约 9 dB、
6 dB 的电台噪声降噪效果仿真图。由图可以看出,白噪声和电台噪声得到了大幅度的抑制,
信噪比提高约 8 dB 的以上,采用改进的算法比原算法噪声抑制得更大,降噪效果更好;在
听觉效果上,此算法提高了语音的清晰度和可懂度,虽有很小的失真,但对听觉影响不大。
第三种,背景噪声为报警器噪声,噪声类型属非严格周期窄带噪声;
第四种,背景噪声为 2 000 Hz 单频噪声,噪声类型属严格周期窄带噪声;
图 7、8 分别为信噪比约 9dB、6dB 报警器噪声降噪效果仿真图,图 9、10 分别为信噪比约
9 dB、6 dB 的 2 000 Hz 单频干扰噪声降噪效果仿真图。由图可以看出,报警器噪声和 2 000
Hz 单频干扰噪声也得到了大幅度的抑制,信噪比提高约 10 dB 以上,采用改进的算法比原
算法噪声抑制得更大,降噪效果更好;由于窄带噪声频率成分比宽带噪声简单得多,自适应
算法可以更快地收敛,所以可把噪声滤除得比较干净;在听觉效果上,此算法提高了语音的
清晰度和可懂度,很好地保持了语音的自然度,失真很小,对听觉的影响可忽略不计。
来源:http://news.eeworld.com.cn/n/20070930/16009.shtml