基于FDM阵列技术的双通道语音增强方法.pdf-资料库

苎苎 Q ： CN 11—2223／N J Tsinghua Univ(Sci& Teeh)，2008，Vo1．48， No．7 清华大学学报 (自然科学版 )2008年第 48卷第 7期维普资讯 http://www.cqvip.com 18／41 1135—1139 ． n m 0 0 h ． L ii 基于 FDM 阵列技术的双通道语音增强方法崔玮玮，曹志刚，苏泳涛 (1．清华大学电子工程系，北京 100084；2．清华大学自动化系，北京 100084) 摘要：为了抑制小型语音通信设备中的方向性噪声干扰问题，提出一种双通道的语音增强算法。该方法基于一阶差分麦克风 (first—order differential microphone，FDM )阵列，并结合单通道的谱增强技术，可以同时提取语音和噪声估计，并能够实时地修正噪声谱。与现有的双通道语音增强技术相比，该算法可以获得 2～6dB的输出信噪比增益，且计算量减少了 2／3。仿真结果表明：该方法有效地改善了算法的噪声消除性能，且更适用于实时的语音增强系统。关键词：语音增强；一阶差分麦克风阵列；谱减中图分类号：TN 912．35 文献标识码：A 文章编号：1000—0054(2008)07—1135—05 FDM array-based dual channel speech enhancem ent m ethod 根据采用麦克风数目的不同，语音增强可以分～～；一一～～一～一一一一一一～为单通道的语音增强和多通道的语音增强。谱减法Ⅱ 及其改进方法是普遍采用的单通道语音增强技术。这些方法中噪声的估计是在观测信号的静音段进行的，因而都有一个基本假设，即噪声是平稳的。然而，实际环境中既包含平稳噪声也包含非平稳噪声 (方向性噪声、混响等等 )，这时单通道语音增强系统就显得无能为力。麦克风阵列语音增强方法是为解决这一问题提出的，其方法包括了延迟和波束形成 (delay and sum beamforming，DSB) 、广义旁瓣抵消 (generalized sidelobe canceller，GSC) 、一阶差分麦克风 (first—order differential microphone，FDM )阵列以及在 FDM 基础上改进的自适应零陷波束形成 (adaptive null—forming， ANF)技术 ]。前两种方法通常需要大数量的麦克风才能达到较好的消噪效果，因而不适用于设备小型化的需要 (如 PDA、手机、助听器等 )。而 FDM 和 ANF 技术在实现过程中仅需 2个麦克风，阵列结构简单小巧、易于携带，比大数量麦克风组成的大尺度阵列具有更广泛的应用领域，因而本文的研究是针对双麦克风的语音增强技术。需要指出的是，目前普遍采用的双通道语音增强方法 (FDM 和 ANF) 都是利用自适应的方法来实现噪声抵消的。由于在算法初始阶段或者噪声方向发生变化时，自适应滤波系数要经历一段时间才能收敛，因而此时输出的语音会含有大量的噪声，影响语音增强的效果。针对这一问题，本文提出了一种基于双麦克风的实时的噪声估计和抵消方法，它通过参考噪声直接估计出语音通道中的残留噪声，避免了自适应方法在收敛过程中语音性能下降的问题。语音增强技术可以提高语音通信的质量，也可以作为预处理器来改善语音识别系统的稳健性，因而它在车载电话、手持设备、助听器以及视频会议等方面得到了广泛的应用。收稿日期：2007—05—21 作者简介：崔玮玮 (1981一)，女 (汉 )，河南，博士研究生。通讯联系人：曹志刚，教授，E—mail：czg～dee@tsinghua．edu．cn

维普资讯 http://www.cqvip.com 清华大学学报 (自然科学版 ) l 双通道信号模型在 2个麦克风组成的阵列中，备麦克风接收到的信号可以表示为： zl(￡)一 S(￡)^l(￡)+ l(￡)， z2(￡)一 s(t)h2(￡)+ 2(￡)． (1) (2) Y2(z)≈ 2(￡)一 l(￡一 d／c)． (7) 由此可见，Y。(￡)中只包含了噪声项，而 Y。(￡)通道既包含了经空间波束增强后的语音又包含了部分残留 ●=== ● 噪声，因而称 Y (￡)为噪声通道，Y。(￡)为语音通道。 2 算法描述其中：“*”表示卷积运算；S(￡)为期望语音信号；从双通道信号模型可以看出，如果利用 Y (￡)通 ^ (￡)和 h (￡)为声源到达第 1个麦克风和第 2个麦道的参考噪声来抵消 Y。(￡)通道中的残留噪声，就可克风的脉冲响应；墨(￡)和 (￡)( 一1，2)分别为备麦克风接收到的带噪语音和噪声信号。在不考虑声学进一步增强语音。然而，目前的噪声抵消过程通常由自适应滤波的方法来实现 ]，该算法的性能会受到反射的条件下，式 (1)和式 (2)可以简化为： z1(￡)一 s(￡)+ l(￡)， z2(￡)一 S(￡一．r)+ 2(￡)． (3) (4) 其中 r为到达时间差。对于远场信号，声音到达 2个麦克风的传播模型如图 1所示，由图可知，r一 ( COS O)／c(c为声速 )。滤波器是否收敛以及收敛速度快慢等因素的影响。如果在 FDM 的 2个输出信号的基础上，利用 Y (￡) 通道的参考噪声来直接估计 Y。(￡)中的残留噪声谱，进而利用单通道的谱增强方法，如谱减法进行语音增强，就可以避免自适应算法在收敛过程中的噪声泄漏问题，这就是本文所提出的算法的基本思想。该算法是在频域进行处理的，运算速度快且可以实时实现。该算法描述如下。对输出信号式 (5)和式 (7)做短时 Fourier变换可得： yl(￡， )一 (￡， ){1一 exp[一 j~od(1+ COS )／c]}+ Ⅳl( ， )一 Ⅳ 2( ，w)exp(一 j~od／c)， (8) y2(￡， )一 N 2(￡， )一 Ⅳ (￡，~o)exp(一 joJd／c)． (9) 其中： (￡， )、yl(￡， )、y2(￡， )、Ⅳl(￡， )和 N (￡， )分别对应时域信号 5(￡)、Y。(￡)、Y2(￡)、 (￡)和 (￡)的 STFT。在后面的表示中，为了方便推导将 (￡， )省去。 y 和 y 的幅度平方可表示为： l y l 一 2{1一 COS[-~od(1+ COS )／c]}l l。+ lⅣ。l + lⅣ l + ysN+ yNN， (1O) ly l。一 lⅣ。l + lⅣ l 一 2Re[-NlⅣ exp(一 j ／c)]． (11) 其中：Re[·]为取实部，上标“*”为复共轭，且：图 1 声波传播到达 2个麦克风 FDM 阵列。的实现框图如图 2所示，其中延迟单元 T=d／c，∑表示求和运算。图 2 FDM 阵列实现框图由图 2可得，FDM 的输出信号为： Yl(￡)一 zl(￡)一 z2(￡一 7’)一 S(￡)+ (￡)一 s[￡一 d(1+ COS )／c]一 Y sN — ， (￡一 d／c)， (5) ZReESN~{1一 exp[--- jcod(1+ COS )／c]}]一 Y2(￡) 一 z2(￡) 一 l(￡一丁)一 2Re{ Ⅳ [-exp(joJd／c)一 exp(一 j COS O／c)]}， S(￡一 d COS O／c)+ 。(￡)一 S(￡一 d／c)一 (12) (￡一 d／c)． (6) yNN一一 2Re[-NlⅣ exp(jo．,d／c)]． (13) 在 FDM 阵列中，期望声源一般被放置在阵列的沿由于 S(￡)与。(￡)、 2(￡)相互独立，E[ys ]一线方向 ( ≈O。)[ ，故式 (6)可近似为 0(EE·]表示数学期望 )，从而有

维普资讯 http://www.cqvip.com 无关。因此，在噪声方向慢变的情况下，FDM—SS算法可以用于抵消短时平稳的噪声 (如来自其他方向的语音 )，而这是单通道语音增强技术无法实现的。若定义先验信噪比一高t ， ‘． J l 。l一则输出语音的功率可以进一步表示为 1 S 1 = 号{1一c。s[-wd(1+c。so)／f]) ly ． (23) 综上所述，FDM—SS算法的实现框图如图 3所示，其中模块 FFT表示快速 Fourier变换，IFFT表示逆变换。崔玮玮，等：基于 FDM 阵列技术的双通道语音增强方法 l y 一 2{1一 cos[wd(1+ COS 0)／c3)E[1S l ]+ E[1Ⅳ l ]+ E[1Ⅳ l ]+ E[yNN]． (14) 考虑到语音的短时平稳性，并假定噪声也是短时平稳的，则式 (14)可写为 ly】l ： 2{1一 COS[-oJd(1+ COS )／c])lS l + lⅣ l + lⅣ2 l 一 2ReEN1Ⅳ exp(jwd／c)]．对于方向性干扰噪声 ( )(STFT表示为 Ⅳ)，如果噪声来自于 ≯方向，则 2个麦克风接收到的噪声可 (15) 以表示为： fN ： N ； {N，一Nexp(一j cos#／f)．将式 (16)代入式 (15)和 (11)，可得： ly l 一 2{1一 COS[-wd(1+ COS )／c])lS l + 2{1一 COS[-oJd(1+ COS≯)／c])lⅣ l ， (17) ly21 一 2{1一 cos[-wd(1一 COS≯)／c])lN l ． (18) 借助单通道 ss方法，lS l 的估计由下式给出： lS 1 一 {1一 cos[-wd(1+ cosO)／c])_。· {ly1 l 一 a(t， )ly2l )， (19) 一 }三嚣 { sinE' ~Ud 1 COS／c]) ． (20) I (一 ) J。其中厂一~o／27r为信号频率。这就是利用 FDM 阵列一技术和 SS方法实现的双通道语音增强方法，本文将其称为 FDM—SS算法。观察 ( ， )和文 E8]中式 (1)的 ( )可以看出，两者虽然在表达式上是相似的，却分别代表了不同域内的变量。 ( )是一个时域滤波器，并且获得 ( )的过程是通过自适应的方式来实现的，而 a(t，图 3 FDM -SS算法实现框图若定义算法的复杂度为该算法在处理一帧数据 (帧长为 )时所需的乘法次数，则本文所提出的 FDM —SS算法的计算复杂度为 3MIbM + 12M ，而 ANF算法 (利用 Fast Block—LMS 自适应方法实现 ) 的复杂度u叫为 10MlbM +26M 。由此可见，FDM—SS 算法的复杂度约为 ANF算法的 1／3。 3 仿真实验 ’ 本节通过计算机仿真实验验证本文提出的 FDM—SS算法的有效性，并与现有若干经典算法进 )的计算在频域进行。实际上，通过式 (17)和 (18) 行比较，分析其性能差异。实验中，麦克风阵列由相可以看出，a(t，oo)可以由静音段 1 y 1 和 1 y 1 的比值直接估计得到，即 a( ， )= ． (21) 距为 d一 2．125 cm 的 2个全指向性麦克风组成，信号采样频率为 16 kHz，并采用分帧的方式处理，帧长 256，帧移 128。期望声源位于阵列的 O。方向。方向性干扰取 Noisex92库中的 babble噪声。图 4给这就避开了自适应算法在参数收敛过程中所造成的出在信噪比 y为 0dB，噪声方向 ≯为 120。时，纯净噪声泄漏问题。另一方面，文 [8]证明了在感兴趣的语音、．babble噪声以及 2个麦克风所接收到的频率范围内，有如下近似：信号。 sinE~ fd COS ／c]≈ 1 C OS ． (1一声) ～一。下面对不同的语音增强算法进行仿真比较，这些算法包括 Wiener滤波算法 l_3]、多带谱减算法此时，a(t， )只与噪声的方向有关，而与信号本身 (multi—band spectral subtraction，M BSS)E ] 、 A N F

O_3 , aj t f于丁晒目蓥。 -▲ ▲ ▲▲ ▲I- ．J-▲ ■ ’ 一 ’ ’ 一清华大学学报 (自然科学版 ) 维普资讯 http://www.cqvip.com ；(z)分别表示期望语音及其估计，L表示信号的总样本数，定义输入信噪比 )，。一10lgl∑S2(z)／∑ (z)1． (24) 误差信号为： e(Z)一 l；(Z)一 S(Z)l， (25) fe(Z)，一 0；尺 (z)一 l l 0，一 1． (26) 其中，为语音活动检测的结果。一0表示静音段，一 1表示语音活动周期。则式 (25)中的 e(z)既包含了残留噪声尺的影响，也包含了语音失真的影响。一 O-3 O 3 藿。一 O 3 O_3 藿。一 O_3 OI3 。一 O_3 (d)麦克风 2 基于此，给出 2种输出信噪比定义： )，一10lgl∑；。(z)／∑P。(z)1， (27) 0 l 2 3 4 5 6 样本数 ×10 )， 2—10 lgl∑； (z)／∑n2n(z)1． (28) 图 4 纯净语音、babble噪声以及 2个麦克风根据以上定义，在输入信噪比取一 5～20 dB，噪声接收到的信号分别位于 90。、120。和 180。时，不同算法所得到的输算法[8 (自适应过程利用 Fast Block—LMSElO]实现 )，出信噪比如图 6所示。以及本文提出的 FDM—SS算法，其中单通道 Wiener 滤波算法和 MBSS算法的语音增强是针对信号．z (f)的处理结果。图 5示出了在 )，为 0 dB，为 120。时，不同算法的增强结果。 O_3 蓥。一 O_3 O 3 。一 O 3 O 3 蓥。一 O-3 O 3 。一 O-3 O 3 藿。一 0．3 0 1 2 3 4 5 6 样本数 ×10 图 5 不同算法的增强结果为了更加客观地比较各算法的增强性能，本文由图 6a、6b和 6c可以看出，在处理方向性噪声时，单通道语音增强方法 Wiener和 MBSS在低信噪比的环境下性能会急剧恶化，而多通道的语音增强算法 ANF和 FDM—SS可以获得相对稳健的结果。在一5～ 5 dB时，本文提出的 FDM—SS方法相对于 Wiener以及 MBSS有 6～ 7 dB的改善，而相比 ANF算法则有 2～6dB的性能增益。如果仅考虑噪声消除性能，如图 6d、6e和 6f，FDM—SS算法对信噪比的提升明显优于其他算法。通过进一步比较图 6中上下两行还可以看出，在高输入信噪比情况下， FDM—SS会部分地造成语音失真，或者说由 FDM— SS算法引起的失真大于 MBSS算法。这一失真可通过修正加权系数 a(f， )来进行改善，然而，这样做会降低算法的消噪性能。因此，增强算法需要在残留噪声和语音失真 2个性能指标之间进行折中考虑。 4 结论本文通过将 FDM 阵列技术与单通道谱增强方法相结合，既利用了阵列的空间滤波特性来处理方向性的干扰噪声，又借助于传统单通道谱增强技术实现了一种实时的双通道语音增强方法，该算法与目前普遍采用的双通道语音增强 ANF算法相比有 2～ 6 dB 的输出信噪比改善，且计算复杂度仅为 ANF算法的 1／3。因而，该算法能够获得更高质量统计了语音信号的输入输出信噪比。假定 S(z)和的语音信号，且更适合于实时的语音增强系统。

崔玮玮，等：基于 FDM 阵列技术的双通道语音增强方法 1l39 维普资讯 http://www.cqvip.com 兽兽兽． Z ／dB Z ／dB ／dB (a)噪声位于 90。方向时的 ‰ (b)噪声位于 120。方向时的 ‰ (C)噪声位于 180。方向时的 ‰ l 一一一 W iener 兽、兽、兽、／dB ／dB ‰ ／dB (d)噪声位于 90。方向时的 ‰ (e)噪声位于 120。方向时的 ‰ (f)噪声位于 180。方向时的 ‰ 图 6 各种算法的输出信噪比参考文献 (References) [1] Boll S F． Suppression of acoustic noise in speech using spectral subtraction [J]．IEEE Trans on Acoust，Speech and Signal Processing，1979，27：113— 120． [6] Griffiths L J，Jim C W．An alternative approach to linearly constrained adaptive beamforming [J]． IEEE Trans on Antennas Propagation，1 982，30：27—34． [7] Elko G W ， Pong A T N． A simple adaptive first—order differential microphone Eel ／／ IEEE ASSP workshop on [2] Ephraim Y ，M alah D．Speech enhancem ent using a m inimum Applications of Signal Processing to Audio and Acoustics． mean—square error log—spectral amplitude estimator [J]． IEEE Trans on Acoust， Speech and Signal Processing， 1985，33： 443 — 445． [3] Scalart P，Filho J V ．Speech enhancem ent based on a priori New Paltz，N Y ；IEEE ，1995：169—172． [8] LUO Falong， YANG Jun， Pavlovic C，et a1． Adaptive null—forming scheme in digital hearing aids[J]．IEEE Trans on Acoust，Speech and Signal Processing，2002，SO： 1583— signa1．to noise estimation [c] ／／ IEEE International 1590． Conference on Acoustics， Speech， and Signal Processing． Atlanta，GA ：IEEE ，1996，2：629— 632． E43 Kamath S。 Loizou P． A multi—band spectral subtraction method for enhancing speech corrupted by colored noise[c] ／／IEEE Internationa1 Conference on Acoustics，Speech，and Signal Processing． Orlando， Florida： IEEE， 2002： 675 — 678． [53 Flanagan J L．Com puter—steered microphone arrays for sound transduction in large rooms[J]．Journal of Acoustic Society ofAmerica，1985。78：1508—1518． [9] 魏建强．基于小数量麦克风的语音增强算法研究 [D]．北京；中国科学院声学研究所，2005． W EI Jianqiang． Research on algorithm of speech enhancement based on small num ber of m icrophones rD]． Beijing： Institute of Acoustics， Chinese Academy of Sciences，2005． (in Chinese) [103 Haykin S． Adaptive Filter Theory (Fourth Edition) [M ]． Beijing：Publishing House of Electronics Industry，2002．

资料库

基于FDM阵列技术的双通道语音增强方法.pdf

相关推荐

音视频

热门标签

最新资料