!"#$%&’()’* +,- ./0*"&1",2
扬 声 器 与 传 声 器
文章编号!!""#$%&%’"#""’#!#$""#($"’
传声器阵列的声源定位研究
&论文&
严素清! 黄 冰
"桂林电子工业学院 通信与信息工程系! 广西 桂林 !"#$$"!
$摘 要% 对传声器阵列进 行 了 总体 概 述 !研究 了 基 于传 声 器 阵列 的 声 源定 位 所 面临 的 问 题!分 析 和 比较 了 几 类主
要的声源定位方法" 给出了一种基于时间到达差的声源定位在处于混响环境下时延估计的有效算法并通过实验验
证了该算法 "
$关键词% 阵列信号处理# 声源定位# 到达时间延迟
$中图分类号 % )*+!#,-
$文献标识码% .
/0123 45 .6417086 /4196: ;46<=8><0845 ?<7:2 45 @8694AB45: .99<37
%&’ ()*+,-." /0&’1 2,-.
#34567894-8 :; <:99)-,=68,:- 6-> ?-;:7968,:- @-.,-447,-."
1),A,- ?-B8,8)84 :; @A4=87:-,= C4=D-:A:.EF 1),A,- !"#$$"" 4B=7,G4B 8D4 9,=7:5D:-4 6776EB .4-476AAE 6-> 6-6AEB4B 8D4 57:GA49 ,- 8D4 6=:)B8,= B:)7=4
A:=6A,H68,:-I CD744 96,- 948D:>B :; 8D68 674 =:95674>I & 7:G)B8 948D:> G6B4> :- A,-467 74.74BB,:- ;:7 B544=D B,.!
-6A 8,94 >4A6E 4B8,968,:- ,B 574B4-84> 6-> ,8 ,B 57:J4> G48847 547;:796-=4 8D6- 1<< 948D:> 8D7:).D 4K547,94-8 ,-
8D4 74J47G476-8 7::9BI
$D:3 E4927% 6776E B,.-6A 57:=4BB,-.& 6=:)B8,= B:)7=4 A:=6A,H68,:-& 8,94 >4A6E :; 677,J6A
# 引言
传声器阵列是指由一定的几何结构排列而成的若
干个传声器组成的阵列’ 相对于单个传声器而言具有
更多优势" 它可以电子瞄准的方式从所需要的声源方
向提供高质量的声音信号" 同时抑制其他人的声音和
环境噪声"具有很强的空间选择性"无须移动传声器就
可对声源信号自动监测(定位和跟踪’所谓声源定位技
术就是根据传声器接收的数据确定自然声源或人为声
源的位置’传统定位是采用雷达技术"而基于传声器阵
列的定位系统相对于传统的雷达跟踪定位而言具有隐
蔽性(不易受干扰’ 正是由于其独特优势"基于传声器
阵列的应用已经成为一门新型的技术’
L$ 世纪 M$ 年代以来" 传声器阵列信号处理技术
得到了迅猛的发展"并在雷达(声呐及通信中得到广泛
的 应 用 " 后 来 又 应 用 到 语 音 信 号 处 理 中 ’ #NM! 年
OA6-6.6- 将 传 声 器 阵 列 引 入 到 大 型 会 议 的 语 音 增 强
中"并开发出很多实际产品’ #NMP 年 (,AJ4796- 将传声
器阵列引入到语音识别系统"#NNL 年又将阵列信号处
理用于移动环境下的语音获取" 后来将其应用于说话
人识别’ #NN! 年 OA6-6.6- 在混响环境下用阵列信号处
理对声音进行捕获’ #NNQ 年 (,AJ4796- 和 276->B84,- 开
始将其应用于声源定位中" 用于确定和实时跟踪说话
人的位置’ 中国在这方面的研究工作起步较晚"目前对
声源定位的研究刚起步’
L 面临的问题
语音信号是一个宽带的非平稳声源" 不过在短时
间##$RS$ 9B!内可认 为 是 统 计 平 稳 的 "所 以 在 进 行 语
音信号处理要对语音信号进行短时分析T#"LU’ 下面将对
语音信号处理时的一些问题逐一概述’
#,! 混响
当 语 音 信 号 在 传 播 过 程 中 "由 于 反 射 (衍 射 等 原
因" 到达传声器的语音信号除了直达信号外还存在着
多条其它路径传来的信号" 从而使接收信号的幅度衰
减(音质变差等"这种现象称为混响#如图 # 所示!’ 在
理论上可用反卷积或者反滤波来消除混响" 但实际中
这种方法很难实现" 所以进行信号处理时混响会影响
到定位精度’
#,# 声源定位的实时性
电声技术 2004-12
!"
扬 声 器 与 传 声 器
!"#$%&’()’* +,- ./0*"&1",’
传 声 器 阵 列 定 位 系 统 的 基 本 要 求 是 能 定 位 和 跟
踪声源!定位的精度需满足一般要求!能实时实现" 这
就需要定位系统不断更新! 使用的定位器在更新速率
上有一个精细的分辨率! 同时不管什么样的定位器都
要求有一个不苛刻的计算量使其能应用于实时系统"
传声器用于会议室扩声时!讲话者和传声器 阵列
的典型距离为 !"# $" 因此在实际中传声器阵列处于
近场内!传声器接收的是球面波而不是平面波!对语音
定位时就不能像雷达# 声呐以及移动通信信号处理中
的信源定位那样! 因为后者的信源往往是远场的窄带
信号!接收阵列入射波可视为平面波"
# 声源定位方法
目前已有的声源定位方法主要分为 # 类$ 基于最
大输出功率的可控波束形成! 采用高分辨率的谱估计
和使用到达时间差%%&’(&的方法!这些分类都是通过
应用环境和估计方法来描述的"
!"# 基于最大输出功率的可控波束形成技术$!%
波束形成的基本思想是将各阵元采集信号进行加
权求和形成波束! 进而通过搜索声源可能的位置来引
导波束! 修改权值使传声器阵列的输出信号功率达到
最大!波束输出功率最大的点就是声源的位置"传统的
波束形成器的权值取决于各阵元上信号的相 位延迟 !
而 相 位 又 与 时 延 和 声 源 到 达 延 迟 %&’(&有 关 !故 又 称
为时延求和波束形成器" 而现代的波束形成器则突破
了上述局限! 在进行时间校正的同时还对信号进行滤
波!称为滤波求和波束形成器"
!&’ 基于高分辨率谱估计的定位技术$!%
该类声源定位技术是利用接收信号相关矩阵的空
间谱!求解传声器间的相关矩阵来确定方向角!从而进
一步确定声源位置" 高分辨率谱估计的定位技术包括
!"
电声技术 2004-12
现代高 分 辨 率 谱 估 计 技 术 $自 回 归 模 型 %()最 小 方
差谱估计%*+&和特征值分解方法%如 *,-./ 算法&"
在实际中! 基于高分辨率谱估计定位技术的空间
谱的相关矩阵是未知的!必须从观测信号中来估计!需
要在一定时间间隔内把所有信号平均来得到! 同时要
求接收信号处于声源#噪声#估计参数固定不变的环境
和有足够多的信号平均值" 即便满足这些条件!该算法
也不如传统的波束形成方法对声源和传声器模型误差
的鲁棒性好" 目前定位问题所涉及算法都是研究远场
的线性阵列情况" () 模型和 某些特征值分析的方法
就限定在远场且具有相同特性的线性阵列! 但 *+ 和
*,-./算法已经延伸到一般阵列的几何结构和近场"
!&! 基于到达时延 ()*+ 技术$!%
基于到达时延%%0$1 &1234 ’5 (660732!%&’(&声源
定位方法! 首先估计出声源到达传声器阵列的各阵元
的相对时间差! 再利用时间差算出声源到达各阵元的
距离差!最后用搜索或几何算法确定声源位置"
%&’( 的声源定位包括 8 个步骤$%!& 先进行时延
估 计 %&9%%0$1 &1234 9:;0$3;0’<&并 从 中 获 得 传 声 器
阵列中相应阵元对之间的 %&’(" %&9 的方法很多!大
致可分为广义互相关 =//%=1<16320>1? /6’:: /’66123!
;0’<& 法 #@*- 自 适 应 滤 波 器 法 和 互 功 率 谱 相 位 /-A
%/6’::BC’D16 -C1E;632 AF3:1&法 # 种GH!IJ"%8&利用 %&’(
进行定位估计! 主要的方法有最大似然 *@K*3L0$M$
@0N120F’’?&法#球形插值 -.%-CF160E32 .<;16C’23;0’<&法GOJ
和线性相交 @.%@0<136 .<;16:1E;0’<&法GPJ"
!", 定位方法比较
在这 # 种定位方法中! 基于最大输出功率的可控
波束形成技术是出现较早且已应用于实际的一种定位
方法!较多的用于雷达#声呐以及移动通信的信号处理
中"可控波束形成技术本质上是一种最大似然估计!它
需要声源和环境噪声的先验知识" 而实际使用中!这种
先验知识往往很难获得" 同时进行定位估计是一个非
线性优化问题! 这类非线性优化的目标函数往往有多
个极点!对初始点选取很敏感" 用传统的梯度下降法往
往容易陷于局部极小点!从而不能找到全局最优点!若
采用别的搜索方法来找全局最优点! 就会增加计算复
杂度!不适用于实时系统"
基于高分辨率谱估计的定位方法是通过时间平均
来估计信号之间的相关矩阵!需要信号是平稳过程!估
计参数固定不变!而语音信号是一个短时平稳过程!往
往不能满足这个条件" 该定位方法的效果和稳定性不
!"#$%&’()’* +,- ./0*"&1",2
扬 声 器 与 传 声 器
其中!$&"$是由于噪声引起的相位% 由于在混响环境
下<多路径传播使得相位存在一定的偏差<如 采用常用
的最大似然加权相位来估计时延< 将会产生更大的误
差<在这里为了克服最小二乘&+,$标准的不足!采用一
个有效而健壮的 回 归 函 数 !$=>5?!@ ABC5B:DE-F!G.递 归 函
数为
%./$0
!$ %
HI
6 /6#
&
"
# !/
3
# "
/
可得时延估计为
!!
0089: JBK
#
’%./
6#
#&"$6"!
*&"$"
(L"
&I$
&M$
该 ABC5B:DE 递归函数是一个对称( 单峰值的概率
密度函数! 它指定了一个最大的误差的绝对值大于 /
时!其值为零% 因此能消除了额外信号带来的相位差%
同时包含在 %./
中的 *&"$!也可改善误差空间!*&"$比
较大时!ABC5B:DE 标准对误差不敏感!不存在不连续 的
情况!见图 !&8$)当 *&"$较小时!容易产生局部最小值
和误差表面的不连续!如图 !&N$所示% 所以可用于加
强一些对 ,OP&信噪比$有利的频率%
如可控波束形成法! 但每次迭代的计算复杂度不像可
控波束形成那么苛刻" 此外还须假定理想的信号源和
相同特性的传声器等!在实际环境中不可能做到这点"
同时房间混响作用也会影响到定位的效果! 要求阵列
处于远场情况!而且该方法主要针对窄带信号!而语音
信号是宽带信号"
在现有传声器阵列声源定位中! 基于时间到达差
的定位方法精度相对较高! 计算量远小于基于最大输
出功率的可控波束形成技术和基于高分辨率的谱估计
的定位方法!可以考虑在实际中实时实现"不过由于该
方法的定位是分为 ! 个过程#时延估计和定位 $!在定
位时所使用的参数是过去时间! 因此该估计只是一个
次最优的定位%同时该定位比较适合单声源的定位!对
多声源的定位效果不是很好! 房间的混响也会影响定
位的准确性"
总之在这 " 种定位方法中! 基于到达时间差的声
源定位应用比较广泛"
# 基于到达时差的时延估计算法
基于对声源定位算法的分析! 这里给出一种在混
响环境下基于时间到达差&$%&’$的时延估计方法%
基于时延的声源定位中! 主要使用的是广义互相
关函数&())$的时延估计% 该算法是通过接收信号的
互相关函数来得到时延的!在 ()) 的时延估计 &$%*$
中方差包括了一个在相位域的加权最小二乘&+,$标准-".%
但该方法仅在单路径传播过程中有很好的效果! 信号
处于混响环境时效果不是很好! 采用反卷积消除混响
也存在着一定的局限性!先是信号的先验知识未知!同
时语音信号是非平稳信号% 在此给出了另外一种适用
于混响环境下的时延估计算法’ 基于线性回归的时延
估计%
假定源信号为 !&"$!从 传 声 器 阵 列 接 收 到 的 信 号
为 #/&"$和 #!&"$
#/&"$0$/&"$1!&"$2%/&"$
3!"!&
&/$
#!&"$0$!&"$1!&"’!$4%!&"$
&!$
其中!$/&"$和 $!&"$为房间脉冲响应!! 为待估计时延 !
%/&"$和 %!&"$为环境噪声%
3!"!&
在频域上!可得
(/&"$0)/&"$*&"$4+/&"$
(!&"$0)!&"$*&"$567"!4+!&"$
可得信号互功率谱的相位为
#&"$089: (/&"$(!!&"
"
#$ ,"!-$&"$
图 " 就上述的基于线性回归和普遍使用的广义互
相关&())$算法用于时延估 计 的 实 验 仿 真 结 果 !估 计
时延为 #/Q; J@&位于第 ""! 点上$% 通过实验证明用线
性回归函数进行时延相对于比较普遍使用的进行时延
而言在混响环境下更加有效%
&"$
$
&;$
电声技术 2004-12
!"
扬 声 器 与 传 声 器
!"#$%&’()’* +,- ./0*"&1",’
KBB>OE2 5IQWXF?B !W??<= >CD &>CZX>Z?# /\\_# "//$+&
\/S/+^2
6‘7 :>XB;V;I aQI@IZI# $;?BZ;IBZ;I !N>;V?B2 K@;V>F;IC bE;CZ > cBIEE$IY?B S!W?E? d>E?D
R?<=C;eX?2 fcK!!$#/\\‘2
6g7 :>XB;V;I aQI@IZI# $;?BZ;IBZ;I !N>;V?B2 KF;IC ;C ’I;EO >CD h?N?Bi?B>CF JCN;BICQ?CF bE;CZ
c!$ KC>@OE;E2 fJJJ# /\\^2 \+/S\+‘2
6^7 H2a2!Q;F=# H2!2 Ki?@2 c@IE?DSUIBQ &?>EFSEeX>B?E !IXB
&I<>F;IC JEF;Q>F;IC UBIQ h>CZ? T;UU?B?C :?>EXB?!
Q?CFE2
fJJJ RB>CE>CD
!;ZC>@ $BIE?# :2dB>CDEF?;C# ,2P2 !;@N?BQ>C2
$B>@ fEEX?E ;C F=? bE? IU > PB?eX?C;C T?!
@>O JEF;Q>FIB UIB :;BB>O KWW@;<>F;IC2 $BI@ !I<;?FO IU KQ?B;<># KXEF;C /\\‘2
6j7 !2:IBZ?CF=>@?B2 P;FF;CZ h?D?EFIBE ;C h?!
ZB?EE;IC2
fC k2
&>YB?C >CD KWW@;<>F;ICE# :>B@
T?LL?B# fC<2# ’?Y lIBL# /\\/2 /8gS/+j2
6\7 K2 A?>FIC# H2RXL?O2 R=? P;FF;CZ IU $IY?B !?B;?E# :?>!
EXB;CZ $I@OCIQ;>@E#
#@@XEFB>F?D IC A>CD SEW?W=;<
T>F>2 R?<=IQ?FB;?@ !2 AB>CDEF?;CG HI=C J2 KDIBN?O P2 !;@!
N?BQ>C2 % $B>@ R;Q?ST?@>O UIB &I<>@;V>F;IC !W??<=
!IXB :;O2 5IQWXF?B !W??<= >CD
作者简介
&>CZX>Z?# KWB;@# /[\3# \"+$&/3]S/^\2
6]7 :;<=>?@ !2 AB>CDEF?;C# ,>BN?O P2 !;@N?BQ>C2 K $B>@
:?F=IDI@IZO UIB !W??<= &I<>@;V>F;IC Y;F= :;