logo资料库

基于波束形成法的麦克风阵列语音增强技术研究.pdf

第1页 / 共96页
第2页 / 共96页
第3页 / 共96页
第4页 / 共96页
第5页 / 共96页
第6页 / 共96页
第7页 / 共96页
第8页 / 共96页
资料共96页,剩余部分请下载后查看
中文图书分类号:TN912.3 密 级:公开 UDC:39 学 校 代 码:10005 硕 士 学 位 论 文 MASTERAL DISSERTATION 论 文 题 目:基于波束形成法的麦克风阵列语音增强技 术研究 论 文 作 者:陈浩 学 科:信息与通信工程 指 导 教 师:鲍长春 论文 提交 日期:2013 年 4 月
UDC:39 中文图书分类号:TN912.3 学校代码: 10005 学 号:S201002072 密 级: 公开 北京工业大学工学硕士学位论文 题 目: 基于波束形成法的麦克风阵列语音增强 技术研究 MICROPHONE ARRAY SPEECH ENHANCEMENT BASED ON THE BEAMFORMING METHOD 英 文 题 目: 论 文 作 者 : 陈浩 学 科 : 信息与通信工程 研 究 方 向 : 语音与音频信号处理 申 请 学 位 : 工学硕士 指 导 教 师 : 鲍长春教授 所 在 单 位 : 电子信息与控制工程学院 答 辩 日 期 : 2013 年 6 月 授 予 学 位 单 位 : 北京工业大学
独 创 性 声 明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研 究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他 人已经发表或撰写过的研究成果,也不包含为获得北京工业大学或其它教育机构 的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均 已在论文中作了明确的说明并表示了谢意。 签 名: 陈浩 日 期: 2013.6.18 关于论文使用授权的说明 本人完全了解北京工业大学有关保留、使用学位论文的规定,即:学校有权 保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部 分内容,可以采用影印、缩印或其他复制手段保存论文。 (保密的论文在解密后应遵守此规定) 签 名: 陈浩 导师签名: 鲍长春 日 期: 2013.6.18
本文得到了北京市自然科学基金项目、北京市教育委员会科技发 展计划重点项目(KZ201110005005)、北京市属高等学校人才强教计划 资助项目、华为技术有限责任公司以及北京工业大学第十届研究生科 技基金项目(ykj-2012-7284)的资助。
摘要 摘 要 麦克风阵列语音增强技术在语音相关的应用中有着十分重要的作用。双麦克 风系统作为麦克风阵列的一种特殊形式,由于其成本较低并且易于实现,成为麦 克风阵列增强研究的热点并拥有广泛的应用领域。 本文以波束形成法为基础研究几种适用于宽带信号的双麦克风语音增强算 法,并最终将该算法与 3G 通信网络中的 3GPP(The 3rd Generation Partnership Project) AMR-WB(Wideband Coding of Speech at around 16kbit/s using Adaptive Multi-Rate Wideband)宽带语音编码标准相结合,以提高移动通信系统的噪声消 除性能和语音质量。 本文通过对波束形成法衍生得到的基于相位差的滤波器(Phase-error Based Filter, PBF) 及 基 于 最 优 修 正 对 数 幅 度 谱 (Optimally-Modified Log-Spectral Amplitude, OM-LSA)估计器的单声道语音增强方法的性能分析,提出一种融合的 双麦克风语音增强算法。该算法首先提出一种基于相位差的后验信噪比估计方 法,并采用基于加权欧式失真测度的幅度谱估计器代替维纳滤波器,随后将 PBF 算法与 OM-LSA 算法的增益函数按照最大化噪声抑制准则进行融合,进而得到 一种改进的相位差滤波器(Improved PBF, IPBF),以消除音乐噪声并提高算法的 整体噪声消除性能。 为了进一步消除 IPBF 算法的增强语音在目标语音不存在时的残留噪声问 题,本文从噪声的频谱特征角度进行研究,提出一种针对嘈杂人声(babble 噪声) 的改进方法。该方法基于感知线性预测特征计算目标语音存在概率,并采用该概 率修正 IPBF 算法的增益函数,进而减少在 babble 噪声环境下的残留噪声。 鉴于 IPBF 算法在目标语音不存在时残留噪声较多,而针对 babble 噪声的消 除算法缺少一定的普适性,本文提出一种基于先验知识的双麦克风语音增强算 法。首先,该算法采用子带相位差作为特征,通过线下训练获得分别对应目标语 音存在与不存在情况的两个高斯混合模型,随后在增强阶段,根据贝叶斯准则计 算当前帧的语音存在概率,并把目标语音存在概率与 IPBF 算法相结合,进而得 到一种能够有效消除残留噪声的改进 IPBF 方法。 本文采用分段信噪比提升,谱失真,PESQ(Perceptual Evaluation of Speech Quality)等指标对所提语音增强算法性能进行测试。针对不同的算法,测试环境 包括会议室环境、手机通信环境和车载系统环境。测试结果表明,本文所提出的 双麦克风语音增强算法获得较好的噪声消除效果,算法性能优于参考算法。 I 
北京工业大学工学硕士学位论文 关键词:麦克风阵列语音增强;双麦克风;相位差;感知线性预测;先验知识 II 
分享到:
收藏