logo资料库

数字语音信号的处理 数字信号处理课设.doc

第1页 / 共37页
第2页 / 共37页
第3页 / 共37页
第4页 / 共37页
第5页 / 共37页
第6页 / 共37页
第7页 / 共37页
第8页 / 共37页
资料共37页,剩余部分请下载后查看
摘 要
Abstract
目 录
1 绪 论
1.1 课题的背景与意义
1.2 国内外研究现状
1.3 本文主要工作
1.4本文的仿真软件Matlab
2 语音信号的特点与采集
2.1 语音信号的特点
2.2语音信号的采集
3 语音信号的分析
3.1基于MATLAB的语音信号时域特征分析
3.2基于MATLAB的语音信号频域特征分析
3.2.1 原理分析
由于语音信号是随着时间变化的,通常认为,语音是一个受准周期脉冲或随机噪声源激励的线性系统的输出。输出
分析第15帧其中第一峰值出现在第2个样点,窗长为512(64ms),抽样频率为11KHz,说明基因频
总 结
致 谢
最后,再次感谢信息学院所有的老师,感谢他们四年以来对我的栽培与教养
参 考 文 献
语音信号的特征提取 作者:李杨 指导老师:詹恩奇 摘 要 语音信号的采集与分析技术是一门涉及面很广的交叉科学,它的应用和发展与语音学、 声音测量学、电子测量技术以及数字信号处理等学科紧密联系。其中语音采集和分析仪器的 小型化、智能化、数字化以及多功能化的发展越来越快,分析速度较以往也有了大幅度的高。 本文简要介绍了语音信号采集与分析的发展史以及语音信号的特征、采集与分析方法,并通 过 PC 机录制自己的一段声音,运用 Matlab 进行仿真分析,最后加入噪声进行滤波处理,比 较滤波前后的变化。 关键词:语音信号,特征提取, Matlab
Audio signal acquisition and analysis Teacher guidance:zhan enqi Author: li yang Abstract Speech signal acquisition and analysis techniques are a wide range of cross-scientific , Its application and development of voice study, sound measurement study, electronic measuring technology, and digital signal processing disciplines, such as close contact。Collection and analysis of voice one of the small-scale equipment, intelligence, digital and multi-functional development of more and more quickly, faster than the previous analysis has been substantially high。This paper introduces the voice signal acquisition and analysis of the history of the development, as well as the characteristics of speech signal,Collection and analysis methods,Recording machine through the PC section of my own voices,the use of Matlab for simulation analysis,finally add the noise filter to deal with,comparison of filter before and after Change。 Keywords:audio signal, acquisition and analysis,MATLAB
目 录 摘 要 .................................................................................................................................................... Abstract................................................................................................................................................ 目 录.................................................................................................................................................... 论 ........................................................................................................................................ 1 绪 1.1 课题的背景与意义 .............................................................................................................. 1.2 国内外研究现状 .................................................................................................................. 1.3 本文主要工作 ...................................................................................................................... 1.4 本文的仿真软件 Matlab...................................................................................................... 2 语音信号的特点与采集 .................................................................................................................. 2.1 语音信号的特点 .................................................................................................................. 2.2 语音信号的采集 ................................................................................................................... 3 语音信号的分析 .............................................................................................................................. 3.1 基于 MATLAB 的语音信号时域特征分析 ....................................................................... 3.2 基于 MATLAB 的语音信号时域特征分析 ....................................................................... 3.3 基于 MATLAB 的语音信号 LPC 分析............................................................................. 总 结.................................................................................................................................................... 致 谢 .................................................................................................................................................... 参 考 文 献........................................................................................................................................ 附录一: .............................................................................................................................................. 附录二: .............................................................................................................................................. 附录三: ..............................................................................................................................................
1 绪 论 1.1 课题的背景与意义 通过语音传递倍息是人类最重要、最有效、最常用和最方便的交换信息的形式。语言是 人类持有的功能.声音是人类常用的工具,是相互传递信息的最主要的手段。因此,语音信 号是人们构成思想疏通和感情交流的最主要的途径。并且,由于语言和语音与人的智力活动 密切相关,与社会文化和进步紧密相连,所以它具有最大的信息容量和最高的智能水平。现 在,人类已开始进入了信息化时代,用现代手段研究语音信号,使人们能更加有效地产生、 传输、存储、获取和应用语音信息,这对于促进社会的发展具有十分重要的意义。 让计算机能听懂人类的语言,是人类自计算机诞生以来梦寐以求的想法。随着计算机越 来越向便携化方向发展,随着计算环境的日趋复杂化,人们越来越迫切要求摆脱键盘的束缚 而代之以语音输人这样便于使用的、自然的、人性化的输人方式。作为高科鼓应用领域的研 究热点,语音信号采集与分析从理论的研究到产品的开发已经走过了几十个春秋并且取得了 长足的进步。它正在直接与办公、交通、金融、公安、商业、旅游等行业的语音咨询与管理.工 业生产部门的语声控制,电话、电信系统的自动拨号、辅助控制与查询以及医疗卫生和福利 事业的生活支援系统等各种实际应用领域相接轨,并且有望成为下一代操作系统和应用程序 的用户界面。可见,语音信号采集与分析的研究将是一项极具市场价值和挑战性的工作。我 们今天进行这一领域的研究与开拓就是要让语音信号处理技术走人人们的日常生活当中,并 不断朝更高目标而努力。 语音信号采集与分析之所以能够那样长期地、深深地吸引广大科学工作者去不断地对其 进行研究和探讨,除了它的实用性之外,另一个重要原因是,它始终与当时信息科学中最活 跃的前沿学科保持密切的联系.并且一起发展。语音信号采集与分析是以语音语言学和数字 信号处理为基础而形成的一门涉及面很广的综合性学科,与心理、生理学、计算机科学、通 信与信息科学以及模式识别和人工智能等学科都有着非常密切的关系。对语音信号采集与分 析的研究一直是数字信号处理技术发展的重要推动力量。因为许多处理的新方法的提出,首 先是在语音信号处理中获得成功,然后再推广到其他领域。 1.2 国内外研究现状 语音信号的采集与分析作为一个重要的研究领域,已经有很长的研究历史[1]。但是它的 快速发展可以说是从 1940 年前后 Dudley 的声码器(vocoder)和 potter 等人的可见语音 Visible Speech)开始的。1952 年贝尔(Bell)实验室的 Davis 等人首次研制成功能识别十个英语数字的
实验装置。1956 年 Olson 和 Belar 等人采用 8 个带通滤波器组提取频谱参数作为语音的特征, 研制成功一台简单的语音打字机。20 世纪 60 年代初由于 Faut 和 Steven 的努力,奠定了语 音生成理论的基础,在此基础上语音合成的研究得到了扎实的进展。 20 世纪 60 年代中期 形成的一系列数字信号处理方法和技术,如数字滤波器、快速博里叶变换(FFT)等成为语音 信号数字处理的理论和技术基础。在方法上,随着电子计算机的发展,以往的以硬件为中心 的研究逐渐转化为以软件为主的处理研究。然而,在语音识别领域内,初期有几种语音打字 机的研究也很活跃,但后来已全部停了下来,这说明了当时人们对话音识别难度的认识得到 了加深。所以 1969 年美国贝尔研究所的 Pierce 感叹地说“语音识别向何处去?”。 到了 1970 年,好似反驳 Pierce 的批评,单词识别装置开始了实用化阶段,其后实用化 的进程进一步高涨,实用机的生产销售也上了轨道。此外社会上所宣传的声纹(Voice Print) 识别,即说话人识别的研究也扎扎实实地开展起来,并很快达到了实用化的阶段。到了 1971 年,以美国 ARPA(American Research Projects Agency)为主导的“语音理解系统”的研究计 划也开始起步。这个研究计划不仅在美国园内,而且对世界各国都产生了很大的影响,它促 进了连续语音识别研究的兴起。历时五年的庞大的 ARPA 研究计划,虽然在语音理解、语 言统计模型等方面的研究积累了一些经验,取得了许多成果,但没能达到巨大投资应得的成 果,在 1976 年停了下来,进入了深刻的反省阶段。但是,在整个 20 世纪 70 年代还是有几 项研究成果对语音信号处理技术的进步和发展产生了重大的影响。这就是 20 世纪 70 年代初 由板仓(Itakura)提出的动态时间规整(DTW)技术,使语音识别研究在匹配算法方面开辟了新 思路;20 世纪 70 年代中期线性预测技术(LPC)被用于语音信号处理,此后隐马尔可夫模型 法(HNMM)也获得初步成功,该技术后来在语音信号处理的多个方面获得巨大成功;20 世 纪 70 年代未,Linda、Buzo、Gray 和 Markel 等人首次解决了矢量量化(VQ)码书生成的方法, 并首先将矢量量化技术用于语音编码获得成功。从此矢量量化技术不仅在语音识别、语音编 码和说话人识别等方面发挥了重要作用,而且很快推广到其他许多领域。因此,20 世纪 80 年代开始出现的语音信号处理技术产品化的热溯,与上述语音信号处理新技术的推动作用是 分不开的。 20 世纪 80 年代,由于矢量量化、隐马尔可夫模型和人工神经网络(ANN)等相继被应用 于语音信号处理,并经过不断改进与完善,使得语音信号处理技术产生了突破性的进展。其 中,隐马尔可夫模型作为语音信号的一种统计模型,在语音信号处理的各个领域中获得了广 泛的应用。其理论基础是 1970 年前后,由 Baum 等人建立起来的,随后,由美国卡内基梅 隆大学 (CMU)的 Baker 和美国 IBM 公司的 Jelinek 等人将其应用到语音识别中。由于美国贝
尔实验室的 Babiner 等人在 20 世纪 80 年代中期,对隐马尔可夫模型深人浅出的介绍,才使 世界各国从事语音信号处理的研究人员了解和熟悉,进而成为一个公认的研究热点,也是目 前语音识别等的主流研究途径。 进入 20 世纪 90 年代以来,语音信号采集与分析在实用化方面取得了许多实质性的研 究进展。其中,语音识别逐渐由实验室走向实用化。一方面,对声学语音学统计模型的研究 逐渐深入,鲁棒的语音识别、基于语音段的建模方法及隐马尔可夫模型与人工种经网络的结 合成为研究的热点。另一方面,为了语音识别实用化的需要,讲者自适应、听觉模型、快速 搜索识别算法以及进一步的语言模型的研究等课题倍受关注。 1.3 本文主要工作 本文简要介绍了语音信号采集与分析的发展史以及语音信号的特征、采集与分析方法, 并通过 PC 机录制自己的一段声音,运用 Matlab 进行仿真分析,最后加入噪声进行滤波处理, 比较滤波前后的变化。第 2 章主要介绍语音信号的特点与采集,仿真主要是验证奈奎斯特定 理。第 3 章主要是对语音信号进行时域、频域上的分析,如短时功率谱,短时能量,短时平 均过零率,语谱图分析等等。最后是对语音信号的线性预测分析 1.4 本文的仿真软件 Matlab MATLAB 是美国 MathWorks 公司出品的商业数学软件,用于算法开发、数据可视化、 数据分析以及数值计算的高级技术计算语言和交互式环境,主要包括 MATLAB 和 Simul ink 两大部分[4]。 MATLAB 是矩阵实验室(Matrix Laboratory)的简称,和 Mathematica、Maple 并 称为三大数学软件。它在数学类科技应用软件中在数值计算方面首屈一指。MATLAB 可 以进行矩阵运算、绘制函数和数据、实现算法、创建用户界面、连接其他编程语言的 程序等,主要应用于工程计算、控制设计、信号处理与通讯、图像处理、信号检测、 金融建模设计与分析等领域。 MATLAB 的基本数据单位是矩阵,它的指令表达式与数学、工程中常用的形式十分 相似,故用 MATLAB 来解算问题要比用 C,FORTRAN 等语言完相同的事情简捷得多,并 且 mathwork 也吸收了像 Maple 等软件的优点,使 MATLAB 成为一个强大的数学软件。在 新的版本中也加入了对 C,FORTRAN,C++,JAVA 的支持。可以直接调用,用户也可以将 自己编写的实用程序导入到 MATLAB 函数库中方便自己以后调用,此外许多的 MATLAB 爱好者都编写了一些经典的程序,用户可以直接进行下载就可以用。
2 语音信号的特点与采集 2.1 语音信号的特点 通过对大量语音信号的观察和分析发现,语音信号主要有下面两个特点: ①在频域内,语音信号的频谱分量主要集中在 300~3400Hz 的范围内。利用这个特点, 可以用一个防混迭的带通滤波器将此范围内的语音信号频率分量取出,然后按 8kHz 的采样 率对语音信号进行采样,就可以得到离散的语音信号。 ②在时域内,语音信号具有“短时性”的特点,即在总体上,语音信号的特征是随着 时间而变化的,但在一段较短的时间间隔内,语音信号保持平稳。在浊音段表现出周期信号 的特征,在清音段表现出随机噪声的特征。 下面是一段语音信号的时域波形图(图 2.1)和频域图(图 2.2),由这两个图可以看出语音 信号的两个特点。 0.6 0.4 0.2 0 -0.2 -0.4 -0.6 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 -0.8 0 0.5 1 1.5 2 2.5 Time(s) 3 3.5 4 4.5 5 0 0 0.5 1 Frequency(Hz) 1.5 2 2.5 x 104 图 2.1 语音信号时域波形图 图 2.2 语音信号频域波形图 2.2 语音信号的采集 在将语音信号进行数字化前,必须先进行防混叠预滤波,预滤波的目的有两个:①抑制 输入信导各领域分量中频率超出 fs/2 的所有分量(fs 为采样频率),以防止混叠干扰。②抑制 50Hz 的电源工频干扰。这样,预滤波器必须是一个带通滤波器,设其上、下截止颜率分别 是 fH 和 fL,则对于绝大多数语音编译码器,fH=3400Hz、fL=60~100Hz、采样率为 fs=8kHz; 而对丁语音识别而言,当用于电话用户时,指标与语音编译码器相同。当使用要求较高或很 高的场合时 fH=4500Hz 或 8000Hz、fL=60Hz、fs=10kHz 或 20kHz。 为了将原始模拟语音信号变为数字信号,必须经过采样和量化两个步骤,从而得到时间 和幅度上均为离散的数字语音信号。采样也称抽样,是信号在时间上的离散化,即按照一定 时间间隔△t 在模拟信号 x(t)上逐点采取其瞬时值。采样时必须要注意满足奈奎斯特定理,
即采样频率 fs 必须以高于受测信号的最高频率两倍以上的速度进行取样,才能正确地重建 波它是通过采样脉冲和模拟信号相乘来实现的。下图时一段语音信号在采样频率 44.1KHz 情况下的频谱图。 0.4 0.2 0 -0.2 -0.4 0 200 150 100 50 0 0 原 始 信 号 1 2 3 4 5 0.5 1 1.5 2 图 2.3 采样频率 44.1KHz 情况下的频谱图 6 x 104 2.5 x 104 由图可知,这段语音信号的频率主要集中在 1KHz 左右,当采样频率为 44.1KHz 时,由 于采样频率比较大,所以采样点数就越密,所得离散信号就越逼近于原信号,频谱也没有发 生混叠。
分享到:
收藏