本科毕业设计(论文)
(申请工学学士学位论文)
题 目:基于 matlab 语音信号时域分析系统设计
院 系:
专业年级:
学生姓名:
指导教师:
学号:
2021 年 03 月 20 日
基于 matlab 语音信号时域分析系统设计
摘 要
语音信号作为人类重要的信息传递媒介,在我们的日常交流总通过声音来传递消息的场
合占 90%以上。所以通过对语音信号的深入分析至关重要,传统意义上的语音信号分析分为
时域和频域两大类,但频域分析需要对整个声音端进行复杂的数学三角函数运算分析,极大
得消耗和占用了 DSP 等数字信号处理器的运算力。时域分析的运算复杂度较频域分析较低,
在大多数场合时域分析也起着至关重要的作用。通过对时域的语音信号特征分析是对后续的
语音聚类,特诊识别提取的基础,所以本文重点对语音信号的时域特征分析展开研究。
本文首先介绍了语音信号的采集过程和相关理论,如人体的发声原理,语音信号的基本
组成和各类特点,之后重点对语音信号的时域特征进行了详细的阐述,包括语音信号的分窗
预处理,短时能量,短时平均过零率以及短时自相关函数等。最后基于 matlab 软件通过对
自己的录音文件进行了上述的时域分析对比,结果表明编写的 matlab 运算处理函数能够对
语音信号的时域特征进行较为详尽的分析和处理。
关键词:语音信号,时域分析,matlab 仿真
Design of time-domain analysis system for
speech signal based on matlab
ABSTRACT
As an important information transmission medium for human beings, voice signals account
for more than 90% of the occasions where our daily communication always transmits messages
through sound. Therefore, the in-depth analysis of the voice signal is very important. In the
traditional sense, the voice signal analysis is divided into two categories: time domain and
frequency domain. However, frequency domain analysis requires complicated mathematical
trigonometric function analysis on the entire sound end. It has to consume and occupy the
computing power of DSP and other digital signal processors. The computational complexity of
time domain analysis is lower than that of frequency domain analysis, and time domain analysis
also plays a vital role in most occasions. The analysis of the speech signal characteristics in the
time domain is the basis for the subsequent speech clustering and special diagnosis recognition
extraction, so this article focuses on the time domain characteristic analysis of the speech signal.
This article first introduces the collection process of speech signals and related theories, such
as the principle of human vocalization, the basic composition and various characteristics of speech
signals, and then focuses on the time domain characteristics of speech signals in detail, including
the windowing of
short-term average
zero-crossing rate and short-term autocorrelation function, etc. Finally, based on the matlab
software, the above-mentioned time-domain analysis and comparison of the own recording files
are carried out. The results show that the written matlab arithmetic processing function can
analyze and process the time-domain characteristics of the speech signal in more detail.
speech signals. Preprocessing,
short-term energy,
Key words: Speech signal, time domain analysis, matlab simulation
目录
目录................................................................................................................................................... 4
1 绪论................................................................................................................................................1
1.1 课题研究背景及意义...................................................................................................1
1.2 国内外研究现状............................................................................................................ 2
1.3 本课题主要研究内容...................................................................................................3
2 语音信号的采集及理论..........................................................................................................4
2.1 语音信号的采集过程...................................................................................................4
2.2 语音信号理论.................................................................................................................4
2.3 本章小结..........................................................................................................................5
3 语音信号的时域分析.............................................................................................................. 6
3.1 语音信号分窗.................................................................................................................6
3.2 语音信号短时能量...................................................................................................... 6
3.3 语音信号平均过零率...................................................................................................7
3.4 语音信号短时自相关函数..........................................................................................7
3.5 本章小结..........................................................................................................................8
4 基于 matlab 的语音信号采集和时域分析仿真..............................................................9
4.1MATLAB 软件介绍............................................................................................................ 9
4.2 基于 MATLAB 的语音信号采集..................................................................................9
4.3 语音信号时域分析仿真...........................................................................................10
5 结论..............................................................................................................................................17
谢辞................................................................................................................................................. 19
参考文献........................................................................................................................................20
1 绪论
1.1 课题研究背景及意义
语音信号是人类交换信息的最方便,最常用,最有效和最重要的方式。语音
在人类交流中被广泛使用,它是人类的一种独特能力。当今人类文明的发展离不
开语言。因此,传达人的思想和情感的最重要方法是通过语音信号表达它们。而
且,人们的心理活动与语言活动密切相关,因此可以看出,社会文化和技术进步
也与语言密切相关,因此语言具有较高的智力水平和信息量。今天,人类学已经
进入科学技术飞速发展的时代。利用现代技术研究语音信号使人类有可能更有效
地识别,传输,存储和应用语音信息,这对促进现代发展至关重要。意义。
在人类科学和技术发展期间,特别是自计算机诞生以来,一直存在着使计
算机能够``理解''人类语言的具有前瞻性的想法,这也是计算机的诞生,这是人类
最大的梦想渴望掌握。作为社会语音识别应用领域中的一个研究热点,从理论研
究到产品开发,语音信号获取和分析的研究已经进行了数十年,并取得了长足的
进步。它与各个领域中与语音相关的各种高级实际应用领域集成在一起,并且可
以成为操作系统的最新应用程序和用户界面。因此,对语音信号的收集和分析的
研究可以被视为具有无限商业价值的最具挑战性的任务。
随着信息科学技术的飞速发展,语音识别,语音合成,语音编码和说话人识
别等技术逐渐成熟并被引入实际应用。本主题研究的语音信号的收集和分析的重
要性在于,使语音信号的后续处理或应用更加方便,以使用捕获的语音信号的特
征参数,获得信号的某些特征参数以进行有效传输或存储;或者通过一些处理操
作来人工合成语音,识别讲话者,识别语音内容等等,以满足特定目的的需求。
如果将虚拟软件系统构建为平台,则可以使用无处不在的计算机中的声卡来收集
语音信号,这不仅简化了该方案的可行性,而且大大降低了实施成本。
语音信号处理是一个新兴的交叉学科,是语音和数字信号处理两个学科的结
合产物。与认知科学、心理学、语言学、计算机科学、模式识别和人工智能学科
有着密切的联系。语音信号处理技术的发展依赖于这些学科的发展,语音信号处
理技术的进步也将促进这些领域的进展。语音信号处理目的是得到一些语音特征
参数,以便高效的传输或存储,或通过某种处理以达到特定目的,如语音合成,
辨识出讲话者、识别出讲话的内容等。随着现代科学技术和计算机技术的发展,
除了人与人的自然语言的沟通,人机对话和智能机领域也开始使用语言。这些人
造的语言拥有词汇,语法,语法结构和语义内容等。综上选择语音信号的时域分
析具有极强的现实意义,能够广泛应用于后续的语音特征提取,匹配应用中。
1
1.2 国内外研究现状
语音信号处理的研究可以追溯到 1876 年的铃铛电话发明,它是第一个使用
声电和电声转换技术实现真正意义上的长距离语音传输的技术。 1939 年,荷
马·杜德利(Homer Dudley)提出并成功开发了第一台 Voder,这为语音生成模
型奠定了基础,该模型在语音信号处理领域具有划时代的意义。在 1940 年代,
出现了一种特殊的语音装置。它使您可以使用摘要图表达语音的时变频谱,以获
取“可见语言”。 1984 年,Huskins 实验室成功开发了一种语音回放机器,该
机器可以自动将手写的频谱图翻译成语言并执行语音合成。随着计算机的出现,
语音分析方法可以在计算机上完成。在这段时间内,语音信号处理在基础研究或
技术应用中得到了发展。语音信号现在可以分为三个主要分支:语音编码,语音
识别和语音合成技术。
语音信号是一个恒定的时变信号,其中包含各种有效信息。在诸如语音合成,
语音识别和语音改进之类的语音处理中,有必要收集语音中包含的各种信息。出
于兴趣。对语音信号进行相关分析以收集相关特征参数以进行进一步处理语音信
号的处理或处理,例如语音增强中嘈杂语音的背景噪声抑制一种获得相对“干净”
音调的系统。语音信号分析的目的是快速有效地捕获并表示信号 contained 中包
含的有效信息。语音信号,根据语音信号研究的参数类型分析分为时域分析和频
率域分析。
在语音信号的处理中,语音信号分析非常重要,应以此为基础。总结表达语
音信号本质的特征参数,然后使用收集的特征参数执行有效的语音合成和语音识
别以及其他相关处理。语音合成的音质好坏,语音识别率级别还取决于语音信号
分析的准确性和精度。所以对于语音信号从理论上讲,语音信号分析占据非常重
要的位置。
在语音分析的整个过程中,都使用了“短期分析技术”。从全时的角度来看,
由于语音信号的特征和语音信号的特征参数会随时间变化,因此,这是一个静态
过程,因此不能采用处理静态信号的技术。但由于口腔肌肉的运动引起不同的声
音,因此会在声道中产生特定的形状。作为回应,就言语的频率而言,这种类型
的口腔肌肉运动非常缓慢,因此一方面,语音信号是时变信号,但是在相对较短
的时间范围内(通常是在 10ms-30ms 之内),语音信号的特性保持相对稳定,
因此它可以在此期间,语音信号被转换为半稳定状态过程,该信号在短时间内它
具有短期稳定性。因此,根据语音信号分析,将语音信号分为一个部分分析和总
结其特征参数。每个部分称为“框架”,通常称为框架是 10ms 到 30 ms。总的
来说,收集的时间是由每个帧的特征参数形成的序传。
本文也以上述分析为准则,通过对语音信号进行预处理,加窗分帧处理分析。
2
1.3 本课题主要研究内容
上文中提及的语音信号技术其基础为对语音信号的分析和处理,对于语音信
号的时域特征而言其本质为数学工具对的应用,在数学领域的特征分析提取中近
年来有着众多的科研工作者进行了深入的研究和拓展,限于个人能力和时间,本
文中对较为基础的语音信号短时过零率,短时能量,短时自相关特征等进行编写
程序,分析实现结果并借助时域的相关分析和求取得到的结果进行语音信号的参
数分析和语音信号的基音周期分析。
3
2 语音信号的采集及理论
2.1 语音信号的采集过程
为了收集语音信号,首先要了解一些相关的理论知识。
数字信号的采样理论:也称为奈奎斯特理论。即,在模拟信号/数字信号转
换过程中,当语音信号的采样频率大于或等于 fs 语音信号频率的 fmax 时,数字
信号将信息保留在原始语音中采样后完全发出信号。在典型的实际应用中,请确
保采样频率信号的最大频率是 5-10 倍。
语音信号的采样间隔即采样频率:计算机每秒采集的音频信号数,即录音设
备为一秒预先选择声音信号的次数。当它很高时,这是正确的,自然的声音就会
恢复。它用来形容好的声音是用于测量声卡质量和声音文件的声音信号。例子在
许多情况下,选择语音只是时间问题电脑会做到的媒体报道的信息越多,该语言
就越有可能反映角色。大声噪声与采样频率之间存在一定的关系。根据模型定理,
只有当样本显示语音符号的次数超过两倍时,可以制作数字语音符号来显示语音
符号声音更接近原始声音。多选是衡量声卡收集,录制和恢复音频文件的一种方
法。
采样位数:用于测量声音波动参数的采样值或采样值,即,声卡在收集和播
放语音文件时使用的数字信号的二进制位数。当采样位数较高时,对语音信号的
能量细节也可以采集得更加准确,但是当采样位数增加时,其一需要更加高精度
的模拟到数字的转换芯片,其成本将大大增加;其二采集到的语音信号所占用的
存储空间也将大大增加,尤其在语音信号需要通信时,极大得占用了通信带宽,
所需的通信时间也将急剧增加;最后当设备的采样位数增加时,其采样频率必将
造成一定程度的下降,所以两者各自矛盾,所以通常我们在实际应用中需要多方
面考虑实际的场景和相关的需求进行综合考虑。
在本设计中将利用 matlab 软件进行采集电脑的麦克风输入的一段音频信号
进行分析和处理。
2.2 语音信号理论
根据中学物理知识可以知道声音是由于震动所产生对的,由呼吸运动和声带
振动形成的这种物理现象会产生声音。首先空气从肺部释放到喉咙,通过声带进
入声带,最后从口腔发出声波。这样,发出声音并形成音调。声门的左侧(声带)
称为“声门系统”。该工作负责在声门的右侧产生激发振动以及“辐射系统”和
“声道”。当说出不同类型的语音时,声道和激发态是不同的。
4