学
密
号:07081129
级:
哈尔滨工程大学本科生毕业论文
基于 VC++ 的语音信号处理
院(系) 名 称:信息与通信工程学院
专 业 名 称:电子与信息工程
学 生 姓 名:许桂月
指 导 教 师:卢志茂 教授
2011 年 6 月
基
于
V
C
+
+
的
语
音
信
号
处
理
许
桂
月
哈
尔
滨
工
程
大
学
哈尔滨工程大学本科生毕业论文
哈尔滨工程大学本科生毕业论文
基于 VC++ 的语音信号处理
院 (系) 名 称:信息与通信工程学院
专 业 名 称:电子与信息工程
学
号:07081129
学 生 姓 名:许桂月
指 导 教 师:卢志茂 教授
2011 年 6 月
哈尔滨工程大学本科生毕业论文
摘 要
通过语音传递信息是人类最重要、最有效、最常用、最方便的交换信息
的形式,因此,语音信号是人们构成思想疏通和感情交流的最主要手段。尤
其是在现在科学技术快速发展的时代,人们的需求日益增加,语音信号处理
问题将越来越深入的进入到人们实际应用中。它直接与办公、交通、金融、
公安、商业、旅游等行业相接轨,这就使得语音信号处理技术成为一种重要
的知识被人们掌握。
正是基于这样的实际应用,本课题实现了基于 VC++的语音信号处理方
案。语音信号是非平稳信号,但在短时范围内其具有保持不变,基本平稳的
特性,本方案中采用加窗分帧的处理方法进行预处理,在一帧范围内语音信
号可视为平稳信号。这里主要从时域和频域两个方面实现语音信号的处理。
时域分为短时能量、短时过零率、短时幅度等参数,频域主要是频谱、功率
谱和倒谱的分析。同时,还必须具备语音信号的采集,即录音、放音等功能。
关键词:加窗分帧;时域处理;频域处理;录音
哈尔滨工程大学本科生毕业论文
ABSTRACT
Transmission of
information through the speech signal
is the most
important, effective, popular and convenient form of communication. Therefore,
speech signal is the uppermost method of communication of people’s thoughts
and feelings. Especially in modern society, speech signal processing will be
increasingly in-depth into the practical application because of the development of
technology and people’s demmond. Speech signal processing will directly link to
office, communication, finance, public security, commerce, tourism and other
industries, which makes it as an important knowledge that people should access
to.
It is based on the practical application, this paper implements the speech
signal processing program based on Visual C++. Speech signal is non-stationary
signal, but in short time it has remained unchanged and stationary. The program
uses the sub-frames with window function as preprocessing method, because in
one frame speech signal could be regarded as stationary signal. This paper mainly
implements the speech signal processing both from the time domain and
frequency domain. The time domain process includes short-term energy,
short-term zero crossing rate, short-term range and other parameters. While the
frequency domain process mainly includes spectrum, power spectrum and
cepstrum analysis. Besides, the signal acquisition have also been comprised, such
as recording and playback.
Key Words: sub-frames with window function; process from time domain;
process from frequency domain; recording
哈尔滨工程大学本科生毕业论文
目 录
第 1 章 绪论..................................................................................................... 1
1.1 语音信号处理概述................................................................................ 1
1.2 语音信号处理的发展............................................................................ 2
1.3 课题背景及意义.................................................................................... 4
1.4 论文研究的主要内容............................................................................ 6
第 2 章 语音信号处理基本原理................................................................7
2.1 语音信号处理的基础知识.................................................................... 7
2.2 语音信号的数字化和与处理................................................................ 9
2.2.1 语音信号处理的数字化............................................................. 9
2.2.2 预处理....................................................................................... 10
2.3 语音信号的时域分析.......................................................................... 11
2.3.1 短时能量及短时平均幅度....................................................... 11
2.3.2 短时过零率............................................................................... 12
2.4 语音信号的频域分析.......................................................................... 13
2.4.1 语音信号的短时谱................................................................... 13
2.4.2 短时反傅立叶变换..................................................................................... 14
2.4.3 短时功率谱............................................................................... 15
2.4.4 倒谱........................................................................................... 15
2.5 本章小结.............................................................................................. 17
第 3 章 方案的设计..................................................................................... 18
3.1 系统总体设计方案.............................................................................. 18
3.2 Visual C++的软件平台....................................................................... 19
3.3 系统平台功能的实现.......................................................................... 20
哈尔滨工程大学本科生毕业论文
3.4 本章小结.............................................................................................. 20
第 4 章 语音信号处理的实现.................................................................. 22
4.1 设计界面.............................................................................................. 22
4.2 语音文件的显示.................................................................................. 22
4.2.1 语音文件的基本信息............................................................... 22
4.3 打开文件并显示波形.......................................................................... 24
4.4 录音机功能.......................................................................................... 25
4.5 信号的加窗处理.................................................................................. 28
4.5.1 加窗前的波形显示................................................................... 28
4.5.2 加窗后的波形显示................................................................... 30
4.6 信号的时域处理.................................................................................. 31
4.6.1 短时过零率分析....................................................................... 32
4.6.2 短时振幅分析........................................................................... 33
4.6.3 短时能量分析........................................................................... 34
4.7 语音信号频域分析.............................................................................. 35
4.7.1 语音信号的短时傅立叶变换处理........................................... 35
4.7.2 语音信号的短时反傅立叶变换............................................... 36
4.7.3 语音信号的倒谱分析............................................................... 37
4.8 本章小结............................................................................................... 38
结论 ..................................................39
参考文献 ..............................................41
致谢 ..................................................43
哈尔滨工程大学本科生毕业论文
第 1 章 绪论
通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息
的形式。语言是人类特有的功能,声音是人类常用的工具,是相互传递信息
的最主要手段。因此,语音信号是构成人们思想疏通和感情交流的最主要的
途径。并且,由于语言和语音与人的智力活动密切相关,与社会文化和进步
紧密相连,所以它具有最大的信息容量和最高的智能水平。尤其是在现在科
技化发展的社会,人类已经进入信息化的时代,用现代手段研究语音处理技
术,使人们能够更加有效地生产、传输、存储、获取和应用语音信息,这对
于促进社会的发展具有十分重要的意义。
1.1 语音信号处理概述
语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学
科。它的目的一是要通过处理得到一些反映语音信号重要特征的语音参数以
便高效的传输或存储语音信息;二是要通过某种运算达到某种用途的要求。
语音信号已经发展了很长的一段历程,如今已经形成了很多数字信号处理方
面的理论和算法,如数字滤波器、快速傅里叶变换等这些都是语音信号处理
的基本理论和技术。随着科学技术的发展,语音信号处理又有了进一步的进
展。矢量量化是一种数据压缩和编码技术,广泛应用于语音编码、语音合成、
语音识别和说话人识别等领域;隐马尔科夫模型作为一种语音信号的统计模
型,正在语音处理的各个领域中获得广泛的应用;人工神经网络在语音分析、
语音数据压缩、语音合成、语音识别以及说话人识别等语音信号处理的各个
领域得到应用。
语音信号处理从理论研究到产品的开发走过了很长得一段历程,并且取
得了长足的进步。它直接与办公、交通、金融、公安、商业、旅游等行业的
实际应用相接轨,并且有望成为下一代操作系统和应用程序的用户界面。语
音信号处理技术除了实用性强外,它还与信息科学中最活跃的学科保持密切
1