nn语音技术
\![/⑥6@@蛔@嗡响⑥0⑥⑨妙
文章编号:1002—8684(2007)06—0050—03
基于LPC的语音谱分析
·论文·
(1.中国海洋大学信息科学与工程学院,山东青岛266003;2.青岛理工大学,山东青岛266033)
田玉静1,2,姬光荣1,左红伟2
【摘 要】介绍了自回归模型、线性预测编码原理及其参数算法。对实际语音信号进行线性预测编码分析实验,重
点讨论了实际语音信号线性预测时自回归模型参数求取及模型阶数确定,MATLAB仿真绘出了功率谱图。分析实
验残差,研究表明线性预测编码分析对短数据的频谱分辨率效果明显。
【关键词】自回归模型;线性预测编码分析;谱估计
【中图分类号】TP912.34
【文献标识码】A
Study on Speech Spectral Estimation Based on LPC Analysis
TIAN Yu-jin91一,JI Guang-ron91,ZUO Hong-wei2
(1.CoHege of Information Science and Engineering,China Ocean University,Qingdao Shandong 266003,China;
2.Qingdao Technological University,Qingdao Shandong 266003,China)
【Abstract】r11le AR(Auto Regressive)model and LPC(Linear Prediction Coding)are introduced.How to define the
parameters and steps in testing the speech signal
is
discussed. A spectral analysis of MATLAB simulation is
presented.By analyzing the residual,the researching result shows a good effect on the frequency resolution
of the
spectral estimation by means of LPC analysis using short data.
【Key words】AR model;LPC analysis;Levinson-Durbin algorithm;Yule-walker method;spectral estimation
1 引言
2 全极点AR模型原理及参数算、法[1-3]
语音信号和其他信号一样,可用时域和频域的方
法来分析处理。但语音信号有着自身的特殊性和特点。
语音技术的研究涉及众多领域和学科,从系统的观点
来理解人类语音的产生、传输、接收和理解,是深入研
究语音技术的关键。语音处理技术应用广泛,根据应
用方向的不同,理论基础和实际处理方法也不相同。
语音技术研究发展过程中人们提出了多种模型、方法
和概念来表达、模拟和研究语音的特征和产生机理,
其中最为成功的是基于发音原理的声道模型和线性
预测编码(Linear Prediction Coding,LPC)方法。LPC
分析是进行语音分析的有效技术之一,它提供了1组
简洁的模型参数,这组参数能够比较精确地表征语音
信号的频谱幅度,而且获得这些参数所需的计算量
。相对较小。语音信号(除鼻音)经加窗处理后,短时间
信号近似于平稳随机过程,采用全极点自回归(Auto
Regressive,AR)模型可很好地描述,得到良好的谱估
计。LPC(基于AR模型)特征值在语音编码和识别领域
有着重要的应用价值,在压缩编码等领域有着非常广
阔的应用前景。
巨囵垒宴熊妻!塑!生苤剑鲞复§塑
万方数据
菇(n)+∑掣(n一矗)=∑咖(凡一南)
(1)
眦喘=岳=粉
Q=O,do=1时,得到AR模型
H(z)=——L一
1+∑叼^
㈣
(3)
语音技术^n
够⑥6@@妇@响响⑨0⑥翊V
r(O)
r(1)
r(O)…r(p-2)
r(1)…r(p-1)
r(p一1)r(p一2)…r(O) 斗 尺(1)
R(2)
R(p)
(9)
i
;
‘.
;
用白噪声激励一个有参模型,即埘(n)服从均值为
o,方差为£的高斯过程,则
2
B(,)≤lH(ej“)I
Rx(z)------书:H(z)H(1/z)
(4)
(5)
式(9)中r(x)为信号的自相关阵,R(茗)为信号与期望
通过归一化do=l,设输入的方差为《,构造1个有参信
响应的互相关阵。由式(9)可知,语音信号特征值与AR
号模型嗍,模型参数定义集由{a1,a2,…,a;蕺}给出。在
利用模型法进行谱估计时,先假设所讨论的随机过程
服从某一具有有限多参数的模型,再利用随机序列值
(数据)估计模型的参数,然后将估计出的模型参数代
人该模型的理论功率谱密度(Power Spectral Pensity,
PSD)公式[式(4)],得到所需的谱估计。
模型具有很好的拟合性,由此可以求出P个预测系数
a。因为式(9)中的自相关矩阵具有对称性、Toeplitz性
和非负定性,可以通过求解方程,解得P个预测系数。
通过LPC分析,由若干帧语音可以得到若干组LPC参
数[31,每组参数形成1个描绘该帧语音信号的特征值,
该值与AR模型拟合,即可得到参数功率谱估计。
由于平稳随机过程的自相关阵具有托布列兹
4实际语音LPC分析实验
(Toeplize)性[51,利用矩阵的嵌套和递归,发展出相应的
标准普通话清音语声信号如图2所示。
Levinson-Durbin递归算法,其不但大大简化了运算量,
而且十分便于程序(Matlab)实现,具有很强的实际应
用意义。
3
LPC分析原理
用过去P个时刻语音采样值的线性组合,以最小
预测误差来预测语音信号下一时刻的采样值,称为对
语音信号的P阶线性预测。设s(n)(n=0,1,…,Ⅳ二1)为
1帧语音采样序列,则第乃个语音样值s(n)的P阶线
性预测值为
;(n):一∑as(n—i)
i=l
4.1语音信号预处理
(6)
对实际信号频谱预分析可以获得先验信息,以便
对预测谱估计效果分析评价。语音信号预处理过程为:
其中,P是预测阶数;呸(i=1,2,…,p)为线性预测系数。
(1)预加重,语音信号经过高通滤波器,滤波器函
在P阶预测情况下,1帧语音信号用P个ai系数组成P
数为
维矢量表示,该参数在语音编码、语音增强、语音识别
日0):1一舷~,
0.90≤口≤1.00
(10)
中有着非常重要的作用。预测误差e(n)表示为
取a=O.95,经过预加重,使谱的包络平坦,以降低数值
e(n)哥(n)一;(n)哥(n)+∑as(删)=Zas(n-i)(7)
凸l
i--O
敏感度。经过此次预加重,02=0时的频谱比c£,=订时的
频谱大约提高2~5 dB。
式(7)中,%=1。在均方误差最小准则下,线性预测系数
(2)进行帧块处理,加汉明窗,去掉开始和结束的
q(i=1,2,…,P)的选择应使预测误差的均方值E[e‘(n)]
最小。令型掣:0,(i:1,2,3,…,p)可推得
oa
不连续性。图3为清音语声信号采样后,加汉明窗语
音帧的频谱,信号以采样频率,=6.67 kHz采样后,用
MATLAB对实际语音帧求解,所得到的短时傅里叶变
11
乞akr(i-k)=-R(i),江1,2,3,…,P
k=l
由式(8)可得P个方程,写成矩阵形式为
换曲线。
(8)
4.2 LPC分析及谱估计
LPC分析流程如图4所示。用白噪声激励一个全
极点滤波器,产生一个AR信号。利用Yule—walker方
万方数据
垒塞丝箜婴生簦型鲞蔓!塑园
际信号与LPC预测信号[AR(7)]取样比较结果。通过
比较实际语音信号与预测信号可知,采用LPC(AR模
型)进行语音信号频谱分析是切实有效的。
f
鲎
∞
3
●
S
臻
瓣
髁 ~ 蝴 孵栅 喇 雠㈣ 啾 岫 嘲
1
’1I
f/kHz
图5
AR(7)信号的PSD估计
程从信号中构造AR模型:当白噪声激励全极点滤波
器产生的AR信号的统计特性与实际语音信号相匹配
时,求解Yule—walker方程就能得出全极点滤波器的参
数。MATLAB中的ARYULE函数,可完成用Levinson—
Durbin算法求解Yule—walker方程。由求得的模型参
数,得出AR模型的系统函数为
H0)=—————_r————jL————了————丁—}
1—3.501 0z‘+6.7856z‘-9.1435z。+8.7643z。一
1
_———1——二—二r_r
1
(1 1)
根据估计得出的模型参数,利用
矗(,)=吒2_—L1
1+∑三。纠
t一1
(12)
5 结语
计算分析过程中的PSDta,计算时取tr:=l,即服从(o,1)
分布的高斯白噪声。根据上述分析,选择p=7,用AR(7)
模型与数据拟合,同时考虑到计算量在p=5时的截断,
选用AR(4)拟合数据。图5和图6分别为AR(7)和
AR(4)信号的PSD估计。由图5和图6可知:AR(4)模
型的功率谱不能很好地区别双峰,由增加模型阶数实
验初步认为AR(7)模型与实际数据相匹配。图7为实
全极点AR(p)模型谱估计的性能改善程度[61,依赖
于模型匹配程度及模型阶数,采用AR模型进行频谱
估计时,阶数P的选择特别关键,如果P太小,PSD的
结构会被平滑掉;p增大,分析计算量加大。如何恰当
选择阶数是LPC语音谱分析的关键。LPC法之所以成
为目前进行语音特征分析的最有效、最重要的方法之
一,原因在于:
(下转第63页)
国堕查熊箜!坚生苤§!鲞蔓§塑
万方数据
曛声控镧n
则⑥6§@@⑨响舒⑥b
最小的区域内,同时当误差传感器个数与次级板个数
el-liar LMS algorithm and its印plication
to
the active
相同时,即可取得很好的控制效果。
4 结语
control of sound【J].IEEE Trans.on Acoustics,Speech,
and Signal Processing,1987,35(10):l 423-1 434.
【51 SOMMERFELDT S D.Multi-channel adaptive control of
笔者从理论上研究了有源声学结构中误差传感器
structural vibration[J].Noise Control Engineering Journal,
的最优布放规律。结果表明:(1)误差传感器应布放在
1991(37):77-89.
有源控制后测量面声压最小的区域内;(2)测量面声压
[6】ELLIOTr s J,BOUCHER C C,NEISON P A.The
最小的区域一般分布在次级结构的周围;(3)误差传感
器的个数与次级结构的个数相等时,即可取得良好的
有源控制效果。
文中有源声学结构中误差传感器最优布放规律的
理论研究,定量地给出了误差传感器的最优布放方式,
指出了在有源声学结构中,不需要大量的误差传感器
来获得误差信号,即可达到可接受的控制效果。这就使
实际的有源声学结构控制系统的通道数减少。进一步
为有源声学结构应用于在实际的结构声辐射问题中奠
定了基础。
参考文献
behavior of a multiple channel active control system[J1.
IEEE Tran&on Signal Processing,1992,40(5):l 041—1 052.
【7】ELGRICHI Y,ZEHEB E.Stability of multichannel sound
control system[C]//Proceedings
of IEEE:Visual Image
Signal Processing.【S.1.】:IEEE Press,1997,144(1):1-7.
【8】陈克安,尹雪飞.基于近场声压传感的结构声辐射有源
控制【J】.声学学报,2005,30(1):63—68.
【9】陈克安.自适应声学结构声压误差传感策略【J].振动工
程学报,2004,17(3):301—305.
【10】BAI M R,TSAO M.Estimation of sound power of baffled
planar sources using radiation matrices[J].Journal of the
Acoustic Society of America.,2002,l 12(3):876—883.
【1】陈克安.有源噪声控制[M】.北京:国防工业出版社,2003.
【1l】尹雪飞,陈克安.有源声学结构:概念、实现及应用fJ】.
【2】FULLER C R,ELLIOTr S J,NELSON P A Active control
振动工程学报,2003,16(3):261—268.
of vibration[M].San Diego:Academic Press,1996.
【12l潘浩然.有源声学结构系统配置优化设计【D】.西安:西
‘【3】陈克安.自适应声学结构声压误差传感策略【J】.振动工
北工业大学,2006.
程学报,2004,17(3):301—305.
【责任编辑】史丽丽
【收稿日期】2007-02-09
【4]ELLIOTr S J,STHOTHERS I M,NELSON P A A multiple
(上接第52页)
Hill.20【)o.
(1)有效解决了短时平稳信号模型化问题,可把
【2】扬福生.随机信号分析[M].北京:清华大学出版社,1990.
语音信号看成是由全极点模型产生的;
[3】吴兆熊.数字信号处理【M].1版.北京:国防工业出版
(2)能很好地逼近共振峰,提供谱估计;
社。1985.
(3)提供的语音信号模型参数(如基音、共振峰、
[4】张玲华,宝玉,杨震.基于LPC分析的语音特征参数研究
谱、声道面积函数等)简洁而准确,计算量较小,便于实
及其在说话人识别中的应用【J].南京邮电学院学报,
时处理;
(4)可用于低数码率传输的环境;
(5)将LPC参数形成的模型参数储存起来,在语
音识别中提高识别率和减少识别时间。
基于LPC分析的语音建模在压缩编码中极具研
究价值,其在语音处理和识别等领域有着非常广阔的
应用前景。
参考文献
2005,25(6):2—5.
【5】屈微,贺平.性预测分析在说话人特征提取中的应用研
究【J】.计算机工程与应用,2005,13:l 002—8 331.
【6】ATAL B S,SCHROEDER M R.Linear prediction analy—
sis of speech based on a all-pole representation[J].Jou卜
nal of the Acoustical Society of America,1978,64(5):
l 310-1 318.
作者简介
田玉静,硕士研究生,研究方向为信息信号处理;
【1]MANOLAKIS D G,INGLE V K,KOGON S M.Statistical
姬光荣,博士生导师,教授。
and adaptive signal processing[M].New York:McGraw—
【责任编辑1潘浩然
【收稿日期】2007-03-04
万方数据
垒查麓曼塑!生蔓!!堂篁!塑叵习
基于LPC的语音谱分析
作者:
田玉静, 姬光荣, 左红伟, TIAN Yu-jing, JI Guang-rong, ZUO Hong-wei
作者单位:
田玉静,TIAN Yu-jing(中国海洋大学,信息科学与工程学院,山东,青岛,266003;青岛理工大
学,山东,青岛,266033), 姬光荣,JI Guang-rong(中国海洋大学,信息科学与工程学院,山东
,青岛,266003), 左红伟,ZUO Hong-wei(青岛理工大学,山东,青岛,266033)
刊名:
电声技术
英文刊名:
AUDIO ENGINEERING
2007,31(6)
年,卷(期):
参考文献(6条)
1.MANOLAKIS D G;INGLE V K;KOGON S M Statistical and adaptive signal processing 2000
2.扬福生 随机信号分析 1990
3.吴兆熊;黄振兴;黄顺吉 数字信号处理 1985
4.张玲华;宝玉;杨震 基于LPC分析的语音特征参数研究及其在说话人识别中的应用[期刊论文]-南京邮电学院学报
2005(06)
5.屈微;贺平 性预测分析在说话人特征提取中的应用研究[期刊论文]-计算机工程与应用 2005(13)
6.ATAL B S;SCHROEDER M R Linear prediction analysis of speech based on a all-pole representation[外
文期刊] 1978(05)
本文读者也读过(9条)
1. 纪友芳.刘桂斌.JI You-fang.LIU Gui-bin 一种改进的线性预测语音编码技术及实现[期刊论文]-计算机工程与
应用2009,45(15)
2. 卢珞先.刘建辉.黄涛.LU Luo-xian.LIU Jian-hui.HUANG Tao 两种改进型LPC特征参数对语音识别效果的影响
[期刊论文]-电声技术2005(10)
3. 史水平.李世作 线性预测编码(LPC)技术及其在音频文件上的应用[期刊论文]-现代电子技术2004,27(4)
4. 江波.张江鑫.JIANG Bo.ZHANG Jiang-xin 线性预测编码技术及其在G.729中的应用研究[期刊论文]-浙江工业大
学学报2009,37(2)
5. 朱东勇.赵知劲.吴杰 TETRA语音编解码的ACELP[期刊论文]-杭州电子工业学院学报2001,21(6)
6. 姚波.黄永强 语音信号的线性预测分析原理及算法分析[期刊论文]-硅谷2009(13)
7. 曾毓敏.吴镇扬.ZENG Yu-min.WU Zhen-yang 基于倒谱修正模型的语音基音检测算法[期刊论文]-南京理工大学
学报(自然科学版)2007,31(4)
8. 刘建新.曹荣.赵鹤鸣 一种LPC改进算法在提取耳语音共振峰中的应用[期刊论文]-西华大学学报(自然科学版)
2008,27(3)
9. 黄高扬.贾珈.蔡莲红 基于LPC 谱的汉语韵母感知度量的研究[会议论文]-2010
本文链接:http://d.g.wanfangdata.com.cn/Periodical_diansjs200706014.aspx