浊音/清音判定和激励信号
浊音/清音判定用于控制接收端激励函数的形式,一般说来,浊音比较好表
示,清音在本质上是随机的,鉴于这个特点,时域语音信号的零交点计数在浊音
/清音分类上有很大作用。混和的浊音和清音激励已经研究出了一些成果。近来,
多波段混和浊音也在发展。脉冲激励普遍用于浊音,由于它在间隔的开始时能量
太大,造成了比较高的峰值—均方根上,所以对固定的 b 位数—模输出,语音质
量下降。
浊音是 LPC 系统中最容易出问题的部分,确定是浊音还是清音很困难,而
不准确的分类大大降低语音品质。如果语音过多地被归为清音,重构的语音听起
来就像呼吸声,如果语音过多地归为浊音,重构起来就像嗡嗡声。实际上,即使
浊音也不是遍布整个频段,浊音段通常有 2~3kHz 的频谱范围。但高频不会周期
性出现。因此,LPC 中的浊音激励总有嗡嗡声是因为高频时周期不自然。
像前面所说的那样,浊音的传统脉冲激励造成合成语音与输入语音相比有很
大的动态范围,而它们的能量是相同的。这就造成了高的峰值—均方根比。对于
实际通信设备和数—模转换,两者的信号都必须有相同的动态范围,所以合成语
音必须按比例减少,这样就会丢掉时域波形的低幅值信号,从而使输出语音的品
质降低,将激励信号的能量分布到间隔期的大范围内,可以避免这个问题。可以
先将脉冲激励送入全通滤波器,然后用全通滤波器的输出作为语音合成器的激
励。全通滤波器可以有 2~8 个极点,并有恒定放大响应和非线性的非最小值相位,
脉冲的能量被分散到几个样本(20~60)中,没有破坏语音合成器的放大响应。实
验结果表明,使用全通滤波器相对于直接脉冲激励而言,有效地降低了峰值—均
方根比,明显提高了合成语音的品质。
另一种方法是采用产生固定激励函数的方式分散脉冲能量,美国国家标准
LPC-10(参看 6.3 节和 Papamichalis 1987)采用这个方法。