logo资料库

浊音清音判定和激励信号.doc

第1页 / 共1页
资料共1页,全文预览结束
浊音/清音判定和激励信号 浊音/清音判定用于控制接收端激励函数的形式,一般说来,浊音比较好表 示,清音在本质上是随机的,鉴于这个特点,时域语音信号的零交点计数在浊音 /清音分类上有很大作用。混和的浊音和清音激励已经研究出了一些成果。近来, 多波段混和浊音也在发展。脉冲激励普遍用于浊音,由于它在间隔的开始时能量 太大,造成了比较高的峰值—均方根上,所以对固定的 b 位数—模输出,语音质 量下降。 浊音是 LPC 系统中最容易出问题的部分,确定是浊音还是清音很困难,而 不准确的分类大大降低语音品质。如果语音过多地被归为清音,重构的语音听起 来就像呼吸声,如果语音过多地归为浊音,重构起来就像嗡嗡声。实际上,即使 浊音也不是遍布整个频段,浊音段通常有 2~3kHz 的频谱范围。但高频不会周期 性出现。因此,LPC 中的浊音激励总有嗡嗡声是因为高频时周期不自然。 像前面所说的那样,浊音的传统脉冲激励造成合成语音与输入语音相比有很 大的动态范围,而它们的能量是相同的。这就造成了高的峰值—均方根比。对于 实际通信设备和数—模转换,两者的信号都必须有相同的动态范围,所以合成语 音必须按比例减少,这样就会丢掉时域波形的低幅值信号,从而使输出语音的品 质降低,将激励信号的能量分布到间隔期的大范围内,可以避免这个问题。可以 先将脉冲激励送入全通滤波器,然后用全通滤波器的输出作为语音合成器的激 励。全通滤波器可以有 2~8 个极点,并有恒定放大响应和非线性的非最小值相位, 脉冲的能量被分散到几个样本(20~60)中,没有破坏语音合成器的放大响应。实 验结果表明,使用全通滤波器相对于直接脉冲激励而言,有效地降低了峰值—均 方根比,明显提高了合成语音的品质。 另一种方法是采用产生固定激励函数的方式分散脉冲能量,美国国家标准 LPC-10(参看 6.3 节和 Papamichalis 1987)采用这个方法。
分享到:
收藏