logo资料库

PESQ算法的详细介绍文档.doc

第1页 / 共10页
第2页 / 共10页
第3页 / 共10页
第4页 / 共10页
第5页 / 共10页
第6页 / 共10页
第7页 / 共10页
第8页 / 共10页
资料共10页,剩余部分请下载后查看
1. 语音评估模块完成的基本功能,实现方法:
1.1 基本功能
1.2. 各种语音评价体系的定义
1.2.1 MOS 的基本原理
1.2.2 PSQM (P.861)标准或算法
1.2.3 PESQ (P.862)标准或算法
2.PESQ算法原理
2.1 ESQ算法的大体流程
3.ITU862协议简介
3.1 术语定义
3.2 影响可靠性和一致性的几个因素
3.3 参考信号的特性
3.4 结果分析
3.4.1 测量结果取平均值
3.4.2 PESQ测量结果的可靠性
3.4.3 PESQ测量的精确度值
3.4.5 结果的报告
4.语音评估模块硬件部分系统框图:
5.语音评估模块实现软件流程
语音评估模块预研究 作者:王 敏 荣 时间:2011 年 1 月
目录 2.1 1. 语音评估模块完成的基本功能,实现方法:........................................................................3 1.1 基本功能 ............................................................................................................................ 3 1.2. 各种语音评价体系的定义.............................................................................................. 3 1.2.1 MOS 的基本原理 .................................................................................................... 3 1.2.2 PSQM (P.861)标准或算法 ....................................................................................4 1.2.3 PESQ (P.862)标准或算法 ....................................................................................5 2.PESQ 算法原理 ...............................................................................................................................5 ESQ 算法的大体流程............................................................................................... 5 3.ITU862 协议简介........................................................................................................................... 6 3.1 术语定义 .......................................................................................................................... 6 3.2 影响可靠性和一致性的几个因素 ....................................................................................6 3.3 参考信号的特性.............................................................................................................. 7 3.4 结果分析 .......................................................................................................................... 7 3.4.1 测量结果取平均值 ................................................................................................ 7 PESQ 测量结果的可靠性 .....................................................................................7 3.4.2 PESQ 测量的精确度值......................................................................................... 8 3.4.3 3.4.5 结果的报告 .......................................................................................................... 8 4.语音评估模块硬件部分系统框图: ............................................................................................ 9 5.语音评估模块实现软件流程 ...................................................................................................... 10
1. 语音评估模块完成的基本功能,实现方法: 1.1 基本功能 语音评估模块主要用于对移动通信无线网络中传输的语音做出质量的评价,它关注终端 用户感受,目前评估语音质量的方式主要三类:主观、客观和估计,这三种评估方式以客观 评估最为准确。 目前主要的评价方法有如下 Abbreviations Full spelling Chinese explanation 缩略语 英文全名 中文解释 MOS PESQ PSQM PAMS Mean Opinion Score 平均意见分 Perceptual evaluation of 语音质量感观评价 speech quality Perceptual Speech Quality 感知语音质量测度 Measurement Perceptual Analyse Measurement Sytem 感知分析测度系统 国际电联定义的 PESQ 算法,可以客观的评测通信网络的语音质量。 1.2. 各种语音评价体系的定义 1.2.1 MOS 的基本原理 语音质量主观评价介绍 ITU-T 建议 P.830 描述了一种对语音的主观评定方法:MOS(Mean Opinion Score)方法。 由不同的人分别对原始语料和经过系统处理后有衰退语料进行主观感觉对比,得出 MOS 分 值,最后求平均值。该测试值符合人类听话时对语音质量的感觉,因而目前得到广泛应用, MOS 得分采用五级评分标准,其方法是,由数十名试听者在相同信道环境中试听并给予评分, 然后对评分进行统计处理,求出平均得分。由于主观和客观上的种种原因,每次试听所得的
评分会有波动。为了减小波动的误差,除了试听者人数要足够多之外,所测语音材料也要足 够丰富,试听环境也应尽量保持相同。 由于试听者对语音质量的主观感觉往往是和其注意力集中程度相联系的,因而,对应于 主观评定等级,还有一个收听注意力等级(Listening Effect Scale)。下表给出主观评定 等级的质量等级、分数和相应的收听注意力等级。 主观评定等级表如下表: 表二 MOS 主观评价等级表 质量等级 分数 收听注意力等级 优 良 5 4 可完全放松,不需要注意力 需要注意,但不需明显集中注意力 满意(正常) 3 中等程度的注意力 差 劣 2 1 需要集中注意力 即使努力去听,也很难听懂 尽管正式的主观收听测试是最值得信赖的评价方法,并且能对任何编解码算法以及网络 性能进行评价,但是在实际应用中该测试结果可能会因人而异,测试过程中需要对收听环境、 收听者等因素进行非常严格的设置和控制,需要较多的人员参与,语音素材的内容也需要很 小心的选取,因为内容可能会影响到测试结果,因此正式主观测试显得十分耗时且花费较大, 于是后来产生了多种客观的质量评价方法,比如:PSQM,PESQ,P862.1 等。 1.2.2 PSQM (P.861)标准或算法 PSQM (Perceptual Speech Quality Measurement) 仍以 MOS 的 5 个级别作为标准,所 不同的是其对每一个级别都以百分比的方式做出了差对最差(%PoW =Percent Poor or Worse) 和好对最好(%GoB = Percent Good or Better)的进一步描述。PSQM 方法并未摆脱原始的 人类主观评估,只是作了进一步的说明。目前,有人使用计算机产生波形文件(Wave File), 通过比较其通过网络传输前后的变化,计算出与 PSQM 中相对应的级别及好坏程度,以此作 为评估语音质量的方法。感知语音质量测度(PSQM),在 1996 年被国际电联 ITU-T 采纳为 P.861 建议,1998 年,一个基于归一化块测度(MNB)的可选系统作为附件添加到 P.861 中。
1.2.3 PESQ (P.862)标准或算法 PESQ(Perceptual Evaluation of Speech Quality)算法是由英国电信和 KPN 共同开 发出来,并在 2001 年被 ITU 采纳为 P.862 规范。它比较声源信号和退化信号并给出一个类 似人工听力评估测试的 MOS 分值,属于插入式(Intrusive)测试算法。它有着强大的功能, 不仅能测试象解码器这样的网络单元的效果,也能测量端到端的声音质量;同时,能着重针 对不同的信号退化原因,如编解码失真、错误、丢包、延时、抖动和过滤,给出测试结果。 在当前业界已商用的、已标准化的算法中,是最优的算法。 2.PESQ 算法原理 2.1 ESQ 算法的大体流程
PSQM 和 PAMS 测量方法都需要发送一个语音参考信号通过电话网络,在网络的另一端采 用数字信号处理的方式比较样本信号和接收到的信号,进而估算出网络的语音质量。PESQ 结合了 PSQM 和 PAMS 的优势,针对 VoIP 和混合的端到端应用作了改进,并针对 MOS 和 MOS-LQ 计算方法做了修改。最开始这些方法被用于测量编码算法,后来也逐渐应用到 VoIP 网络系 统的测量中。 3.ITU862 协议简介 TU-T P.862 建议书假设的是一种标准的 IRS 类型的窄带电话机,该话机在 300 Hz 以下 和 3100 Hz 以上都有很强的衰减) 3.1 术语定义 (1)源语音/信号:必须根据 ITU-T 建议书 P.830 进行录音和存储 (2)参考语音/信号:ITU-T P.862 建议书的算法所要使用的语音信号 (3)输入语音/信号:在信号插入点送到被测系统中的信号。它从参考语音信号衍生出来 的,它可能是与参考信号完全相同的,或者可能是经过处理的,例如,将它与噪声迭加在一 起。 (4)劣化语音/信号:已经通过了被测系统的参考语音信号。 (5) 信号插入路径:由 ITU-T P.862 建议书算法的参考信号和被称为插入点的输入接口 之 成 间的连接路径(有线、电子等)组 (6) 信号取出路径:由取出点(与被测网络的输出接口)和 ITU-T P.862 建议书算法之间 的连接路径组成 3.2 影响可靠性和一致性的几个因素 (1) 呼叫次数 (2)测量的次数 (3)语音样本的长度 (4)所使用的语音的类型 (5)测量的目的
(6)传输信道的特性 (7) 可用于作测量的时间 3.3 参考信号的特性 1.信号长度 要求长度多数在 8-12S 以内的信号,ITU-T P.862 建议书可以应用于长度达 30 s 的语音,建议每一语音样本的长度应该为 8-30 s,这包含了在发声前、发声后和发声 之间的任何静默期 2.时间结构 语音素材应该延续 8 s,并且包含两个短句,中间以至少 1 s 的静默期分隔开 3.激活语音电平 建议所有的参考语音文件应该以–30 dBov 的电平进行存储,虽然在计算 PESQ 值 时,激活语音电平已经归一化了,但是仍建议作为劣化信号给 PESQ 算法存储的 4.谈话人和语音内容的变化 建议参考语音应该至少包含两个女性和两个男性谈话人,每一个人说不同的句子。 以后,用这些不同的样本所得到的 P.862.1 的分数必须按条件评估,进行平均处理。 5.预滤波 ITU-T 建议使用附件 D/P.830 中所规定的经过修正的 IRS 发送特性 6.噪声本底 3.4 结果分析 3.4.1 测量结果取平均值 在计算平均值或作其它统计之前,应该首先将各个测量结果变换到 MOS-LQO 3.4.2 PESQ 测量结果的可靠性 当在某种应用上使用了该算法,而且该算法已经在同一种应用上进行过培训、测试 和验证时,则 P.862/P.862.1 的测量结果的可靠性是 95%
3.4.3 PESQ 测量的精确度值 使用了三个统计指标,即相关系数,预测误差和残余误差分布 3.4.5 结果的报告 通常,应该报告 PESQ 的平均值、最大值和最小值以及计算平均值所使用的测量 次 数 MOS-LQO 平均评价分—收听质量客观评价(用客观质量技术来评估主观收听质量) MOS-LQS 平均评价分—收听质量主观评价(用取样的主观等级来直接测量收听的质 量) PESQ 语音质量的感性评定 RMS 均方根 语音质量主要有三种 ITU 标准: (1)MOS(ITU-P.800):1~5分,5分最好,属于主观评价指标; (2)PSQM(ITU-P.861):0~6.5分,0分最好,属于客观评价指标;另外,PSQM+属于 PSQM 评分标 准的扩展,评分标准与 PSQM 相同; (3)PESQ(ITU-P.862):-0.5~4.5分,4.5分最好,其中3.8被认为是传统电话网中可以接收的语 音质量,属于客观评价指标,又称之为“话音清晰度”指标;另外,PESQ_LQ 是 PESQ 评分标准 的扩展,范围为1~4.5分,更接近于 MOS 的1~5分标准。PESQ 只是测试单个方向的语音质量,不 能反应双向的声音的强度、丢包、延时、回波等。 根据国家的相应标准,要求语音质量在3.5级以上时网络丢包率须小于5%,,语音质量在3 级以上时,网络丢包率在5%~10%,如果网络丢包率在10%以上,语音质量将比较差
分享到:
收藏