Praat 语音软件使用手册
(http://www.praat.org)
熊子瑜
xiongziyu@163.com
北京东城区建国门内大街 5 号
中国社会科学院语言研究所
办公室电话:010-85195406
100732
谨以此献给“2004年现代语音学暑期讲习班”上的可亲可敬的
学员们,祝愿大家都能够学有所得!
目 录
一 Cool Edit Pro 录音操作初步 ..................... 1
(一)几个重要概念 ..........................................................................1
(二)Cool Edit Pro 录音操作 ..........................................................2
二 声学基础 ...................................... 9
三 频谱分析 ..................................... 27
(一)语图分析及参数设置 ............................................................27
(二)观察语图 ................................................................................29
(三)画图及参数设定 ....................................................................30
(四)频谱分析及参量设置 ............................................................34
(五)观察二维频谱 ........................................................................35
(六)二维频谱作图 ........................................................................36
四 基频分析 ..................................... 39
(一)基频分析及参数设置 ............................................................39
(二)察看基频对象 ........................................................................41
(三)基频数据的核查和修改 ........................................................42
(四)基频数据的保存 ....................................................................48
(五)基频数据的作图 ....................................................................49
(六)基频数据的获取 ....................................................................52
五 强度分析 ..................................... 55
(一)时域维度测量某个时段的强度 ............................................55
(二)察看强度对象 ........................................................................56
(三)获得强度对象的数据 ............................................................57
(四)从强度曲线换算成振幅曲线 ................................................58
(五)强度数据作图 ........................................................................58
(六)频域维度测量某个时点的某个频率位置的强度 ................62
3
(七)频域维度测量某个时点的某个带宽的能量 ........................64
(八)频域维度测量某个频段的长时全部能量 ............................64
六 共振峰分析 ................................... 67
(一)共振峰分析与参数设置 ........................................................67
(二)察看共振峰对象 ....................................................................69
(三)提取和修改共振峰数据 ........................................................71
(四)LPC 分析 ................................................................................75
(五)基于 LPC 对象测量某时间点的共振峰...............................77
(六)基于 LPC 对象分析共振峰数据...........................................78
(七)基于 LPC 对象进行语图分析...............................................79
(八)基于共振峰数据做声学元音图 ............................................80
(九)基于共振峰对象做共振峰图 ................................................80
七 语音标注 ..................................... 83
(一)新建语音标注对象 ................................................................83
(二)菜单功能介绍 ........................................................................84
(三)提取标注对象中的某个层级数据 ........................................88
(四)提取标注对象中的某个片断的标注数据 ............................90
(五)获取 TextGrid 对象的数据....................................................91
(六)标注文件作图 ........................................................................91
(七)提取标注文件的数据 ............................................................93
(八)在语音标注文件中输入国际音标 ........................................94
八 语音参数调整与合成 ........................... 97
(一)调整强度 ................................................................................97
(二)声音的剪切、复制、粘贴和清零 ........................................98
(三)声音信号的重新采样 ............................................................99
(四)声音信号的拉长和缩短,以调整语速 ..............................100
(五)调整语声的性别特性 ..........................................................101
(六)调整声音文件的超音段特征 ..............................................103
(七)滤波.......................................................................................109
(八)共振峰数据的修改 ..............................................................111
4
九 编写 Praat 的脚本程序 ........................ 113
(一)编程环境 ..............................................................................113
(二)编程语言 ..............................................................................114
(三)交互对话 ..............................................................................119
十 提取语音数据 ................................ 123
(一)提取标注数据 ......................................................................123
(二)提取音节或声韵母的音高数据 ..........................................123
(三)提取音节或声韵母的强度数据 ..........................................124
(四)提取音节或声韵母的共振峰数据 ......................................124
(五)语音数据作图 ......................................................................124
十一 语音数据的统计分析 ........................ 127
(一)相关性分析 ..........................................................................127
(二)均值比较及 T 检验..............................................................131
(三)方差分析 ..............................................................................133
(四)回归分析 ..............................................................................135
附录 脚本程序 .................................. 139
(一)提取二维频谱中某个频率位置的能量值 ..........................139
(二)提取二维频谱中前 n 个谐波峰的能量值 ..........................140
(三)提取二维频谱中各频率成分的能量值 ..............................141
(四)将共振峰频率数据提取到 TextGrid 对象中......................142
(五)将 TextGrid 对象中的共振峰数据转换成文本文件..........143
(六)制作声学元音图 ..................................................................144
(七)提取标注对象中的数据 ......................................................148
(八)修改一个音段的共振峰特性以得到一个新的声音 ..........153
(九)提取音节或声韵母的音高数据 ..........................................156
(十)提取音节的强度数据 ..........................................................160
(十一)提取音节或声韵母的共振峰数据 ..................................165
(十二)语音数据作图 ..................................................................171
5
Praat 语音软件使用手册 熊子瑜
一 Cool Edit Pro 录音操作初步
通过本节的学习,帮助您了解与录音过程有关的几个基本概念,并掌握如何
使用 Cool Edit Pro 软件的录音功能。
(一)几个重要概念
1、采样
由于声音为模拟连续信号,而计算机只能处理数字离散信号,因此要使用计
算机来分析和处理声音,就需要经历模数转换过程[Analog to Digital Converter,
即 ADC],即将模拟的连续信号转换为数字离散信号。采样就是按照一定的时间
间隔从模拟连续信号提取出一定数量的样本来,其样本值用二进制码 0 和 1 来表
示,这些 0 和 1 便构成了数字音频文件,其过程实际上是将模拟音频信号转换成
数字离散信号。
2、采样率
采样率表示了每秒对原始信号采样的次数。显然,在一秒中内采样的点越多,
获取的信息越丰富,为了复原波形,一次振动中,至少得有 2 个点的采样,要想
使采集到的信号不失真,采样频率规定至少为语音频率的 2 倍,因此要得到一个
频率为 10000 赫兹的声音,则其采样率至少得大于 20000 赫兹。采样频率越高,
数字信号的保真度越高,但同时占用的存储空间也越大。如果采样率低于高频成
分频率的两倍,则会产生低频失真、信号混淆现象。
3、采样精度
采样精度就是指存放一个采样值所使用的比特数目。当用 8 个比特(采样精
度为 8 位)存放一个采样值时,对声音振幅的分辨等级理论上为 256 个,即 0
至 255;当用 16 个比特(采样精度为 16 位)存放一个采样值时,对声音振幅的
分辨等级理论上为 65536 个,即 0 至 65535。如果您将采样精度设置为 16 位,
计算机纪录的采样值范围则为-32768 至 32767 之间的整数。
采样率和采样精度的值越大,记录的波形更接近原始信号,但同时占用的存
储空间也越大。
4、声道
声道指输入或输出信号的通道。通常用多声道来输入或输出不同的信号。如
果只需录制一个位置的一种信号时,只要使用单声道就可以了。
1
Praat 语音软件使用手册 熊子瑜
5、信噪比
信噪比指信号与噪声之间的能量比。录音时,信噪比越高越好。16 位采样
的信噪比大约是 96dB,8 位采样的信噪比大约是 48dB。在录音时,简单估计噪
音大小的办法是:当没有语声信号输入的时候,如果麦克风输入信号的振幅值超
过了 200(单位为采样值,相当于 46dB),则噪声就比较大,需要进行一定的控
制,如在比较安静的环境下录音,关闭窗户、空调、电扇等噪声源,远离电脑等
噪声源等等,选用比较好的带有屏蔽的麦克风,选用比较好的声卡等等。噪声的
振幅值越低越好,录音室里的录音一般可以控制在 10 以下(单位为采样值,相
当于 20dB)。
(二)Cool Edit Pro 录音操作
第一步,打开 Cool Edit pro 软件。初始窗口如下:
第二步:按“文件”菜单下的“新建…”按钮,会弹出下面对话框。在下图
1 的位置选择采样率 16000,在 2 的位置选择单声道,在 3 的位置选择 16 位。选
择好之后请按 4 位置的按钮“确定”。
【说明:采样率和采样精度的设置以越高越好,采样率和采样精度越高则声
音的质量越高,不过考虑到存储空间和语音信号的特点,一般可以设置为 16000
赫兹的采样率和 16 位的采样精度。如果需要录制两个不同的信号源,则使用立
体声,否则都使用单声道。】
2