语音识别GMM-HMM.pptx

发布时间：2022-06-19 发布人：admin 分类：说明书资料大小：2.64M 资料格式：pptx 举报版权申诉

6033bad8-7cd4-465a-9676-5a03c7d03983.pptx.pdf-第1页.png

第1页 / 共49页

6033bad8-7cd4-465a-9676-5a03c7d03983.pptx.pdf-第2页.png

第2页 / 共49页

6033bad8-7cd4-465a-9676-5a03c7d03983.pptx.pdf-第3页.png

第3页 / 共49页

6033bad8-7cd4-465a-9676-5a03c7d03983.pptx.pdf-第4页.png

第4页 / 共49页

6033bad8-7cd4-465a-9676-5a03c7d03983.pptx.pdf-第5页.png

第5页 / 共49页

6033bad8-7cd4-465a-9676-5a03c7d03983.pptx.pdf-第6页.png

第6页 / 共49页

6033bad8-7cd4-465a-9676-5a03c7d03983.pptx.pdf-第7页.png

第7页 / 共49页

6033bad8-7cd4-465a-9676-5a03c7d03983.pptx.pdf-第8页.png

第8页 / 共49页

文本预览

赵媛

01 语音识别简介 02 03 04 声学模型语音模型研究发展 contents

语音识别什么是语音识别语音识别（Automatic Speech Recognition， ASR）所要解决的问题是让计算机能够“听懂” 人类的语言，将语音转化成文本。语音识别是实现智能的人机交互的前沿阵地，是完全机器翻译，自然语言理解等的前提条件。

1语音识别简介

发展历史 1950 单一模式识别 1970 模式和特征分析 1980 H M M 模型被用于构建声学模型和随机语言模型 2000 计算机语音识别在 2 0 0 1 年达到 8 0 % 的准确度 1990 微处理器推出带来重大进步，开始出现语音商业应用 2010 机器学习算法和计算机性能的进步带来了更有效的训练深层神经网络（ D N N ）的方法。

基本原理音节之间有明显可感知的界限音节：汉语中一般一个汉字英语中一个元音音素或一个元音音素与辅音音素构成一音节语音信号分帧：语音信号的一定长度音素是声音的最小单位。我们学习的 2 0 个元音和 2 8 个辅音就是音素，应该分别叫 2 0 个元音音素和 2 8 个辅音音素，人们习惯把它们称为 4 8 个音标  每个 H M M 对应于一个 w o r d 或者音素（ p h o n e m e ）  在语音处理中，一个 w o r d 由若干 p h o n e m e （音素）组成；  一个 w o r d 表示成若干 s t a t e s ，每个 s t a t e 表示为一个音素

基本原理

分享到：

赞收藏

资料库

语音识别GMM-HMM.pptx

相关推荐

人工智能

热门标签

最新资料