基于FPGA语音识别系统设计与实现.pdf

发布时间：2022-06-14 发布人：admin 分类：说明书资料大小：2.90M 资料格式：pdf 举报版权申诉

ee423db2-d82d-49a5-abf9-f2463754cae1.pdf-第1页.png

第1页 / 共70页

ee423db2-d82d-49a5-abf9-f2463754cae1.pdf-第2页.png

第2页 / 共70页

ee423db2-d82d-49a5-abf9-f2463754cae1.pdf-第3页.png

第3页 / 共70页

ee423db2-d82d-49a5-abf9-f2463754cae1.pdf-第4页.png

第4页 / 共70页

ee423db2-d82d-49a5-abf9-f2463754cae1.pdf-第5页.png

第5页 / 共70页

ee423db2-d82d-49a5-abf9-f2463754cae1.pdf-第6页.png

第6页 / 共70页

ee423db2-d82d-49a5-abf9-f2463754cae1.pdf-第7页.png

第7页 / 共70页

ee423db2-d82d-49a5-abf9-f2463754cae1.pdf-第8页.png

第8页 / 共70页

封面

文摘

英文文摘

声明

第1章绪论

第2章基于SOPC 的语音识别系统相关理论基础

第3章基于FPGA 的SOPC 技术与系统软硬件开发平台简介

第4章系统整体构建与功能分析

第5章基于FPGA 语音识别系统各功能模块设计与仿真

第六章基于FPGA 语音识别系统整体实现

第七章总结与展望

参考文献

攻读硕士期间科研成果

致谢

广西师范大学硕士学位论文基于FPGA语音识别系统设计与实现姓名：王明娟申请学位级别：硕士专业：电路与系统指导教师：胡维平20090401

广西师范大学硕士学位论文 I 基于FPGA语音识别系统设计与实现研究生：王明娟导师：胡维平教授专业：电路与系统研究方向：语音信号处理年级：2006级摘要近年来，语音识别研究大部分集中在算法设计和改进等方面，而随着半导体技术的高速发展，集成电路规模的不断增大与各种研发技术水平的不断提高，新的硬件平台的推出，语音识别实现平台有了更多的选择。语音识别技术在与DSP、FPGA、ASIC等器件为平台的嵌入式系统结合后，逐渐向实用化、小型化方向发展。本课题通过对现有各种语音特征参数与孤立词语音识别模型进行研究的基础上，重点探索基于动态时间规整算法的DTW模型在孤立词语音识别领域的应用，并结合基于FPGA的SOPC系统，在嵌入式平台上实现具有较好精度与速度的孤立词语音识别系统。本系统整体设计基于DE2开发平台,采用基于Nios II的SOPC技术。采用这种解决方案的优点是实现了片上系统，减少了系统的物理体积和总体功耗；同时系统控制核心都在FPGA内部实现，可以极为方便地更新和升级系统，大大地提高了系统的通用性和可维护性。此外，由于本系统需要大量的高速数据运算，在设计中作者充分利用了Cyclone II 芯片的丰富的硬件乘法器，实现了语音信号的端点检测模块，FFT快速傅立叶变换模块，DCT离散余弦变换模块等硬件设计模块。为了提高系统的整体性能，作者充分利用了FPGA的高速并行的优势，以及配套开发环境中的Avalon总线自定义硬件外设，使系统处理数字信号的能力大大提高，其性能优于传统的微控制器和普通DSP芯片。本论文主要包含了以下几个方面：（1）结合ALTERA CYCLONE II芯片的特点，确定了基于FPGA语音识别系统的总体设计，在此基础上进行了系统的软硬件的选择和设计。（2）自主设计了纯硬件描述语言的驱动电路设计，完成了高速语音采集的工作，并且对存储数据芯片SRAM中的原始语音数据进行提取导入MATLAB平台测试数据的正确性。整个程序测试的方式对系统的模块测试起到重要的作用。（3）完成高速定点256点的FFT模块的设计，此模块是系统成败的关键，实现高速实时的运算。（4）结合SOPC的特性，设计了人机友好接口，如LCD显示屏的提示反馈信息等等，以及利用ALTERA提供的一些驱动接口设计完成用户定制的系统。（5）进行了整体系统测试，系统可以较稳定地实现实时处理的目的，具有一定的市场潜在价值。【关键词】FPGA，SOPC，语音识别，语音采集，FFT IP核

广西师范大学硕士学位论文 IIDesign and Implementation of Speech Recognition System Based on FPGA Candidate ：Wang Ming-jian Advisor ： Hu Wei-ping professor Speciality ：Circuit and System Research Direction ：speech signal processingGrade ：2006 Abstract In the recent years，research for speech recognition mostly focuses on algorithm design and improvement.With the rapid development of semiconductor technology, scale with integrated circuit continuously enlarging, and level of all kinds of development technique continuously improving,new hardware platform protruding, there are a lot of selections on speech recognition platform. Combination with DSP、FPGA、ASIC devices which are embedded systems,speech recognition research gradually looks toward to practical development and miniaturization. Based on the research of all kinds of existing speech feature parameters and isolated words speech recognition models,the topic mainly explores the application of DTW model based on dynamic programming in the field of isolated words speech recognition, and combining with SOPC system based on FPGA, realizes a good speech recognition system with accuracy and speed. The system adopts sopc technology based on NIOS II,whole design is based on DE2 development platform.The advantages of using this solution is the implementation of on chip system and reduction of physical volume as well as the total power consumption;meanwhile the system control core realizes within the FPGA device, it could be renewal and updated conveniently,so it increases the generality and maintainability vary much.moreover,because the system needs plenty of highspeed calculation,through the design,the author makes full use of abundant hardware multiplier in Cyclone II chips,and realizes endpoint detection module of speech signal, FFT rapid fourier transform module,DCT discrete cosine transform module and so on.In order to improve whole performance of the system,the author makes full use of highspeed parallel processing advantage of FPGA and

广西师范大学硕士学位论文 IIIcustom-defined hardware components which hangs on the Avalon BUS in supporting development environment,enable the system to process digital signal efficiently, meanwhile its performance is better than traditional microcontroller and common DSP chips. This paper mainly includes the following aspects: （1）In combination with the characteristics of ALTERA CYCLONE II chips,author determined the overall design of speech recognition system Based on FPGA,and carried out systematic software and hardware selection and design on this basis. （2）Author independent designed driving circuit design in the pure hardware description language,accomplishing the highspeed speech acquisition,meanwhile extracting the speech data from SRAM and introcucing into MATLAB platform for test and measurement.The way of program testing played an important role to systematic module test. （3）Author completd the design of highspeed fixed-point 256 points FFT module,which is the key of success or failure throughout the system,realizing highspeed real-time operation. （4）Author designed man-machine interface with SOPC characteristics,such as suggesting feedback imformation on LCD,designed and finished custom-defined system which can be offered by ALTERA’s drivie interfaces. （5）Author made the whole systematic measurement,the system can quite stablely realize real-time processing,and has certain market potential value. 【Key word】FPGA，SOPC，speech recognition，speech acquisition，FFT IP core

论文独创性声明本人郑重声明：所提交的学位论文是本人在导师的指导下进行的研究工作及取得的成果。除文中已经注明引用的内容外，本论文不含其他个人或其他机构已经发表或撰写过的研究成果。对本文的研究作出重要贡献的个人和集体，均已在文中以明确方式标明。本人承担本声明的法律责任。研究生签名：日期：论文使用授权声明本人完全了解广西师范大学有关保留、使用学位论文的规定。广西师范大学、中国科学技术信息研究所、清华大学论文合作部，有权保留本人所送交学位论文的复印件和电子文档，可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外，允许论文被查阅和借阅，可以公布（包括刊登）论文的全部或部分内容。论文的公布（包括刊登）授权广西师范大学学位办办理。研究生签名：日期：导师签名：日期：

第一章绪论 1第1章绪论第1节课题来源随着语音识别理论的不断发展,一些相关的算法都达到了实用化的阶段,语音识别集成电路以其价格低,性能好,操作便捷,易于嵌入便携式产品等诸多优势获得了广阔的发展空间。语音识别芯片的发展主要经历了四个阶段：第一阶段是由多带通滤波器及线性匹配电路构成的，其早在二十世纪的八十年代初，有一组带通滤波器组成特征提取电路，线性匹配电路进行模式匹配。第二阶段，由单片机微控制器（MCU）组成的语音识别芯片，一般是八位或十六的微控制器，外围接口电路和存储芯片构成。由于CPU的运算效率不高，同时加上识别算法比较复杂，精度要求较高，因此此方案实现的指标不会太高。典型的芯片式1996年美国Senxory公司生产的RSC-146。第三阶段，由数字信号处理器组成语音识别系统，其采用定点16位DSP，外加模数接口以及存储芯片。由于运算都是采用DSP，因此运算能力强，精度高。常用的DSP芯片有TI公司的TMS320C54XX系列，AD公司的ADSP218X系列，DSPG公司开发的OAK系列等等。用DSP实现的语音识别系统可以实现孤立词特定人和非特定人语音识别，其识别词条可以达到中等词汇量。除此之外，用DSP还可以实现说话人识别以及高质量高压缩率的语音编解码功能，能实现高品质的语音合成和语音回放系统，这些都是当前语音识别专用芯片的主流。第四个阶段是将MCU或DSP结合外围接口电路，存储芯片集成在一个芯片上的SOPC系统级芯片，只要提供电源就可以实现完成的语音识别，语音采集回放等功能。这类是最近两年出现的最先进的语音识别芯片，其性价比高，功耗低。最有代表的是Sensory公司的RSC－364及Infineon公司的UniSpeechSDA80D51,国内的产品有华录润声公司TSH-8和TSH-16芯片。目前市场上面流行的几款语音识别芯片都是属于第四代语音识别芯片，通过内嵌的DSP来语音特征提取，语音识别算法，同时添加外围器件如A/D，存储器，滤波器等，最终完成完整的语音识别系统[1-3]。第2节课题研究的背景与意义鉴于实际应用，从可接受性，生产成本，实时性能方面，本课题采用了FPGA核心芯片作为核心运算处理单元，结合CYCLONE II芯片的特色，致力于高速的运算处理，把核心算法用IP核处理，建立全新的SOPC理念的语音识别芯片。众所周知，语音是人类与外界交流中最方便，最有效的工具，语音识别充分根据说话人语音波形中反映的基本生理和行为特征的语音参数来确定说话人身份。语音识别以语音为研究对象，它是语音信号处理的一个重要研究方向，是模式识别的一个分支，涉及到生理学、心理学、语言学、计算机科学以及信号处理等诸多领域，甚至还涉及到人的体态语言，其最终目标是实现人与机器进行自然语言通信。语音识别的研究工作大约开始于50年代，当时AT& T Bell实验室实现了第一个可识别

第一章绪论 2十个英文数字的语音识别系统——Audry系统。60年代，计算机的应用推动了语音识别的发展。这时期的重要成果是提出了动态规划（DP）和线性预测分析技术（LP），其中后者较好地解决了语音信号产生模型的问题，对语音识别的发展产生了深远影响。70年代，语音识别领域取得了突破。在理论上，LP技术得到进一步发展，动态时间归正技术（DTW）基本成熟，特别是提出了矢量量化（VQ）和隐马尔可夫模型（HMM）理论。在实践上，实现了基于线性预测倒谱和DTW技术的特定人孤立语音识别系统。80年代，语音识别研究进一步走向深入，其显著特征是HMM模型和人工神经元网络（ANN）在语音识别中的成功应用。HMM模型的广泛应用应归功于AT＆ T Bell实验室Rabiner等科学家的努力，他们把原本艰涩的HMM纯数学模型工程化，从而为更多研究者了解和认识。ANN和HMM模型建立的语音识别系统，性能相当。进入90年代，随着多媒体时代的来临，迫切要求语音识别系统从实验室走向实用。许多发达国家如美国、日本、韩国以及IBM、Apple、AT＆T、NTT等著名公司都为语音识别系统的实用化开发研究投以巨资[3-4]。我国语音识别研究工作一直紧跟国际水平，国家也很重视，并把大词汇量语音识别的研究列入“863”计划，由中科院声学所、自动化所及北京大学等单位研究开发。鉴于中国未来庞大的市场，国外也非常重视汉语语音识别的研究。美国、新加坡等地聚集了一批来自大陆、台湾、香港等地的学者，研究成果已达到相当高水平。因此，国内除了要加强理论研究外，更要加快从实验室演示系统到商品的转化。近年来，语音识别研究主要集中在算法设计与改进方面，而随着各种科学、技术的发展，新的硬件器件的推出，语音识别实现平台有了更多选择。随着半导体技术的高速发展，集成电路规模的不断增大与各种开发技术水平的不断提高，语音识别技术在与DSP、FPGA、ASIC等器件为平台的嵌入式系统结合后，逐渐向小型化、实用化方向发展，应用领域也越来越大。语音识别作为一项具有广泛社会效益和经济效益的现代信息技术，虽然已取得一定成就，但在面临实用化时还存在一系列问题，技术成熟、性能可靠的语音识别系统在国内外还有很大的研究空间和市场潜力，在识别的精度、速度、鲁棒性与系统的小型化等方面还有很大改进的空间。为了实现性能优良的语音识别系统，一方面需要对语音识别的理论、算法进行研究，解决并完善识别过程存在的各种问题，另一方面还应考虑简化系统的复杂度，从小型化与可实现化等方面设计合适的语音识别系统[5]。本课题的研究目的是针对语音识别实用化面临的一系列问题，通过对现有各种语音特征参数与孤立词语音识别模型进行研究的基础上，重点探索基于动态时间规整算法的DTW模型在语音识别领域的应用，并结合基于FPGA的SOPC系统，在嵌入式平台上实现具有较好精度与速度的孤立词语音识别系统。

第一章绪论 3第3节论文的内容安排一主要工作本系统整体设计基于DE2开发平台,采用基于Nios II的SOPC技术。Nios II 软核集成在FPGA内部，采用这种解决方案的优点是实现了片上系统，减少了系统的物理体积和总体功耗；同时系统控制核心都在FPGA内部实现，可以极为方便地更新和升级系统，大大地提高了系统的通用性和可维护性。此外，由于本系统需要大量的高速数据运算，在设计中作者充分利用了Cyclone II 芯片的丰富的硬件乘法器，实现了语音信号的端点检测模块，FFT快速傅立叶变换模块，DCT离散余弦变换模块等硬件设计模块。为了提高系统的整体性能，作者充分利用了FPGA的高速并行的优势，以及配套开发环境中的Avalon总线自定义硬件外设，使系统处理数字信号的能力大大提高，其性能优于传统的微控制器和普通DSP芯片。二内容安排本论文主要分为7章：第1章绪论。主要介绍了语音识别研究的背景、现状、及文章主要内容等。第2章介绍基于SOPC的语音识别系统相关理论基础。主要研究了语音特征参数提取算法原理，识别方法。第3章介绍与SOPC的孤立词识别系统相关的硬件平台DE2开发板与软件开发平台Quartus II 7.0的SOPC系统开发流程。重点介绍了系统用到的音频采集部分，存储部分，人机交互液晶显示部分。第4章介绍了基于SOPC的孤立词识别系统功能分析与系统整体框架构建。本章主要从系统角度分析孤立词识别系统的功能与具体任务。第5章介绍了孤立词识别系统设计方法实现。主要研究孤立词识别的各功能模块设计与仿真结果论证。第6章介绍了系统实现与性能指标分析。本章详细分析了系统的实现性能及系统设计资源使用情况。第7章作出工作总结与展望。本章主要介绍了研究本系统的一些收获与体会，分析设计过程的不足并提出进一步的改进途径。

分享到：

赞收藏

资料库

基于FPGA语音识别系统设计与实现.pdf

相关推荐

开发技术

热门标签

最新资料