语音识别在交通等待提醒中的应用研究毕业论文.doc
《语音识别在交通等待提醒中的应用研究毕业论文.doc》由会员分享,可在线阅读,更多相关《语音识别在交通等待提醒中的应用研究毕业论文.doc(35页珍藏版)》请在三一办公上搜索。
1、毕 业 设 计设计题目: 语音识别在交通等待提醒中的应用研究 学生姓名: 学 号: 20104873 专业班级: 电子科学与技术10-1班 指导教师: 院系名称: 电子科学与应用物理学院 目录中文摘要1英文摘要21 绪论3 1.1 设计背景3 1.2 任务目的3 1.3 设计思路32 语音识别概述5 2.1 语音识别的基本原理5 2.2 目前仍存在的问题5 2.2.1 语音识别的方言和口音问题6 2.2.2 信道问题6 2.2.3 背景噪音问题6 2.2.4 自然语音理解领域6 2.2.5 语音合成6 2.3 语音识别的基本过程6 2.4 语音识别技术的前景与发展73 基于隐马尔科夫模型的语音
2、识别系统10 3.1 语音识别的系统结构10 3.1.1 语音识别的整体层次模型10 3.1.2 语音识别的框架10 3.1.3 语音信号的产生模型10 3.2 语音信号预处理11 3.2.1 语音信号模数变换和滤波11 3.2.2 预加重12 3.3 语音特征参数提取12 3.3.1 线性预测倒谱系数LPCC12 3.3.2 MEL倒谱系数MFCC13 3.3.3 MFCC系数和LPCC系数的比较13 3.4 HMM应用于语音识别14 3.4.1 HMM模型的选取14 3.4.2 拓扑形式和状态个数选取14 3.4.3 HMM的训练15 3.5 语音识别15 3.5.1 基于HMM汉语数码孤
3、立词识别15 3.5.2 连续语音识别154 语音识别的实现17 4.1 硬件电路设计17 4.2 STC90LE52RC单片机18 4.3LD3320语音识别模块18 4.4 语音报站的实现19 4.4.1 创建MP3播放文件19 4.4.2 程序的编写19 4.4.3 程序的烧录21 4.4.4 报站的实现22结束语24致谢25参考文献26 语音识别在交通等待提醒中的应用摘要:语音识别技术Automatic Speech Recognition(ASR),其目标是将人类语言 的词汇内容转换为计算机可读的输入,例如按键、二进制编码以及字符序列。 语音识别技术是一种可以让机器通过识别和理解把语
4、音信号转变为相应的 文本或命令的高技术,也就是我们通常所说的让机器可以听懂人类的语言。 现如今,交通拥堵日趋严重,因此服务于地铁的各种电子产品也相继出现。 本文以解决乘客做过站的问题为目的,提出了将语音识别应用于交通等待提 醒的解决方案。本文中唤醒系统以STC90LE52RC单片机板和LD3320语音识 别模块为核心,辅以内存卡、MP3播放器等器件,通过对报站语音的识别来 判断所到达的站点,并对所识别的语音进行判断,实现识别特定语音给出提 醒,达到唤醒功能。 关键词:语音识别;STC90LE52RC;语音识别模块;唤醒系统 Speech Recognition In The Applicati
5、on Of Traffic Wating To RemondAbstract:The speech recognition technology automatic speech recognition(ASR),the goal is to convert the lexical of human language to computer readable input. For example,key-press the binary code and key character sequence.The speech recognition technology is to allow t
6、he machine by identifying and understanding the process of the technology of voice signal into a command or corresponding text that is let the computer understand human language .Nowdays,traffic congestion is becoming more and more serious,so the service in the various electronic products emerge as
7、the times require.This paper solves the passengers for some reason and did the sites solution to the problem,the speech recognition can be applied to traffic wating remend,the realization of a wake-up system.The wake-up system with STC90LE52RC single chip board and a speech recognition module as the
8、 core,with the memory card,audio player device.Through the recognition of speech to stop judging by the arrival of the site,and to judge the speech recognition, identification of the specific speech and give advise,to wake up function.Keywords:Speech recognition;STC90LE52RC;The speech recognition mo
9、dul;wake-up system1绪论1.1 设计背景自从人类可以制造和使用各种机器以来,人们就有一个理想,那就是让各种机器能后听懂人类的语言并能按照人的口头命令来行动,从而实现人机的语言交流。随着科学技术的不断发展,语音识别(Speech Recognition)技术的出现,使人类的这一理想得以实现,语音识别技术就是让机器通过识别和理解把语音信号转变为相应的文本或命令的高技术。语音识别是一门交叉学科,语音识别正逐步成为信息技术中人机接口的关键技术。语音识别技术与语音合成技术的结合,使人们能够甩掉键盘,通过语音命令进行操作,语音技术的应用已经成为一个具有竞争性的新兴高技术产业。当今,语音识
10、别产品在人机认交互应用中已经占到越来越大的比例。随着经济的发展和城市化进程的加剧,城市交通面临巨大的压力。而为了缓解交通的拥堵局面,各地纷纷兴建城市轨道交通,其中最主要的地铁。本文就将研究一种面向于地铁乘客的唤醒器,地铁与公交已经成为我们出行不可分割的一部分,为我们的生活提供极大的便利。但是我们有可能因为坐过站而造成不必要的麻烦。本文旨在通过语音唤醒来提醒乘客是否到站,让乘客能够避免错过站。1.2 任务目的 本文旨在模拟实现基于语音识别的地铁唤醒系统。通过对报站语音的识别,并分析其识别结果,判定是否为所需要的站点。若为所需要的结果,则系统通过语音提醒乘客到站,从而达到唤醒功能。否1.3 设计思
11、路是 唤醒语音识别 模块 识别结果 结果判断 输入 图1-1地铁乘客唤醒器流程 本文的设计流程如图1.1所示。该系统的核心是语音识别模块,首先通过程序设定需要唤醒的站点,然后利用语音识别模块对输入语音进行识别并对比识别结果,如果识别结果为设定结果,则提示到站的语音,提醒到站。若识别结果不是所需的结果则不进行唤醒并进入下一次识别状态。2 语音识别概述近些年来,随着计算机、通讯技术的飞速发展,语音识别技术的重要性进一步得以体现。语音识别技术就是让机器通过识别和理解把语音信号转变为相应的文本或命令的高技术。现在,语音技术的应用已经成为一个具有竞争力的高新技术产业,语音识别正逐步成为信息技术中人机接口
12、的关键技术。将语音识别技术应用于机器人,使机器人能够按照人的语音命令进行操作,这就是机器人听觉。机器人听觉是机器人智能水平的一个重要标志。因此,学习语音识别技术的基本原理和方法,对进一步研究开发智能机器人的功能有重要作用。2.1 语音识别的基本原理 一般的语音识别系统都采用了模式匹配的原理。从图2-1中可以看出语音识别一般分两个步骤。第一步是系统“学习”或“训练”阶段。这一阶段的任务是建立识别基本单元的声学模型以及进行文法分析的语言模型,即构建参考模式库。第二是“识别”或“测试”阶段。根据识别系统的类型选择能够满足要求的一种识别方法,采用语音分析方法分析出这种识别方法所需要的语音特征参数,按照
13、一定的准则和测度与参考模式库中的模型进行比较,通过判决得出结果。识别 模式匹配结果输入语音 预处理特征提取 参考模式库 图2-1语音识别系统的原理结构2.2 目前仍存在的问题21世纪作为“语音的世纪”除了蕴含无限的商机以外,也表明了它们存在发展的空间。概括地讲,有这样一些问题急需解决。 2.2.1 语言识别的方言和口音问题中文有八大方言区,现在很多语音识别系统,对标准普通话的识别性能很好,但是一旦有方言或者口音,性能就会马上下降。解决这个问题有着非常重要的意义,这将极大地拓展该技术的使用空间,因此必须下力气解决好这个问题。 2.2.2 信道问题我们知道在无线互联应用中,涉及到的信道种类可能会很
14、多,比如固定电话、手机、IP、网络、车载系统等等,各种各样的信道都有不同的特性。语音识别、声纹识别和语音理解如何去适应不同信道的差异是一个不得不面对的问题。 2.2.3 背景噪音问题语音识别、声纹识别、语音理解等系统往往在有背景噪音时就不能正常工作了,这是由于背景噪音破坏了原始语音的频谱,或者说把原始语音部分或全部掩盖在噪音当中,因而无法准确地分离出来的缘故。解决好背景噪音的问题也是技术上面临的挑战之一。 2.2.4 自然语音理解领域我们必须有很好的理论和技术去解决口语语言现象,比如口语中的重复、改正、强调、倒叙、省略、拖音、韵律等等。 2.2.5 语音合成应该说现在的语音合成技术做得很好,能
15、够把给它的文本正确地发出声音来,但是其中存在着一个很大的问题,就是它的声音不够自然。语音合成当中,怎样能够很好地把感情色彩、情绪等正确地表达出来,也需要进一步去研究。首先要解决的一个问题就是必须先对这句话(甚至整个段落)进行理解,理解之后才能够知道如何把韵律加进去,如何表达感情和情绪等。2.3 语音识别的基本过程 任何语音识别系统的基本识别过程如图2-2所示。 由图可见,语音识别的基本过程包括: (1)采样,将模拟信号数字化; (2)确定输人信号(单元或词)的起始端和终止端,通过语音检测器对语音信号的幅度值是否超过最低限值来判定; (3)由数字滤波器直接地或由模拟滤波器间接地计算语音谱; (4
16、)音调轮廓图估价; (5)分解输人信号,鉴定语音的特征; (6)单词识别,既可利用“自底朝上”技术将输人的语音特征与所需要词汇的特征比较而确定,也可以利用“自顶朝下”技术在数据库的模式中确定全部输人单元代表的词语; (7)对输人信息做出响应,即显示相应的词汇或字符串等。说话者或语音 发生器 拾音器 噪声采样和量化确定输入单元首尾计算语音谱估价音调轮廓分解语音特征单词识别(产生词典式或数码式书写的形式)对信息的响应信息存储输入的正字法表示图2-2 语音识别的基本过程2.4 语音识别技术前景与发展 1952年,AT&TBell实验室的Davis等人研制了第一个可十个英文数字的特定人语音增强系统一A
17、udry系统1956年,美国普林斯顿大学RCA实验室的Olson和Belar等人研制出能10个单音节词的系统,该系统采用带通滤波器组获得的频谱参数作为语音增强特征。1959年,Fry和Denes等人尝试构建音素器来4个元音和9个辅音,并采用频谱分析和模式匹配进行决策。这就大大提高了语音识别的效率和准确度。从此计算机语音识别的受到了各国科研人员的重视并开始进入语音识别的研究。60年代,苏联的Matin等提出了语音结束点的端点检测,使语音识别水平明显上升;Vintsyuk提出了动态编程,这一提法在以后的识别中不可或缺。60年代末、70年代初的重要成果是提出了信号线性预测编码(LPC)技术和动态时间
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语音识别在交通等待提醒中的应用研究 毕业论文 语音 识别 交通 等待 提醒 中的 应用 研究
链接地址:https://www.31ppt.com/p-3993217.html