《基于倒谱的分析及硬件实现开题报告书.doc》由会员分享,可在线阅读,更多相关《基于倒谱的分析及硬件实现开题报告书.doc(6页珍藏版)》请在三一办公上搜索。
1、学号 2012704060 昆明理工大学硕士研究生学位论文开题报告书专 业 电子与通信工程 姓 名 朱健晨 入 学 时 间 2012年九月 导 师 刘增力 拟定的论文题目 基于倒谱的分析及硬件实现 报 告 日 期 2014年5月 研究生院1、论文选题的国内外研究动态及现状同态信号系统有2种:乘同态信号处理系统和卷积同态信号处理系统。倒谱属于卷同态信号处理系统,其主要功能是解卷用的,正因为倒谱所具有的性质,所得倒谱可以对语音信号进行分析,语音分析的目的是根据记录的语音信号来得到关于激励源和声道冲激响应的有关参数,显然,卷积同态系统适合于这一要求。语音识别是机器通过识别和理解过程把语音信号转变为相
2、应的文本文件或命令的高科技。作为专门的研究领域,语音识别又是一门交叉学科,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多科学精密相连。语音识别经过四十多年的发展,已经显示出巨大的应用前景。语音信号之所以有强大的应用,是因为语音室语言的声学表现形式,是人类交流信息最自然、最有效、最方便的手段,也是人类进行思维的一种依托。如今,人类开始进入了信息化时代,利用现代化手段研究语音处理技术,从而能更加有效地对语音信息进行传输和存储。其中,语音识别技术是实现人机信息的一种重要的技术手段,其目的是将人类语言语音中的词汇内容转为计算机可识别的输入,语音识别产品在人机交互中所占的比例越来越
3、大,对于现在的语音识别系统,不光考虑高识别率,实时性和大词汇量这些因素,还要考虑软硬件设计简单、价格低廉、易控制、人机交互便捷等方面的综合考虑。目前许多语音识别系统采用的识别算法都是在PC机上实现的,并且以计算发杂的美尔倒谱系数(MFCC)为语音特征参数,采用过程繁琐的隐马儿克夫模型为匹配方法,不适合于实时语音信号的识别,相比于HMM等复杂算法和模型,在小词汇量语音识别中,DTW算法无论在时间效率还是空间需求上都有很大优势,在带有多核处理器、DSP或者FPGA等具有并行能力的嵌入式软件和硬件系统实现中,算法性能有很大的提升空间,正所谓具体问题具体分析,不同的语音信号需要不同的算法去实现。正因为
4、如此,语音识别技术要求计算机接受人的口语命令并作出相应,是其识别的重要的分支。语音信号特征参数的提取是语音识别的关键。特征参数要能代表语音特征,包括声道特征、听觉特征、具有很好的区分性、各阶段参数之间有良好的独立性等。常用的有能量、间距频率、短时间频谱、倒频谱、线性预测系数、PARCOR系数等。线性预测倒谱系数是常用特征参数,采用地推公式提取信号倒谱,速度和精度都可以保证。但是,Mel频率倒谱系数(MFCC)比它更符合人耳听觉特性,在有信道噪声和频率失真的情况下,能产生更高的识别精度。语音识别的这些特点和所具有的性质使得在生物尤其是在人类生活领域以其独特的方便性、经济型和准确性等优势受到人们的
5、关注。近年来随着DPS技术的迅猛发展以及性能的不断完善,用DPS来作语音实时处理也越来越受到人们的重视。基于DSP的说话人识别系统具有高精度、速度快、体积小、操作简单、成本低等特点。可广泛的用于司法、公安、机场、办公室等场所,具有广阔的应用前景。参考文献【1】 卢刚, 闫敬文. 用 C542 KDSK 实现信号倒谱计算J. 厦门大学学报: 自然科学版, 2001, 40(5): 1056-1061.【2】 贾克明, 陶洪久. 基于 DSP 的嵌入式语音识别系统的研究与实现J. 武汉理工大学学报: 信息与管理工程版, 2008 (7): 156-159.【3】 贾克明, and 陶洪久. 基于
6、DSP 的嵌入式语音识别系统的研究与实现. 武汉理工大学学报: 信息与管理工程版 7 (2008): 156-159.【4】 丘敬云. 说话人识别系统研究及其 DSP 实现J. 2012.【5】 常丹华, 郑春蕾. 基于 DSP 的语音识别智能控制系统J. 电子测量技术, 2008, 31(4): 175-178.【6】 姚峰英. 语音增强系统的研究与实现D. 中国科学院上海冶金研究所, 2001.【7】 杨占军, 杨英杰, 王强. 基于 DSP 的语音识别系统的设计与实现J. 东北电力大学学报, 2006, 26(2): 60-64.【8】 赵鹏. 基于 DSP 的连接数码语音识别研究与设计
7、D. 湖南大学, 2006.【9】 沈宏余. 基于 DSP 的声控系统的研究与实现D. 无锡: 江南大学, 2008.【10】 张爽. 语音识别中的语音前端噪声处理D. 哈尔滨工业大学, 2010.【11】 胡金平. 基于说话人识别的无线门禁系统的应用研究D. 兰州理工大学, 2011.2、研究内容、试验设计方案说话人识别分为三个阶段,这是语音处理大概所分的三个环节即:语音处理阶段、训练阶段和识别阶段。语音处理阶段包括混叠滤波、预加叠、加窗和端点检测;训练阶段中每个人说出若干训练语句,系统对这些训练语句进行相应的数字化处理,提取其中的特征向量,建立每个使用者的模块以及参数模型;识别阶段由所需要
8、说话人的语音特征提取后与系统训练时产生的每个的参考模型进行对比,按照特定的规定进行对比,从而进行识别。(此图为说话人的识别流程图)在这几个年的法展当中,随着语音识别技术的愈发成熟,以及新的理念和算法的不断跟新。目前语音识别的算法可以分成以下几类的研究:(1) 动态时间规整(dynannc time varping,DTW)(2) 离散隐马尔可夫模型(discrete hidden Markov Model,DHMM)(3) 连续隐马尔可夫模型(Continuous Hidden Markov Model,CHMM)(4) 人工神经网络(Artificia Neurul Netword,ANN)
9、从上面的分类看出,语音信号是具有动态变化范围的特性,所欲我们需要综合的考虑识别方法的相互配合,从而实现较高的语音识别。语音识别是以机器能听懂我们的语言为目的,最终的目的是实现人机对话。这可以归结为以下几个难点:(1) 语音系统的复杂性(2) 语音识别处理的对象范围很大(3) 语音信号本身的不平稳性(4) 噪声的干扰在对语音信号进行采集时,语音的外部环境等因素也要加以考虑,因为哲学因素会给语音信号输入范围的断定、词间界定的区分等方面带来困难。总之,语音识别是一个极其复杂的工作,它的发展依赖于各个领域的协调发展,这反映了从另一个方面减缓了语音识别工作的发展,所以我们的研究任道而重远。本文的主要研究
10、内容本论文主要基于DPS的声控系统,主要研究如何在实验室环境下完成一个简单的语音识别系统。以DSP芯片为核心芯片,通过外存储器和CODEC芯片,完成语音处理板的设计。使得DPS目标系统能够可靠、有效地工作。由于C语言和汇编语言的高效率,考虑到系统开发周期、可维护性、可移植性、可继承性,本文的算法可以通过C语言进行实现和MATLAB进行数据仿真。本文论文提出基于DSP的声控系统,介绍了整个硬件电路组成,通过A/D转换对数字信号传送给DSP进行处理和识别。主要工作可以分为以下几个内容:(1) 端点的检测(2) 特征参数的提取(3) 模式匹配(4) 硬件电路设计(5) 对识别算法进行测试总的步骤预计
11、是这些,在以后的学习中也许会有改进。3、必备的实验条件、设备、存在的主要问题(1) 本文所要实现的现实基础是MATLAB对前面说话人特征提取,其中包括LPCC的提取和MFCC的提取进行仿真(2) 在此基础上需要把所需要提取的数据转换为C语言的表示形式(3) 结合DPS在硬件上进行测试以及得出预期的结果,一般是以DSP和CPLD为核心电路完成对语音信号的采集、说话人识别核心运算来实现的,在实际处理过程中需要找到合适的开发平台和语音模块。(4) 需要在硬件实现平台上找出合适的DSP开发平台(5) 需要熟练掌握CSS4、进度安排,完成论文工作的时间2014,5月204,8月 完成所需的参考文献的研究2014,9月2015,1月 完成相应的MATLAB仿真和C的实现2014,1月2014,4月 完成DSP上语音识别的硬件实现2014,5月 完成毕业论文设计5、预期结果指导教师意见 签 名年 月 日开题报告评审小组意见评审小组成员签名学位评定分委员会审核意见学位评定分委员会主任签名 年 月 日*硕士研究生应于第三学期末以前完成论文开题报告答辩,并在一周内将论文开题报告书交到所在的学院。
链接地址:https://www.31ppt.com/p-3928895.html