语音识别控制小车设计.docx

资源ID：7508904 资源大小：154.71KB 全文页数：20页
资源格式： DOCX 下载积分：5金币

快捷下载

会员登录下载

三方登录下载：

下载资源需要5金币

邮箱/手机：
温馨提示：	用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）
支付方式：
验证码：	换一换

加入VIP免费专享

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

5、试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓。

网站客服

侵权投诉

语音识别控制小车设计.docx

基于语音识别的智能小车摘要随着计算机技术、模式识别和信号处理技术及声学技术等的开展，使得能满足各种需要的语音识别系统的实现成为可能。近二三十年来，语音识别在计算机、信息处理、通信与电子系统、自动控制等领域中有着越来越广泛的应用。本设计是语音识别在控制领域的一个很好实现，它将原本需要手工操作的工作用语音来方便地完成。语音识别按说话人的讲话方式可分为孤立词(ISoIatedWord)识别、连接词(ConnectedWOrd)识别和连续语音(COntinUoUSSPeeCh)识别。从识别对象的类型来看，语音识别可以分为特定人(SpeakerDependent)语音识别和非特定人(SpeakerIndePendent)语音识别。本设计采用的识别类型是特定人孤立词语音识别。本系统分上位机和下位机两大方面。上位机利用PC上MATLAB强大的数学计算能力，进行语音输入、端点监测、特征参数提取、匹配、串口控制等工作，根据识别到的不同语音通过PC串口向下位机发送不同的指令。下位机是单片机控制的一个小车，单片机收到上位机传来的指令后，根据不同的指令控制小车完成不同的动作。该设计对语音识别的现有算法进行了验证和实现，并对端点检测和匹配算法进行了些许改良。本设计到达了预期目标,实现了所期望的功能效果。关键词：MATLAB,语音识别，端点检测，LPC,单片机，电机控制SMARTCARGASEDSPEECHRECOGNITIONABSTRACTWiththedevelopmentofcomputertechnology,patternrecognition,signalprocessingtechnologyandacoustictechnologyetc,thespeechrecognitionsystemthatcanmeetthevariousneedsofpeopleismorepossibletoachieve.Thepastthreedecades,thevoicerecognitioninthefieldofcomputer,informationprocessing,communicationsandelectronicsystems,automaticcontrolhasincreasinglywiderangeofapplications.Speechrecognitionbythespeaker,sspeechcanbedividedintoisolatedword(IsolatedWord)identification,conjunctions(ConnectedWord)andcontinuousspeechrecognition(ContinuousSpeech)identification.Identifyingthetypeofobjectfromthepointofview,thevoicerecognitioncanbedividedintoaspecificperson(SpeakerDependent)speechrecognitionandnon-specific(SpeakerIndependent)speechrecognition.Thisdesignusestheidentificationtypeisaspecificpersonisolatedwordspeechrecognition.Thisdesignisofagoodimplementationofspeechrecognitioninthecontrolfield,itdoestheworkthatwouldotherwiserequiremanualoperationbythevoiceofpeopleeasily.Thissystemincludestwomajoraspects:thehostsystemandtheslavesystem.ThehostsystemusetheMATLABonthecomputerwhichhaspowerfulmathematicalcomputingabilitytodotheworkofvoiceinput,endpointmonitoring,featureextraction,matching,identificationandserialcontrol,thenitsenddifferentcommandsthroughthePCserialporttoslavesystemaccordingdifferentrecognisedvoice.Theslavesystemisacarcontrolledbyasingle-chipmicro-controller.ltcontrolsthecardodifferentactionsaccordingdifferentinstructionsreceived.ThedesignischeckingandrealizationoftheexistingspeechrecognitionalgorithmandItheendpointdetectionandmatchingalgorithmswereslightimproved.Thisdesignachievedtheexpectedgoalsandachievedthedesiredfunctionaleffect.KEYWORDS：MATLAB,SpeechRecognition9ExtremePointsTest9LPC9ChipMicrocomputer9MotorDrive前言O第1章系统总体设计方案介绍1第2章上位机设计2§2.1语音识别简介3§2.1.1语音识别开展3§2.1.2语音识别的分类3§2.2 声音录入4§2.3 声音的预处理4§2.3.1欲加重处理4§2.3.2分帧处理4§2.4 端点检测5§2.4.1 1过零率5§2.4.2 音量6§2.4.3 过零率和音量积谱7§2.4.4 用过零率和音量积谱来检测端点8§2.5 特征参数提取9§2.5.1特征参数概述9§2.5.2用MATLAB实现LPC系数的计算12§2.6语音识别中的模式匹配13§2.6.1DTW算法原理13§2.6.2程序实现15§2.7MATLAB上的GUI设计17第3章下位机设计18§3.1小车总体设计18§3.1.1小车总体框图18§3.1.2小车结构设计19§3.2小车硬件设计19§3.2.1单片机电路设计19§3.2.2驱动电路设计21§3.2.3稳压电路设计22§3.3小车软件设计22§1.1.1 3.1主程序流程图22§1.1.2 局部主程序23§1.1.3 底层驱动程序25结论27参考文献28致谢28附录29、，1刖后随着计算机技术、模式识别和信号处理技术及声学技术等的开展，使得能满足各种需要的语音识别系统的实现成为可能。近二三十年来，语音识别在计算机、信息处理、通信与电子系统、自动控制等领域中有着越来越广泛的应用。语音命令控制可广泛用于家电语音遥控、玩具、智能仪器及移动等便携设备中。使用语音作为人机交互的途径对于使用者来说是最自然的一种方式，同时设备的小型化也要求省略键盘以节省体积。当今，语音识别产品在人机交互应用中已经占到越来越大的比例。语音识别按说话人的讲话方式可分为孤立词(ISoIatedWord)识别、连接词(ConnectedWord)识别和连续语音(ContinuousSpeech)识别。孤立词识别是指说话人每次只说一个词或短语，每个词或短语在词汇表中都算作一个词条，一般用在语音拨号系统中。连接词语音识别支持一个小的语法网络，其内部形成一个状态机，可以实现语音查询、航空定票等系统。连续语音识别是指对说话人以日常自然的方式发音，通常特指用于语音录入的听写机。从识别对象的类型来看，语音识别可以分为特定人(SPeakerDePendent)语音识别和非特定人(SPeakerIndePendent)语音识别。特定人是指只针对一个用户的语音识别，非特定人那么可用于不同的用户。实际上，非特定人语音识别的初始识别率往往都比拟低，一般都要求用户花一定的时间对系统进行训练，将系统的参数进行一定的自适应调整，才能使识别率到达满意的程度。本设计采用的识别类型是特定人孤立词语音识别o本设计是语音识别在控制领域的一个很好实现，它将原本需要手工操作的工作用语音来方便地完成。本系统分上位机和下位机两大方面。上位机利用PC上MATLAB强大的数学计算能力，进行语音输入、端点监测、特征参数提取、匹配、串口控制等工作，根据识别到的不同语音通过Pe串口向下位机发送不同的指令。下位机是单片机控制的一个小车，单片机收到上位机传来的指令后，很据不同的指令控制小车完成不同的动作。该设计对语音识别的现有算法进行了验证和实现，并对端点检测和匹配算法进行了些许改良。为了更方便的进行上位机的操作，本设计用MATLAB的GUl设计了一个图形界面。上面设置了串口选择框、录音开始按钮、语音识别结果框等。下位机采用STC2C5A60S2单片机作为控制中心，采用L298专用驱动芯片搭建双桥，进行点击的正反转调速等控制。本设计到达了预期目标,实现了所期望的功能效果。第1章系统总体设计方案介绍本系统分上位机和下位机两大方面。上位机利用PC上MATLAB强大的数学计算能力，进行语音的输入、端点监测、特征参数提取、匹配、识别、串口控制等工作，根据识别到的不同语音通过PC串口向下位机发送不同的指令。下位机是单片机控制的一个小车，单片机收到上位机传来的指令后，很据不同的指令控制小车完成不同的动作。PC机和小车之间通过串口无线传输模块进行数据传输。总体框图如图1-1所示：图17系统总体框图第2章上位机设计上位负责语音的识别，并根据识别到的不同结果向下位机小车）发送不同的指令。上位机的设计基于MATLAB平台，利用MATLAB强大的数学计算能力，进行语音的输入、预处理、端点监测、特征参数提取、匹配、识别、串口控制等工作。§2.1 语音识别简介§2.1.1 语音识别开展随着时代的开展，人们越来越注重生活的品质。便捷时尚成为当代人们的追求目标。随着计算机技术、模式识别和信号处理技术及声学技术等的开展，使得能满足各种需要的语音识别系统的实现成为可能。近二三十年来，语音识别在计算机、信息处理、通信与电子系统、自动控制等领域中有着越来越广泛的应用。语音命令控制可广泛用于家电语音遥控、玩具、智能仪器及移动等便携设备中。使用语音作为人机交互的途径对于使用者来说是最自然的一种方式，同时设备的小型化也要求省略键盘以节省体积。当今，语音识别产品在人机交互应用中已经占到越来越大的比例。§2.1.2 语音识别的分类语音识别按说话人的讲话方式可分为孤立词(ISOIatedWOrd)识别、连接词(ConnectedWord)识别和连续语音(ContinuousSpeech)识别。孤立词识别是指说话人每次只说一个词或短语，每个词或短语在词汇表中都算作一个词条，一般用在语音拨号系统中。连接词语音识别支持一个小的语法网络，其内部形成一个状态机，可以实现简单的家用电器的控制，而复杂的连接词语音识别系统可以用于语音查询、航空定票等系统。连续语音识别是指对说话人以日常自然的方式发音，通常特指用于语音录入的听写机。显然，连续非特定人语音识别的难度要大得多，因为不仅有说话人口音的问题，还有协同发音、断字断句、搜索等问题，除了考虑语音的声学模型外还要涉及到语言模型，如构词法、文法等。从识别对象的类型来看，语音识别可以分为特定人(SPeakerDependent)语音识别和非特定人(SPeakerIndePendent)语音识别。特定人是指只针对一个用户的语音识别，非特定人那么可用于不同的用户。实际上，非特定人语音识别的初始识别率往往都比拟低，一般都要求用户花一定的时间对系统进行训练，将系统的参数进行一定的自适应调整，才能使识别率到达满意的程度。非特定人大词表连续语音识别是近几年研究的重点，也是研究的难点。目前的连续语音识别大多是基于HMM(隐马尔可夫模型)框架，并将声学、语言学的知识统一引入来改善这个框架，其硬件平台通常是功能强大的工作站或PC机。§2.2 声音录入本设计利用PC上的话筒口进行声音录入。通过MATLAB的Wavrecord函数进行声音录入。WaVreeord是MATLAB的专有声音录入函数，他有一下三种调用方式：y=wavrecord(n,Fs)2) y=wavrecord(n,Fs,ch)3) y=wavrecord(n,Fs,dtype,)其中11代表声音录入的总采样数。Fs代表声音的采样率。ch代表声音录入采用的通道数，当Ch为1时为单声道，当Ch为2时为立体声dtype"代表采样数据的存储类型，MATLAB提供四种存储类型如下：1) ,double,(defaultvalue),16bits/sample2) ,single,16bits/sample3) ,intl6,16bits/sample4) ,uint8,8bits/sample本设计单次采样总数为50000点，采样率为22000HZo即：y=wavrecord(50000,22000);§2.3 声音的预处理§2.3.1 欲加重处理预加重的目的在于滤除低频干扰，尤其是50HZ或60HZ的工频干扰，将对于语音识别更为有用的高频局部的频谱进一步提升。在计算短时能量之前应用该滤波器，还可以起到消除直流漂移、抑制随机噪声和提升清音局部能量的效果。§2.3.2 分帧处理在计算各个系数之前要先将语音信号作分帧处理。语音信号是瞬时变化的，但在10-20ms内是相对稳定的.我设定的采样频率为11025所以我们对预处理后的语音信号Sl(n)以1024点为一帧进行处理，帧移为512个采样点。§2.4 端点检测所谓端点检测，就是在实时输入的声音信号中，区分背景噪声和环境噪声，准确地判断出声音信号的开始点和结束点。在语音识别系统中，正确、有效地进行端点检测不仅可以减少计算量和缩短处理时间，而且能排除无声段的噪声干扰、提高语音识别的正确率。研究说明，即使是在安静的环境下，语音识别系统一半以上的错误可能主要来基于MTLAB编写的语音端点检测程序。除此之外，在语音合成、编码等系统中，高效的端点检测也直接影响甚至决定着系统的主要性能。因此，端点检测的效率、质量在语音处理系统中显得至关重要。§2.4.1 过零率过零率fZeroCrossingRate是在每个音框中，音讯通过零点的次数。一般而言，噪声的过零率大于气音的过零率，而气音的过零率又大于有声音的过零率。一半情况下，噪声的波形和声音波形相比幅度非常小，为了排除噪声对过零率产生的影响，我将声音的原始谱向上平移，使得噪声的过零点影响大大减小。如下，图2-1展示了没有平移前的过零谱图，图2-2展示了平移后的过零谱图。可以看出，平移后，话音可以很容易从噪音中区分开来。图27平移前的过零谱图2-2平移后的过零谱§2.4.2 音量能量或者音量代表声音的大小，可由声音讯号的震幅来类比，又称为能量Energy）或强度UntenSity）等。话音的能量远比噪声的能量要大，故可用能量来区分是静音还是由话音。这里将每帧的幅度绝对值之和作为每一帧的总能量大小。音量谱如图2-3所示：声音波形音量谱图2-3音量谱§2.4.3 过零率和音量积谱通常利用短时能量来检测浊音，用过零率来检测清音，两者配合实现可靠的端点检测。端点检测算法常用的是由语音能量和过零率组合的有双门限法，以及短时能量和过零率的乘积构成的能频值法。图2-4展示了过零谱、音量谱和过零率和能量成绩构成的谱线。声音波形-200.511.522.533.5过零谱4X10LLLL00.511.522.533.5音量谱4X10一LLr、l/ZrVLLr-00.511.522.533.54Xio过零音量积谱XW4一-LLL.L-00.511.522.533.550O42O1000500OX104图2-4过零音量积谱§2.4.4 用过零率和音量积谱来检测端点端点检测算法常用的是由语音能量和过零率组合的有双门限法，以及短时能量和过零率的乘积构成的能频值法。这里采用的是第二种方法，通过能量和过零率的乘积构成的能频值来判断语音的端点。这里我对端点进行了两级判断。首先根据过零率和音量积设定一个较高的门限TH,假设谱大于TH,那么可确定2个端点A、B,并可认为这2个端点之间是语音信号，这样相当于完成初判。再根据背景噪声的过零率和音量积设定一个比TH稍低的门限TL,如果信号的能量大于TL,那么所对应的端点C、D之间仍是语音信号，至此完成了第二级判断。判断结果如图2-5所示:)voidmain()Com_Init();while(l)(switch(RxBufO)(case 1:go_ahead();break;case 2:stop();break;case 3:go_afterward();break;default:)§3.3.3底层驱动程序底层驱动程主要分两块儿：电机控制程序和串口控制程序。串口控制主要是进行存放器设置，设置串口时钟得喝波特率。串口数据的接收程序有查询法和中断法。查询法主要是通过不断查询串口数据接收标志位，当标志位置位时，说明串口数据接收缓冲区已满，于是就可以把数据从接收缓冲区中读出，其流程图如图3-10。中断的方法是，翻开单片机硬件串口中断，串口数据接收缓冲区已满时,单片机就会触发串口中断，通知CPU读取串口接收的数据。中断的方法可以减少CPU占用率，故这里我采用了中断的方法。图370串口程序，查询法电机控制主要是通过控制L298电机驱动芯片来控制电机。L298有六个输入脚(INI,IN2,ENA;IN3,IN4,EAB)和四个输出脚(0UT1,0UT2;0UT3,0UT4L它的六个输入口分别连接单片机的P(TOP(5,四个输出口连接两个电机。通过控制六个输入口电平来控制电机正反转或者停止。其主要的控制方法见表3-1：表3-1电机控制INlIN2ENAOUTlOUT2电机1O1高低正转O11低高翻转×XO高阻高阻停转IN3IN4EABOUT3OUT4电机1O1高低正转O11低高翻转××O高阻高阻停转本次设计对语音识别的现有算法进行了实现和验证，并对端点检测和匹配方法进行了稍微改良。小车的硬件设计性能良好，软件运行正常，能到达预定要求。本设计到达了预期目标。本设计语音识别的准确度还有很大的提高空间，语音识别的程序效率还有待进一步提高。本设计语音识别的特征参数提取采用的是易于获取的LPC线性预测系数），而大多数识别案例是采用LPCC线性预测倒谱系数），这方面还有待去试验。还有一种特征参数是MeI尺度倒谱系数fMFCC人的听觉系统是一个特殊的非线性系统，它响应不同频率信号的灵敏度是不同的，根本上是一个对数的关系，Mel尺度倒谱系数fMFCC能够比拟充分利用人耳这种特殊的感知特性。这方面的试验还有待进行。串口无线传输具有很简单的接口，软件控制简单，但它的传输距离有限，故无线传输方案还需要进一步改良。参考文献1谭浩强.C程序设计.北京：清华大学出版社，19952郭天祥.51单片机C语言教程.北京：电子工业出版社,20093张毅刚，彭喜元等.新编MCS-51单片机应用设计.哈尔滨：哈尔滨工业大学出版社,20034刘瑞新.单片机原理及应用教程.机械工业出版社,20035何立民.单片机应用技术选编11).北京航空航天大学出版社,19926胡汉才.单片机原理及系统设计.清华大学出版社,20027刘卫国.MATLAB程序设计与应用.北京：高等教育出版社，20018张震宇.基于MATLAB的语音端点检测试验研究.浙江科技学院学,2007第19卷第3期9徐利军.基于DTW的孤立词语音识别研究.软件导刊,2012第2期10张青松.语音识别技术的进展.科技信息,2011第27期11刘树棠译.信号与系统.西安：西安交通大学出版社,199712管致中，夏恭恪，孟桥.信号与线性系统.北京：高等教育出版社，200313程佩清.数字信号处理.北京：清华大学出版社,200014郑国强，付江涛，彭勃，马华红.数字信号处理理论与实践.西安：西安电子科技大学出版社,200915华成英.童诗白.模拟电子技术根底.北京：高等教育出版社,200616邱关源.电路.北京：高等教育出版社,200617杨万才.线性代数.北京：科学出版社,200818阎石.数字电子技术.北京：高等教育出版社,200519陆庆乐.复变函数.北京：高等教育出版社,199420张元林.积分变换.北京：高等教育出版社,2003在课题研究和设计过程中，遇到了很多问题和困难。期间得到了身边很多同学的鼓励和支持，他们增加了我坚持下去的勇气。我的指导老师徐素莉老师在课题的更改和确立，还有课题整体思路把握，以及小车的总体方案设计上都给与了极大的帮助和指导。另外很多论坛网友也帮我解答了一些问题，并给我提供了很多资料。再此对他们一并表示感谢。1 .小车实际效果图2 .上位机界面截图3.语音识别主程序内容本程序调用了flpc,fDTW,fenergy三个函数文件。为了节省空间，源代码这里省略不附。其它函数如abs等为MATLAB函数库自带。functionresult=SpeechRecognition(Wav)Rvalue=flpc(wav);s=-i-1-1-1；loadTdatalm=fDTW(Tzou,Rvalue);energy=fenergy(wav);ifm<1500s(l)=m+abs(energy-2200);endm=fDTW(Tting,Rvalue);ifm<1500s(2)=m+abs(energy-1400);endm=fDTW(Tdao,Rvalue);ifm<1500s(3)=m+abs(energy-1200);endk=O;m=realmax;fori=l:3ifs(i)>=0&s(i)<mm=s(i);k=i;endendswitchkcase 1result='走'；case 2result='停'；case 3result+倒'；otherwiseresult='无匹配！,;End

注意事项

本文（语音识别控制小车设计.docx）为本站会员（李司机）主动上传，三一办公仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知三一办公（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。