基于语音识别的导盲机器人小车模型设计(定稿).doc
-
资源ID:3928899
资源大小:7.63MB
全文页数:55页
- 资源格式: DOC
下载积分:8金币
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
基于语音识别的导盲机器人小车模型设计(定稿).doc
专科毕业设计(论文)设计题目: 基于语音识别的导盲机器人小车模型设计 系 部: 信息工程系 专 业: 电子信息工程技术 班 级: 电子信息091302 姓 名: 学 号: 指导教师: 职 称: 2012年5月 南京摘 要盲人因为失去了视觉感知能力,因此在工作生活上有诸多不便。随着现代科技的进步,社会上已经出现了很多导盲设备,例如:导盲手杖、导盲眼镜以及导盲机器人等。本文以对语音识别技术学习为目的,介绍了一种基于语音识别的导盲机器人小车模型,试图将语音识别技术融入到导盲产品中,主要工作如下:(1)对基于凌阳SPCE061A单片机的语音识别系统进行初步的分析与学习,了解了语音识别的流程以及关键技术,并针对凌阳单片机语音识别系统容量有限的问题,提出了多组语音识别的方法。(2)对机器人的运动控制有了初步了解,重点对基于H桥的电机驱动电路进行学习和掌握。(3)对机器人的视觉系统进行相关学习,提出了基于红外传感器的避障方案,提高了机器人避障的准确性。关键词 语音识别;导盲机器人;红外传感器;凌阳SPCE061A单片机AbstractThe loss of visual sight causes a great deal of inconvenience. The advancement of modern technology has brought a lot of guide device, such as guide crabsticks, guide glasses, and guide robots. This article, aiming for more knowledge of speech recognition technology, introduces a blind robot in the form of car modal. The car modal applies speech recognition technology, and tries to integrate the technology with guide products. The major steps are as follows:(1)Making elementary analysis and learning the speech recognition system of the SPCE061A. Get an understanding of the process and key technology of its speech recognition system. Put forward a couple of methods to deal with its limited capacity. (2)Having a general knowledge of controlling the movement of robot, the key point is the H bridge motor drive circuit.(3)Grasping the relative knowledge of the visual system of robots. Bring forward the proposal of using infrared sensor to avoid obstacle.Keywords Speech recognition; Guide robot; Infrared sensors; SPCE061A 目 录摘 要IAbstractII目 录III第1章 绪论11.1 背景11.2 论文的内容与组织安排1第2章 凌阳单片机简介32.1 凌阳SPCE061A单片机封装及管脚定义32.1.1 凌阳SPCE061A单片机最小系统设计52.1.2 凌阳单片机开发环境简介62.2 凌阳单片机的特点7第3章 语音识别基础93.1 语音识别的分类93.2 语音识别的基本原理103.3 语音识别的方法10第4章 语音识别系统硬件设计134.1 凌阳61开发板简介134.1.1 输入输出(I/O)接口电路144.1.2 音频输入电路154.1.3 语音放大模块164.1.4 电源电路164.2 语音智能小车车体介绍174.2.1 智能小车车体结构设计174.2.2 小车的行进原理分析184.3 直流电机驱动电路设计194.3.1 全桥驱动电路原理194.3.2 前后轮电机驱动设计204.4 红外避障模块设计22第5章 基于凌阳单片机的语音识别系统235.1 语音压缩简介235.1.1 凌阳语音压缩解决方案245.1.2 提示语音的录入与处理255.2 系统初始化与语音的训练285.2.1 系统初始化285.2.2 语音训练295.3 语音的辨识305.3.1 分组语音识别简介325.3.2 识别成功后动作执行子程序33总 结36致 谢37参考文献38附录1 系统实物图39附录2 语音识别API简介40附录3 源代码41第1章 绪论1.1 背景根据中国卫生部2006年月公布的全国防盲治盲规划(20062010年)显示,中国有视力残疾患者近1200万人,其中盲人约500万人,低视力患者约710万人,是世界上盲人最多的国家。如何安全的行走成为盲人在日常生活最为重要的问题。传统的导盲手段有手杖和导盲犬,但是他们的弊端有很多,导盲手杖不能探测到较远的障碍物以及盲人前方的悬空物体。而导盲犬培训价格昂贵(约20万元),训练周期长,淘汰率高,且喂食等活动增加盲人负担。随着技术的发展,导盲机器人、超声波、无线电、红外线、卫星等导盲系统、盲人电子眼镜等现代化导盲手段正逐步走进盲人的生活,增强了盲人的行走能力,提高了盲人的生活质量。1.2 论文的内容与组织安排本设计以凌阳SPCE061A单片机为核心的语音避障小车为理想模型,对基于语音识别的导盲机器人小车做了初步的学习与研究。通过凌阳语音避障小车的学习与制作,学习了凌阳SPCE061A单片机的内部结构、系统指令、语音识别的流程以及直流电机的驱动等。本设计实现的功能主要有:语音识别、根据语音识别做出相应的动作、避障等。图1-1是整个设计的框架图。图1-1系统设计整体框架图论文的组织安排如下:第1章,说明了选题的背景以及论文内容的简述;第2章,简单介绍了语音识别导盲机器人控制的核心凌阳SPCE061A单片机;第3章,介绍了语音识别的原理、分类以及实现语音识别的方法;第4章,介绍了语音导盲机器人的硬件设计,包括凌阳61开发板、电机驱动电路、避障模块;第5章,具体介绍了基于凌阳硬件平台上的语音识别系统设计;最后对本文进行总结并针对存在的问题寻求解决的办法。第2章 凌阳单片机简介SPCE061A是一款由台湾凌阳公司推出的16位嵌入式语音处理器,不仅具有同类型单片机的通用功能,而且具有语音识别能力。它的主要性能有:32位通用可编程输入/输出端口;内置2K字SRAM(Static RAM)和32K的Flash;2个16位可编程定时器/计数器(可自动初置初始计数值);2个10位DAC(数模转换)输出通道;7通道10位电压ADC(数模转换)器和单通道专用语音ADC;声音ADC输入通道内置AGC(传声器放大自动增益控制)功能等。SPCE061A处理芯片是一款功能齐全的单片机,且包含了一部分DSP的功能,这也使得它在硬件电路上需要外接的器件数量大大减少。同时,SPCE061A也是一款16位结构的µnSP微控制器,支持可编程音频处理,使用凌阳音频编码SACM_S480格式,能容纳210s的语音数据;较高的处理速度能够非常容易地、快速地处理复杂的数字信号。因此,以µnSP为核心的SPCE061A单片机是适用于数字语音识别应用领域的一种最为经济的选择。SPCE061A的结构如图2-1所示。图2-1 凌阳SPCE061A单片机结构2.1 凌阳SPCE061A单片机封装及管脚定义SPCE061A单片机有两种封装形式,一种为84个引脚,PLCC84 封装形式;它的排列如图2-2所示;另一种为80个引脚,LQFP80 封装。它的排列如图2-3所示。 图2-2 LQFP80封装 图2-3 PLCC84封装在PLCC84封装中,有15个空余脚,用户使用时这15个空余脚悬浮。在LQFP80封装中有9个空余脚,用户使用时9个空余脚接地。本设计用的是LQFP80封装的单片机,因此本文以LQFP80封装管脚功能介绍,如表2-1所示。表2-1 凌阳SPCE061A管脚描述IOA0 IOA15(4148,53,5460 脚)I/O 口A ,共16个IOB0 IOB15(51,8176,6864 脚)I/O 口B ,共16个OSCI(13脚)振荡器输入。在石英晶振模式下,是石英元件的一个输入脚OSCO(12脚)振荡器输出。在石英晶振模式下,是石英元件的一个输出脚RES_B (6脚)复位输入。若这个脚输入低电平,会使得控制器被重置复位ICE_EN(16脚)ICE使能端, 接在线调试器PROBE 的使能脚ICE_EN ICE_SCK(17脚)ICE时钟脚,接在线调试器PROBE 的时钟脚ICE_SCKICE_SDA(18脚)ICE数据脚,接在线调试器PROBE 的数据脚ICE_SDAPVIN(20脚)程序保密设定脚PFUSE(29脚)程序保密设定脚DAC1(21脚)音频输出通道1 DAC2(22脚)音频输出通道2 VREF2(23脚)2V 参考电压输出脚AGC(25脚)语音输入自动增益控制引脚OPI(26脚)Microphone的第二运放输入脚MICOUT(27脚)Microphone的第一运放输出脚MICN(28脚)Microphone的负向输入脚MICP(33脚)Microphone正向输入脚VRT (35脚)A/D 转换外部参考电压输入脚。它决定 A/D 转换输入电压上限值。例如该点输入一个2.5V的参考电压,则A/D 转换电压输入范围为02.5V 。(外部A/D 最高参考电压<3.3V )VCM(34 脚)ADC参考电压输出脚VMIC(37脚)Microphone电源SLEEP(63脚)睡眠状态指示脚。当CPU进入睡眠状态时,该脚输出一个高电平VCP (8脚)锁相环压控振荡器的阻容输入XROMT、PVPP、XTEST(61、69、14脚)出厂测试用管脚,悬空即可VDDH (51、52、75脚)I/O 电平参考。该点输入一个5V 的参考电压,则I/O 输入输出高电平为5VVDD(7 脚)PLL 锁相环电源VSS (9 脚)锁相环地VSS (19、24脚)模拟地VSS (38 、49、50、62脚)数字地VDD(15脚、36脚)数字电源 2.1.1 凌阳SPCE061A单片机最小系统设计为了使单片机能拥有执行用户程序、指挥各部分硬件完成既定任务的功能,单片机必须包括时钟电路和复位电路,通常称这两种电路位单片机的最小系统电路。凌阳SPCE061A属于系统级芯片,用户使用非常方便,所以必须的外围电路也比较简单。凌阳SPCE061A单片机最小系统接线如图2-5所示,有晶振输入模块(OSC)、锁相环外围电路(PLL)、复位电路(RESET)、指示灯(LED)等。具体见图2-5所示。 图2-5 凌阳SPCE061A最小系统原理图2.1.2 凌阳单片机开发环境简介凌阳SPCE061A单片机配有凌阳自行研发设计的16位单片机开发环境unSP IDE。此工具在Windows环境下操作,支持标准C语言和汇编语言,集编译、编程、链接、调试和仿真于一体,应用方便简单易学。 图2-6 凌阳单片机开发环境unSP IDE在凌阳单片机集成开发环境(unSP IDE)中,新建项目包括三类文件:源文件(source files),头文件(head files)和用来存放文档或项目说明的文件(external dependencies),这种项目管理方式将与项目相关的代码模块组织为一个有机整体,便于开发人员对代码和相关文件进行整理。unSP IDE项目文件管理的组织结构如表2-2所示。表2-2 unSP IDE项目文件管理组织结构源文件(source files)头文件(head files)外部支持文件(external dependencies) 汇编源文件 .asm汇编头文件 .inc文档文件 .txtC语音源文件 .cC语言头文件 .h数据文件 .bin资源文件 .rc资源头文件(自动生成) Resource .inc编译信息文件(自动生成)Make file资源表(自动生成)Resource .asm2.2 凌阳单片机的特点该设计涉及到语音识别以及根据语音指令车轮做出相关动作,因此对核心控制器件的要求比较高。语音处理系统在硬件上通常基于LSI(大规模集成电路)、MCU、DSP等芯片方案,在实际工程运用中三者各有优劣。1.80C51 单片机是功能较强的 8 位单片机,非常适用于逻辑控制,拥有 4k 的程序存储器,两个 16 位的定时器,32 个I/O 口,最高频率达 12MHz,外扩 AD 和 DA 转换器可以进行数据的处理控制。但是51单片机毕竟是通用处理器,处理速度赶不上对于语音信号处理的需求,需要连接专用的语音处理芯片,不利于系统的一体化设计且语音识别的精度不高。2.DSP 芯片是是一种特别适合于进行数字信号处理运算的微处理器器,其主要应用是实时快速地实现各种数字信号处理算法。片内具有快速 RAM,具有强大数据处理能力和高运行速度,因此在语音信号处理方面DSP芯片具有天生的优势,但是DSP芯片价格过于昂贵,在小词汇量的语音识别系统中应用,性价比不高。3.采用凌阳SPCE061A单片机为控制核心,内嵌7通道10位电压模一数转换器(ADC)和单通道声音模一数转换,声音模一数转换器输入通道内置麦克风放大器和自动增益控制(AGC)功能,其本身已经成为基本的语音处理平台。经过比较,本设计采用凌阳SPCE061A单片机为控制核心。凌阳SPCE061A不仅仅具有普通单片机的性价比,同时也初步具有了DSP的能力,能够对复杂的语音信号进行处理,符合本设计对控制核心的要求。第3章 语音识别基础语音识别是解决机器“听懂”人类语言的一项技术。作为智能计算机研究的主导方向和人机语音通信的关键技术,语音识别技术一直受到各国科学界的广泛关注。如今,随着语音识别技术研究的突破,其对计算机发展和社会生活的重要性日益凸现出来。以语音识别技术开发出的产品应用领域非常广泛,如声控电话交换、信息网络查询、家庭服务、宾馆服务、医疗服务、银行服务、工业控制、语音通信系统等,几乎深入到社会的每个行业和每个方面。3.1 语音识别的分类语音识别技术有三大研究范围:口音独立、连续语音和辨认词的数量。按照语音识别的三大研究范围语音识别可具体分为:1.按照服务对象划分:可以分为特定人语音识别系统(Speaker Dependent,SD)和非特定人语音识别系统(Speaker Independent,SI)。特定人语音识别(SD)仅考虑对特定人的语音进行识别,在使用前对特定的辨认词汇作简单快速的训练,记录使用者的声音特性加以辨认。非特定人语音识别(SI)则无需训练即可使用,无须进行训练辨认。2.按照说话人说话方式划分:可以分为孤立字(词)语音识别系统、连接字语音识别系统以及连续语音识别系统。孤立字(词)辨认为了确保每个字音可以正确地切割出来,必须一个字一个字分开来念,非常不自然,与我们平常说话的连续方式,还是有点不同。连续字语及连续语音辨认:只要按照你正常说话的速度,直接将要表达的说出来,中间并不需要停顿,这种方式是最直接最自然的,难度也最高,现阶段连续语音的辨识率及正确率,虽然效果还不错但仍需再提高。然而,中文字有太多的同音字,因此目前所有的中文语音辨识系统,几乎都是以词为依据,来判断正确的同音字。3.根据词汇量大小划分:每个语音识别系统都有一个词汇表(Vocabulary),系统只能识别词汇表中所包含的语句。按照词汇表中包含的词汇量的多少来分,可以分为小词汇量(10-100)、中等词汇量(100-1000)、大词汇量以及无限词汇量语音识别系统。一般来说,随着词汇量的增加,各个词汇之间的混淆性增加,系统的识别率会降低。3.2 语音识别的基本原理面向不同任务的语音识别系统有多种设计方案,但是系统的结构和模型思想都大致相同。语音识别系统本质上是一种模式识别系统,包括特征提取、模式匹配、参考语音模型库等三个单元,它的基本结构如图3-1所示。图3-1 语音识别基本流程由于语音信号是一种典型的非平稳信号,加之呼吸气流、外部噪音、电流干扰等使得语音信号不能直接用于提取特征,而要进行前期的预处理。预处理过程包括预滤波、采样和量化等。经过预处理的语音数据就可以进行特征参数提取。在训练阶段,将特征参数进行一定的处理之后,为每个词条得到一个模型,保存为模板库。在识别阶段,语音信号经过相同的通道得到语音参数,生成测试模板,与参考模板进行匹配,将匹配分数最高的参考模板作为识别结果。后续的处理过程还可能包括更高层次的词法、句法和文法处理等,从而最终将输入的语音信号转变成文本或命令等。3.3 语音识别的方法目前具有代表性的语音识别的方法主要有:特征参数匹配法、基于动态时间规整(DTW)算法、基于参数模型的隐马尔可夫模型(HMM)的方法、基于人工神经网络(ANN)等语音识别方法。1.特征参数匹配法其要点是:在训练过程中从训练语句中提取出代表语音本质的特征参数;在识别的过程中,从待识别的语音信号中按照同样的处理方法提取出语音参数。将训练语句的声音参数与待识别语音的声音参数进行对比,寻求语音参数与模板参数的相似性。语音参数与模板参数的匹配是语音识别系统的核心,同一个音由不同的人发出或同一个人在不同的时刻发出,不可能具有相同的时间长度,因此不能简单的把语音参数与模板参数进行匹配。2.动态时间规整(Dynamic Time Warping,DTW)DTW是把时间规整和距离测度计算结合起来的一种非线性规整技术,是较早的一种模式匹配和模型训练技术。该方法成功解决了语音信号特征参数序列比较时时长不等的难题,在孤立词语音识别中获得了良好性能。3.隐马尔可夫模型(hidden Markov model, HMM)隐马尔可夫模型是20世纪70年代引入语音识别理论的,它的出现使得自然语音识别系统取得了实质性的突破。目前大多数大词汇量、连续语音的非特定人语音识别系统都是基于HMM模型的。HMM是对语音信号的时间序列结构建立统计模型,将其看作一个数学上的双重随机过程:一个是用具有有限状态数的Markov链来模拟语音信号统计特性变化的隐含的随机过程,另一个是与Markov链的每一个状态相关联的观测序列的随机过程。前者通过后者表现出来,但前者的具体参数是不可测的。人的言语过程实际上就是一个双重随机过程,语音信号本身是一个可观测的时变序列,是由大脑根据语法知识和言语需要(不可观测的状态)发出的音素的参数流。HMM合理地模仿了这一过程,很好地描述了语音信号的整体非平稳性和局部平稳性,是较为理想的一种语音模型。4.人工神经元网络(Artificial Neural Networks,ANN)人工神经元网络在语音识别中的应用是目前研究的又一热点。ANN实际上是一个超大规模非线性连续时间自适应信息处理系统,它模拟了人类神经元活动的原理,最主要的特征为连续时间非线性动力学、网络的全局作用、大规模并行分布处理及高度的稳健性和学习联想能力。这些能力是HMM模型不具备的。但ANN又不具有HMM模型的动态时间归正性能。因此,人们尝试研究基于HMM和ANN的混合模型,把两者的优点有机结合起来,这也是目前研究的一个热点。第4章 语音识别系统硬件设计语音识别系统在硬件方面一共包括三大部分: 凌阳61开发板,电机驱动模块和小车车体结构。语音智能小车大部分的功能都是在凌阳61开发板上实现的,61开发板不仅包含了SPCE061A单片机的最小系统还有实现语音识别功能所必须的各种外围电路;电机驱动模块采用的全桥驱动电路方案,由PNP8550和NPN8050三极管搭建的电路控制小车的运动状态;语音小车车身采用的是普通的遥控赛车,将其中的遥控、接收模块拆除,仅仅保留车身的机械结构。小车整体结构见图4-1所示。凌阳61开发板电机驱动电路红外传感器车身 图4-1 小车整体结构示意图4.1 凌阳61开发板简介61开发板是SPCE061A EMU BOARD的简称,是以凌阳16位单片机SPCE061A为核心的精简开发仿真实验板(如图4-2所示),大小相当于一张扑克牌,是台湾凌阳公司专为大学生、电子爱好者等进行电子实习、课程设计、毕业设计、电子制作及电子竞赛所设计的,也可作为单片机项目初期研发使用。61板除了具备单片机最小系统电路外,还包括有电源电路、音频电路(含MIC输入部分和DAC音频输出部分)、下载调试电路等,采用电池供电(功能分区见图4-3)。 图4-2 凌阳61开发板实物 图4-3 凌阳61板功能分区4.1.1 输入输出(I/O)接口电路61板将SPCE061A的32个I/O口全部引出:IOA0IOA15,IOB0IOB15,详见图4-4,对应的SPCE061A引脚为:A口,4148、53、5460;B口,51、8176、6864。而且该I/O口是可编程的,即可以设置为输入或输出。二极管D1的作用:1、降压,4节电池的最大电压为6V,D1可以有效的降压;2、起到保护作用,能够有效的保护61开发板防止被电源烧坏。 图4-4 I/O接口电路4.1.2 音频输入电路正如我们在前面介绍的“61板”具有强大的语音处理功能,如图4-5所示,音频输入电路的核心为一个驻极体(见图4-5中X1),采集声音的原理就是声波使得驻极体内的介质产生振动,其内部的电阻发生变化,MICN两端的信号也随之发生变化,通过SPCE061A单片机内的信号比较器,就可以采集到声音信号。凌阳SPCE061A单片机的声音采集频率为8KHz,且具有自动增益(AGC)功能。AGC电路详见图4-5。 图4-5 MIC录入及AGC电路在图4-5中,采集声音电路的电源由SPCE061A的VMIC(37脚详见管脚分布图)供给。VCM是声音信号进行数模转换时,ADC参考电压输出引脚,接单片机的34引脚。AVSS1是电路板上的模拟地。MICP是扬声器的引脚的正极,连接单片机的33脚,MICN连接扬声器的负极。MICOUT是扬声器的第一级运放输出引脚,OPI是扬声器的第二级运放输入脚。此外,电路图中的电容及电阻的作用是滤波和限流,采集声音时去除噪声和干扰,提高声音信号的准确率。4.1.3 语音放大模块 凌阳61开发板语音放大电路所用的功率放大芯片为SPY0030A。SPY0030A能在较宽的电压范围内正常工作,2.4V6.0V都能正常工作,双端输出模式,该芯片具有较低的失真率。在5V供电电压,负载等效电阻为8及功率放大器的输出功率为500mW的情况下,其失真率仅为0.55%。维持该功率放大工作的最低电流仅需1uA。 图4-6 音频放大电路设计凌阳SPCE061A单片机具有两路DAC转换电路,在凌阳61板上采用的是DAC1转换电路。声音放大电路采用凌阳公司生产的SPY0030A功放芯片来放大语音信号,再外接一个小喇叭即可播放出声音。其中VDDH连接单片机的I/O参考电压,电压值为5V,为SPY0030A提供电源。VSS为数字地,AVSS2为模拟地2。具体见图4-6所示。4.1.4 电源电路好的电源设计是系统稳定工作的前提条件,特别是在凌阳61开发板这种有数字、模拟两部分电路的电路板中,电源部分的设计尤其重要。整个小车模型共有4个电源信号,分别为:电池电源,61开发板工作电源、小车驱动电路电源、单片机I/O电源。为了提高整个系统的工作稳定性,凌阳61开发板上的供电电源采用的是SPY0029电源芯片解决方案。电源电路见图4-7所示图4-7 电源模块 61开发板的电源从J10口接入,见图3-6所示,“61板”的内核SPCE061A电压要求为3.3V,而I/O端口的电压可以选择3.3V也可以选择5V。所以,在板子上具有两种工作电压:5V和3.3V。对应的引脚中15、36和7必须为3.3V, 对于I/O端口的电压51、52、75可以为3.3V也可以是5V,这两种电平的选择通过跳线J5来选择。“61板”的供电电源系统采用用户多种选择方式:1.5V供电 用户可以用4节电池来供电,5V直流电压直接通过SPY0029(相当于一般3.3V稳压器)稳压到3.3V,为整个“61板”提供了5V和3.3V两种电平的电压。另外也可以直接外接5V的直流稳压源供电,5V电压再通过SPY0029稳压到3.3V。 2.3.3V供电 用户可以提供直流3.3V电压为实验板进行供电,此时整个板子只有3.3V电压,I/O端口电压此时只有一种选择。 4.2 语音智能小车车体介绍4.2.1 智能小车车体结构设计语音智能小车车身以普通遥控玩具小车为基础,如图4-8所示为四轮结构。前面两个轮子为转向轮负责为小车提供转向的动力。由前轮电机控制,在连杆和支点作用下控制前轮左右摆动,来调节小车的前进方向。在自然状态下,前轮在弹簧作用下保持中间位置。后面两个轮子为动力轮负责为小车提供动力源,后面两个车轮由后轮电机驱动,为整个小车提供动力,如图4-9所示。图4-8 车体结构侧视图 图4-9 车体结构俯视图4.2.2 小车的行进原理分析模型小车共有四种基本运动状态,分别为前进、倒车、左拐、右拐。1.前进:由小车的结构分析,在自然状态下,前轮在弹簧作用下保持中间状态,这是只要后轮电机正转小车就会前进。如图 4-10 所示; 2.倒车:倒车动作和前进动作刚好相反,前轮电机仍然保持中间状态,后轮电机反转,小车就会向后运动,如图 4-11 所示; 3.左拐:前轮电机逆时针旋转(规定为正转),后轮电机正转,这时小车就会在前后轮共同作用下朝左侧前进,如图 4-12 所示; 4.右拐:前轮电机反转,后轮电机正转,这时小车就是会在前后轮共同作用下朝右侧前进,如图 4-13 所示 图4-10 小车前进原理图 图4-11 小车后退原理图 图4-12 小车左拐原理图 图4-13 小车右拐原理图4.3 直流电机驱动电路设计通过研究小车机械结构我们实现小车的行进状态的核心是实现对它的方向电机和动力电机的有效控制。本设计的两个电机均为直流电机且基于现有的小车车体结构,只需对电机实现简单的正反转控制即可实现对小车行进状态的控制。本设计采用三极管搭建的全桥电路实现对电机的驱动。4.3.1 全桥驱动电路原理全桥驱动又称H桥驱动,H 桥一共有四个臂,分别为B1B4 ,每个臂由一个开关控制,示例中为三极管Q1Q4 。 如果让Q1、Q2导通Q3、Q4关断,如图 4-14 所示,此时电流将会流经Q1、负载、Q2组成的回路,电机正转。 图 4-14 图 4-15 图 4-16 图 4-17如果让Q1、Q2关断Q3、Q4导通,如图 4-15 所示,此时电流将会流经Q3、负载、Q4组成的回路,电机反转。 如果让Q1、Q2关断Q3、Q4也关断,负载Load两端悬空,如图 4-16所示,此时电机停转。这样就实现了电机的正转、反转、停止三态控制。 如果让Q1、Q2导通Q3、Q4也导通,那么电流将会流经Q1、Q4组成的回路以及Q2和Q3组成的回路,如图 4-17所示,这时桥臂上会出现很大的短路电流。在实际应用时注意避免出现桥臂短路的情况,这会给电路带来很大的危害,严重的会烧毁电路。4.3.2 前后轮电机驱动设计动力驱动由后轮驱动实现,负责小车的直线方向运动,包括前进和后退,后轮驱动电路是一个全桥驱动电路,如图 4-18所示:Q1、Q2、Q3、Q4四个三极管组成四个桥臂,Q1和Q4组成一组,Q2和Q3组成一组,Q5控制Q2、Q3的导通与关断,Q6控制Q1和Q4的导通与关断,而Q5、Q6由IOB7 和IOB6 控制,这样就可以通过IOB7 和IOB6 控制四个桥臂的导通与关断控制后轮电机的运行状态,使之正转反转或者停转,进而控制小车的前进和后退。IOB7 和IOB6 不能同时置高电平,这样会造成后轮驱动全桥短路现象。 图4-18 动力电机驱动电路设计至于前轮转向电机,其电路和驱动电机的电路是一样的,如图4-19所示。只是其控制端口为IOB4、IOB5,且在IOB4和IOB5都为低电平时,前轮在弹簧的作用下保持在中间位置,所以通过控制IOB4、IOB5以及IOB6、IOB7端口的状态组合就可以得到小车不同的运动方式。图4-19 转向电机驱动设计结合以上对前轮和后轮的状态分析,得到小车的运行状态与输入的对照表,如表3-1所示:表4-1 输入与小车运动状态对照表IOB7IOB6IOB5IOB4后电机前电机小车状态0000停转停转停0100正转停转前进1000反转停转倒退0101正转正转左前进0110正转反转右前进1001反转正转左后退1010反转反转右后退11*停转*禁止*11*停转* 4.4 红外避障模块设计导盲智能小车在工作过程中要求不仅能够根据使用者的相关语音指令执行动作同时也要及时的避开障碍物并发出相关提示声。为了确定障碍物,在小车上必须安装避障传感器进行简易避障,一般障碍检测传感器的选择有两种:1.利用红外避障传感器。这种方法简单实用,也很稳定,而且接口电路简单,甚至不用单独设计接口电路。但是其体积较大,而且检测距离不够远。图4-20 红外避障传感器2.利用超声波。这种方法较为复杂,特别是接口电路的设计,有一定的难度,但其具有体积小、灵敏度高、检测距离远、对障碍物要求不高等优点。本设计采用的是E18-D80NK-N红外避障传感器来实现避障功能,该传感器不需要复杂的外围电路,直接连接单片机的I/O口即可。在检测障碍物的过程中采用查询方式,查询传感器输出端电平状态确定是否有障碍物。该红外传感器在输出低电平时,表示无障碍物;反之,则有高电平输出,存在障碍物,其检测原理如图4-20所示,检测程序见第五章。第5章 基于凌阳单片机的语音识别系统本设计所涉及到的语音识别系统均是基于凌阳SPCE061A硬件开发平台的特定人、孤立词及连词、小词汇量的语音识别系统。该语音识别系统采用特征参数匹配方法实现语音识别,主要有语音训练和语音识别两个部分组成。语音训练是为语音识别提供语音数据库,而语音识别则是根据将待匹配的语音参数跟语音库的数据进行对比,二者匹配或相似即可成功进行语音识别。在进行语音训练前先判断其是否训练,如果已经训练过那么直接调用凌阳单片机Flash上的语音数据库,如果没有经过训练则执行语音训练函数进行训练。具体流程见图5-1所示。图5-1 凌阳单片机语音识别流程5.1 语音压缩简介实现语音识别的前期准备就是要对普通的语音信号进行处理,将模拟的(连续的)语音信号数字化、离散化,以便于计算机进行处理。这个过程主要包括采样和量化两个方面。影响数字音频质量的因素主要有:采样频率和量化位数。此外声道的数目和采样的设备也是影响数字音频质量的重要因素。在实际的运用过程中,未经压缩编码的音频数据量极大,直接对其进行传输、存储或处理是不现实的。因此有必要对语音信号中冗余信息进行处理,对庞大的语音信号进行压缩,这样既可以用较少的资源建立更多的信息同时也减少了处理器在处理语音信号时的负担。语音压缩编码中的数据量是指:数据量=( 采样频率×量化位数)/8( 字节数)×声道数目。通过对语音信号的压缩,达到高效率存储和转换资料的结果,即在保证一定声音质量的条件下,以最小的资料率来表达和传送声音信息。下面介绍几种常见的语音压缩编码格式: 1.波形编码:将时域信号直接变换为数字代码,力图使重建语音波形保持原语音信号的波形形状。波形编码的基本原理是在时间轴上对模拟语音按一定的速率抽样,然后将幅度样本分层量化,并用代码表示。译码是其反过程,将收到的数字序列经过译码和滤波恢复成模拟信号。波形编码特点:高话音质量、高码率,适于高保真音乐及语音。2.参数编码:参数编码又称为声源编码,是将信源信号在频