《基于单片机的语音识别系统毕业设计.doc》由会员分享,可在线阅读,更多相关《基于单片机的语音识别系统毕业设计.doc(48页珍藏版)》请在三一办公上搜索。
1、基于单片机的语音识别系统摘要近几年来,智能化和自动化技术在玩具制造领域中越来越被关注。本文介绍一种智能化小车控制系统的设计语音控制小车。语音控制小车是基于SPCE061A的代表性兴趣产品,它配合61板推出,综合应用了SPCE061A的众多资源,小车采用语音识别技术,可通过语音命令对其行驶状态进行控制 。首先介绍了SPCE061A的主要性能及其引脚的功能;接着完成了电源电路、复位电路、键盘电路、音频输入电路,音频输出电路和无线控制电路等硬件功能模块的设计。软件设计模块能实现智能小车的前进、后退、转向、停止、避障、表演动作以及循线等功能。测试表明,在环境背景噪音不太大,控制者的发音清晰的前提下,语
2、音控制小车的语音识别系统能对特定的语音指令做出智能反应,做出预想中的有限的动作关键词:spec061a 语音识别 驱动电路 声控小车 智能反应AbstractIn recent years, Intelligent and automation technology in the toy manufacture have been paid more and more attention.Introduce an intelligent vehicle control system design. SPCE061A program the system to single-chip, base
3、d on implementation of the cars voice control, This paper introduces the hardware sub-system design and implementation. The SPCE061As main characters and pin function are introduced firstly. Completed the power circuit, reset circuit, keyboard circuitry, audio input circuits, audio output circuit an
4、d control circuit of wireless hardware such as the design of function modules. Software design module can achieve smart car forward, backward, turn, stop, obstacle avoidance, performing actions, as well as on-line functions. Test showed that the background noise in the environment is not too great,
5、control persons under the premise of clear pronunciation, voice control car speech recognition systems for specific voice commands to make intelligent reaction, limited to the desired action.Keywords: spec061a 、voice recogniton、Driving circuit、Voice control dolly、intelirent response 目录摘要IAbstractII目
6、录III前言11 方案介绍及设计简介21.1小车的控制要求及设计方案21.1.1小车的控制要求21.1.2方案设计与论证21.2SPCE061A 简介31.2.1SPCE061A单片机概述51.2.2SPCE061A的介绍71.2.3SPCE061A的结构71.3SPCE061A 单片机强大的语音功能81.3.1语音识别的原理81.3.2系统的结构框图91.4语音控制小车设计要求101.4.1功能要求101.4.2语音控制小车的主要功能101.4.3参数说明101.4.4注意事项102电路设计及程序设计112.1电路设计基础知识112.2电路方框图及说明132.3各部分电路设计132.3.1电
7、机的选择142.3.2继电器驱动电路的设计142.3.3行驶状态控制电路设计152.3.4麦克录音输入及AGC电路162.3.5语音播报电路183软件设计193.1软件流程图及设计思路说明193.1.1程序设计203.2模块设计203.2.1中断流程图部分203.2.2语音识别部分224连接和操作说明254.1硬件模块连接图254.1.1功能说明254.1.2代码下载264.1.3训练小车274.1.4声控小车284.1.5重新训练28总结30致谢31参考文献32附件1 系统程序说明33前言语音识别技术是近年来十分活跃的研究领域。语音识别系统的实用化研究是语音识别研究的一个主要方向。以玩具市场
8、为例,具有高科技含量的电子玩具、智能玩具发展迅猛,电子互动式、智能化玩具已经成为玩具行业发展的主流。我国是玩具生产和出口大国,但在高科技玩具的发展方面和国外的差距很大,因此,及时投入精力广泛开展这方面的研究,无论对技术创新应用,还是社会经济发展,都有巨大的现实意义。与机器进行语音交流,让机器明白你说什么,这是人们长期以来梦寐以求的事情。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。语音识别功能大大增加了玩具使用的乐趣,并使玩具体现出一定的智能性,因此成为大部分电子玩具、智能玩具设计中使用的关键技术。
9、 本文利用凌阳单片机设计一个具有语音识别功能的智能遥控小车。该设计将遥控车由传统的手动遥控改成了语音识别遥控,集成了先进的语音识别技术,加上小车的机动灵活的特点,使控制者可以通过语音控制小车实现预设动作,从而释放控制者的双手,而且小车和控制者之间还具有一定的交互功能。所以此次研究具有较强的实用性和发展前景。1 方案介绍及设计简介1.1 小车的控制要求及设计方案1.1.1 小车的控制要求论文设计的要求是要用语音来控制小车的行驶状态。根据开始语音训练录制的语音命令来控制小车的前进、倒退、左转、右转和停止;在行驶的过程中小车通过光电传感器自动检测障碍物,并且自动避开障碍物绕道行驶。在整过行驶过程中小
10、车自动记录行驶的路程和时间。1.1.2 方案设计与论证本系统为典型的实时控制系统,易用单片机控制来实现,这里以凌阳SPCE061A单片机为主控元件,提出两种设计方案。方案一:采用凌阳SPCE061A十六位单片机,对小车的整个行驶过程进行实时监控,完成所有功能需要24个I/O口,由于凌阳SPCE061A单片机提供32个I/O口,一片即可实现所有功能,这为设计过程提供了极大方便。其主要设计思想是:小车上,安装一个霍尔元件利用单片机的IOB3外部中断判别轮胎转数的结果用以计算路程;安装三个检测障碍物的光电检测器和一个碰撞开关,利用IOB4、IOB5、IOB6用扫描的方式来控制拐弯和返回;利用单片机的
11、IOB8-IOB11控制继电器选择小车的正、反向行驶;凌阳SPCE061A十六位单片机提供了丰富的时基信源和时基中断,给设计者以大量的选择空间,并给设计者提供精确的时基计数,其加减速通过大功率电阻消耗功率来实现。整体框架如图1,这种方案可以使程序简单,易于控制。方案二:此方案也采用凌阳SPCE061A十六位单片机,与第一种方案不同之处在于利用单片机的IOB8 、IOB9产生控制调速的脉宽和控制小车的正、反行驶,用凌阳SPCE061A十六位单片机的TimeA和TimeB很容易实现脉宽调制,这大大加强了用脉宽调制控制加减速的可选性,但对继电器要求较高,这里考虑到大众化设计,采用第一个方案。IOB5
12、IOB6DAC2数据线IOA8-IOA14DAC1片选端IOB8-IOB11IOB4IOB8-IOB11左凌阳SPCE061A单片机 中右光电检测障碍物霍尔元件检测轮子转数用来计算路程光电检测障碍物LED显示电路音频放大电路语音输 出主控电路正反向IOB3图1 系统原理框图1.2 SPCE061A 简介在众多的单片机中,如C51、ARM、AVR等,我们选择了凌阳系列的单片机,采用的是凌阳61单片机,因为它本身具有音频处理功能,我们板子上具有音频输出,输入通道,具有麦克风,扬声器等硬件。在凌阳公司提供的开发环境中本身就具有关于音频处理的库函数以及音频压缩软件,在进行处理的时候比较容易,所以我们选
13、择凌阳61的单片机,基本结构如下图所示:凌阳61单片机及硬件基本结构SPCE061A 是凌阳科技研发生产的性价比很高的一款十六位单片机,使用它可以非常方便灵活的实现语音的录放系统,该芯片拥有8 路10 位精度的ADC,其中一路为音频转换通道,并且内置有自动增益电路。这为实现语音录入提供了方便的硬件条件。两路10 精度的DAC,只需要外接功放(SPY0030A)即可完成语音的播放。另外凌阳十六位单片机具有易学易用的效率较高的一套指令系统和集成开发环境。在此环境中,支持标准C 语言,可以实现C 语言与凌阳汇编语言的互相调用,并且,提供了语音录放的库函数,只要了解库函数的使用,就会很容易完成语音录放
14、,这些都为软件开发提供了方便的条件:SPCE061A 片内还集成了一个ICE(在线仿真电路)接口,使得对该芯片的编程、仿真都变得非常方便,而ICE 接口不占用芯片上的硬件资源,结合凌阳科技提供的集成开发环境(unSP IDE)用户可以利用它对芯片进行真实的仿真;而程序的下载(烧写)也是通过该接口进行下载。SPCE061A 是继nSP系列产品SPCE500A等之后凌阳科技推出的又一款16位结构的微控制器。与SPCE500A不同的是,在存储器资源方面考虑到用户的较少资源的需求以及便于程序调试等功能,SPCE061A里内嵌32K字的闪存(FLASH)。较高的处理速度使nSP能够非常容易地、快速地处理
15、复杂的数字信号。因此,与SPCE500A相比,以nSP为核心的SPCE061A微控制器是适用于数字语音识别应用领域产品的一种最经济的选择。1.2.1 SPCE061A单片机概述随着单片机功能集成化的发展,其应用领域也逐渐地由传统的控制,扩展为控制处理、数据处理以及数字信号处理(DSP,Digital Signal Processing)等领域。凌阳的16位单片机就是为适应这种发展而设计的。它的CPU内核采用凌阳最新推出的nSP(Microcontroller and Signal Processor)16位微处理器芯片(以下简称nSP)。围绕nSP所形成的16位nSP系列单片机(以下简称nSP
16、家族)采用的是模块式集成结构,它以nSP内核为中心集成不同规模的ROM、RAM和功能丰富的各种外设接口部件,如图2所示。nSP内核是一个通用的核结构。除此之外的其它功能模块均为可选结构,亦即这种结构可大可小或可有可无。借助这种通用结构附加可选结构的积木式的构成,便可形成各种不同系列派生产品,以适合不同的应用场合。这样做无疑会使每一种派生产品具有更强的功能和更低的成本。 nSP家族有以下特点:(1)体积小、集成度高、可靠性好且易于扩展 nSP家族把各功能部件模块化地集成在一个芯片里,内部采用总线结构,因而减少了各功能部件之间的连线,提高了其可靠性和抗干扰能力。另外,模块化的结构易于系统扩展,以适
17、应不同用户的需求。其结构式模块图如下: nSP家族的模块式结构(2)具有较强的中断处理能力 nSP家族的中断系统支持10个中断向量及10余个中断源,适合实时应用领域。 (3)高性能价格比 nSP家族片内带有高寻址能力的ROM、静态RAM和多功能的I/O口。另外,nSP的指令系统提供具有较高运算速度的16位16位的乘法运算指令和内积运算指令,为其应用增添了DSP功能,使得nSP家族运用在复杂的数字信号处理方面既很便利,又比专用的DSP芯片廉价。 (4)功能强、效率高的指令系统 nSP指令系统的指令格式紧凑,执行迅速,并且其指令结构提供了对高级语言的支持,这可以大大缩短产品的开发时间。(5)低功耗
18、、低电压 。nSP家族采用CMOS制造工艺,同时增加了软件激发的弱振方式、空闲方式和掉电方式,极大地降低了其功耗。另外,nSP家族的工作电压范围大,能在低电压供电时正常工作,且能用电池供电。这对于其在野外作业等领域中的应用具有特殊的意义。1.2.2 SPCE061A的介绍SPCE061A 是继nSP系列产品SPCE500A等之后凌阳科技推出的又一款16位结构的微控制器。与SPCE500A不同的是,在存储器资源方面考虑到用户的较少资源的需求以及便于程序调试等功能,SPCE061A里内嵌32K字的闪存(FLASH)。较高的处理速度使nSP能够非常容易地、快速地处理复杂的数字信号。因此,与SPCE5
19、00A相比,以nSP为核心的SPCE061A微控制器是适用于数字语音识别应用领域产品的一种最经济的选择。1.2.3 SPCE061A的结构 SPCE061A的结构1.3 SPCE061A 单片机强大的语音功能凌阳音频处理过程:自己录取一段不大于4Kb的WAV语音文件或者从原有WAV语音文件中截取一段不大于4KB的语音。然后用凌阳语音压缩工具压缩,再将压缩后的文件添加到凌阳公司提供的开发环境中,程序经过单片机处理后,语音通过喇叭播放出来。如图下图所示: 凌阳音频识别过程1.3.1 语音识别的原理首先是语音训练,然后是语音匹配,接着进行语音处理。如果匹配成功就执行相应的功能,否则重新匹配。如下图所
20、示:语音识别系统简图1.3.2 系统的结构框图如图下图所示: 智能车系统结构框图系统组成主要包括以下两部分:SPCE061A精简开发板、语音小车控制电路板。图中的语音输入部分MIC_ IN、按键输入KEY、声音输出部分的功率放大环节等已经做到了精简开发板61板上,为我们使用提供了很大的方便。在电机的驱动方面,采用全桥驱动技术,利用四个I/O端口分为两组分别实现两个电机的正传、反转和停三态运行。1.4 语音控制小车设计要求1.4.1 功能要求语音控制小车基于SPCE061A的代表性兴趣产品,它配合61板推出,综合应用了SPCE061A的众多资源,小车采用语音识别技术,可通过语音命令对其行驶状态进
21、行控制。1.4.2 语音控制小车的主要功能可以通过简单的I/O操作实现小车的前进、后退、左转、右转功能; 配合SPCE061A的语音特色,利用系统的语音播放和语音识别资源,实现语音控制的功能; 可以在行走过程中声控改变小车运动状态; 在超出语音控制范围时能够自动停车1.4.3 参数说明车体:双电机两轮驱动 供电:电池(四节AA:1.2V4 或1.5V4) 工作电压:DC 4V6V 工作电流:运动时约200mA1.4.4 注意事项 注意电池的正负极性,切勿装反; 长期不用请将电池取出电池盒,以免造成腐蚀; 由于小车行动比较灵活,速度比较快,在使用时一定要注意保持场地足够大,且保证不会对周围的物体
22、造成伤害; 不要让小车长时间运行在堵转状态(堵转状态:由于小车所受阻力过大,造成小车电机加电但并不转动的现象),这样会造成很大的堵转电流,有可能会损坏小车的控制电路。2 电路设计及程序设计2.1 电路设计基础知识(1) 二极管:英文是diode。二极管的正、负二个端子(如图8);正端A称为阳极,负端K 称为阴极。电流只能从阳极向阴极方向移动。一些初学者容易产生这样一种错误认识:“半导体的一半是一半的半;面二极管也是只有一半电流流动(这是错误的),所有二极管就是半导体 ”。其实二极管与半导体是完全不同的东西。我们只能说二极管是由半导体组成的器件。半导体无论那个方向都能流动电流。 二极管电子流动图
23、(2) 三极管:三极管在电子电路中组成震荡电路、放大电路。 已知型号和管脚排列的三极管,可按下述方法来判断其性能好坏(a) 测量极间电阻。将万用表置于R100或R1k挡,按照红、黑表笔的六种不同接法进行测试。其中,发射结和集电结的正向电阻值比较低,其他四种接法测得的电阻值都很高,约为几百千欧至无穷大。但不管是低阻还是高阻,硅材料三极管的极间电阻要比锗材料三极管的极间电阻大得多。(b) 三极管的穿透电流ICEO的数值近似等于管子的倍数和集电结的反向电流ICBO的乘积。ICBO随着环境温度的升高而增长很快,ICBO的增加必然造成ICEO的增大。而ICEO的增大将直接影响管子工作的稳定性,所以在使用
24、中应尽量选用ICEO小的管子。通过用万用表电阻直接测量三极管ec极之间的电阻方法,可间接估计ICEO的大小,具体方法如下:万用表电阻的量程一般选用R100或R1k挡,对于PNP管,黑表管接e极,红表笔接c极,对于NPN型三极管,黑表笔接c极,红表笔接e极。要求测得的电阻越大越好。ec间的阻值越大,说明管子的ICEO越小;反之,所测阻值越小,说明被测管的ICEO越大。一般说来,中、小功率硅管、锗材料低频管,其阻值应分别在几百千欧、几十千欧及十几千欧以上,如果阻值很小或测试时万用表指针来回晃动,则表明ICEO很大,管子的性能不稳定。(c) 测量放大能力()。目前有些型号的万用表具有测量三极管hFE
25、的刻度线及其测试插座,可以很方便地测量三极管的放大倍数。先将万用表功能开关拨至挡,量程开关拨到ADJ位置,把红、黑表笔短接,调整调零旋钮,使万用表指针指示为零,然后将量程开关拨到hFE位置,并使两短接的表笔分开,把被测三极管插入测试插座,即可从hFE刻度线上读出管子的放大倍数。另外:有此型号的中、小功率三极管,生产厂家直接在其管壳顶部标示出不同色点来表明管子的放大倍数值,其颜色和值的对应关系如表所示,但要注意,各厂家所用色标并不一定完全相同。 检测判别电极(a) 判定基极。用万用表R100或R1k挡测量三极管三个电极中每两个极之间的正、反向电阻值。当用第一根表笔接某一电极,而第二表笔先后接触另
26、外两个电极均测得低阻值时,则第一根表笔所接的那个电极即为基极b。这时,要注意万用表表笔的极性,如果红表笔接的是基极b。黑表笔分别接在其他两极时,测得的阻值都较小,则可判定被测三极管为PNP型管;如果黑表笔接的是基极b,红表笔分别接触其他两极时,测得的阻值较小,则被测三极管为NPN型管。(b) 判定集电极c和发射极e。(以PNP为例)将万用表置于R100或R1k挡,红表笔基极b,用黑表笔分别接触另外两个管脚时,所测得的两个电阻值会是一个大一些,一个小一些。在阻值小的一次测量中,黑表笔所接管脚为集电极;在阻值较大的一次测量中,黑表笔所接管脚为发射极。 判别高频管与低频管高频管的截止频率大于3MHz
27、,而低频管的截止频率则小于3MHz,一般情况下,二者是不能互换的。 在路电压检测判断法在实际应用中、小功率三极管多直接焊接在印刷电路板上,由于元件的安装密度大,拆卸比较麻烦,所以在检测时常常通过用万用表直流电压挡,去测量被测三极管各引脚的电压值,来推断其工作是否正常,进而判断其好坏。2.2 电路方框图及说明系统原理框图如图1所示。主控元件采用凌阳SPCE061A单片机,属于凌阳unSP.系列产品的一个16位结构的微控制器。在存储器资源方面考虑到用户的较少资源的需求以及便于程序调试等功能,SPCE061A里只内嵌32K字的闪存(FLASH),但用在此系统上已经绰绰有余。较高的处理速度使unSP.
28、能够非常容易地、快速地处理复杂的数字信号。因此以unSP.为核心的SPCE061A微控制器也适用在数字语音识别应用领域。SPCE061A在2.6V3.6V工作电压范围内的工作速度范围为0.32MHz49.152MHz,较高的工作速度使其应用领域更加拓宽。2K字SRAM和32K字FLASH仅占一页存储空间,32位可编程的多功能I/O端口;两个16位定时器/计数器;32768Hz实时时钟;低电压复位/监测功能;8通道10位模-数转换输入功能并具有内置自动增益控制功能的麦克风输入方式;双通道10位DAC方式的音频输出功能,这就为本系统的特定人辨识和语音播报打下了基础。2.3 各部分电路设计2.3.1
29、 电机的选择 市场上的电机种类很多,有各自的优缺点。电机类别如表2: 电动机 交直流两用电动机步进电动机交流电机交流伺服电动机同步电机异步电机直流电机电磁式直流电动机他励并励串励复励永磁直流电动机直流伺服电动机直流力矩电动机无刷直流电动机开关磁阻电动机小车控制分为:前进、倒退、左转、右转和停止。如果考虑用单向电机来控制,将不能使电机进行反方向转动,也就不能实现自动左转、右转。再考虑到经济,实惠,决定用直流伺服电动机。2.3.2 继电器驱动电路的设计由于单片机I/O口提供的电流太小,不能直接驱动继电器工作。在这里采用8050NPN管来提供一个开关电压,实现I/O口对继电器的驱动;用IN4007去
30、掉继电器断开时线圈产生的反向电流,保护8050NPN管不被损坏。继电器驱动电路如下图所示。 8050NPNR11KVCC_BARDIODED1J1RELAY 1N0 继电器驱动电路2.3.3 行驶状态控制电路设计如图13所示为行使状态控制电路,整个小车的行驶状态由两个电机MOTOR A和MOTOR B来控制;MOTOR A控制小车的左边两个轮子,MOTOR B控制小车右边两个轮子。具体控制如表4所示行驶状态控制电路表4 行驶状态控制表行驶状态IOB08IOB09IOB10IOB11地址继电器状态前进10100x00A0RE1,RE3闭合倒退01010x0050RE2,RE4闭合左转01100x
31、0060RE2,RE3闭合右转10010x0090RE1,RE4闭合注:图中的两个电机完全相同,这样能更好地保持小车的稳定性,在前进上两个电机能在加减速度上完全达到同步,不会走S路线,如果考虑用一个电机控制转向,而另外一个控制速度和返回的话,由于控制转向的电机电路未接入分压电阻,当速度不处于最快速度时,小车前进不能走直线,而是向一边偏,导致路线不对。2.3.4 麦克录音输入及AGC电路麦克风电路如图16所示。凌阳的SPCE061A是16位单片机,具有DSP功能,有很强的信息处理能力,最高时钟可达到49M,具备运算速度高的优势等等,这为语音的播放、录放、合成及辨识提供了条件。本系统接入MIC电路
32、如下图所示,MIC为录制语音辨识命令服务。 麦克录音输入及AGC电路下图是MIC录放流程图。开始ADC音频初始化定时器初始化为8K空操作中断入口取AD数据送DA通道清中断退出中断MIC录放流程图下图是简化的语音识别原理图,其中实线部分成为训练模块,虚线部分为识别模块。辨认特定的使用者即特定语者(Speaker Dependent,SD)模式,使用者可针对特定语者辨认词汇(可由使用者自行定义,如人名声控拨号),即在启动小车前,系统将会提示输入语音命令作简单快速的训练纪录,在这里输入“启动”“停止”“返回”和“模式切换”四个语音命令,通过使用者的声音特性来加以辨认。随着技术的成熟,进入语音适应阶段
33、SA(speaker adaptation),使用者只要对于语音辨识核心,经过一段时间的口音训练后,即可拥有不错的辨识率。声学模式训练复杂声学、言语条件下的语音输入语音匹配语音模式训练语音模型识别结果、理解结果语音处理语言模型语音识别原理图2.3.5 语音播报电路音频部分的原理图如下所示,在下图中可以看到两个跳线,其作用在于可以测量DAC的输出波形;另外拔掉跳线,可以断开DAC到喇叭放大的通路,使得DAC通道处于开路状态。这样便于用DAC做其他用途,用户可以用过这个跳线来加入自己的外围电路。音频原理及放大电路图凌阳音频压缩算法根据不同的压缩比分为以下几种:SACM-A2000:压缩比为8:,8
34、:1.25,8:1.5 SACM-S480: 压缩比为80:3,80:4.5 SACM-S240: 压缩比为80:1.5 按音质排序:A2000S480S240用凌阳Compress Tool事先把所需要的语音信号录制好,本系统共包括十多个语音资源,整个语音信号经凌阳SACM_S480压缩算法压缩只占有13.2K存储空间,SPCE061A单片机具有32k闪存,使用内部flash即可满足要求。凌阳SPCE061A单片机自带双通道DAC音频输出, DAC1、DAC2转换输出的模拟量电流信号分别通过AUD1和AUD2管脚输出, DAC输出为电流型输出,所以DAC输出经过SPY0030音频放大,以驱动
35、喇叭放音,放大电路如图19(只列出了DAC1,DAC2类似),这为单片机的音频设计提供了极大方便。在它们后面接一个简单的音频放大电路和喇叭即可实现语音播报功能,音频的具体功能主要通过程序来实现。3 软件设计软件设计部分是小车控制的的核心,通过软件编程来控制小车的行驶状态。3.1 软件流程图及设计思路说明开始语音切换命令语音命令训练语音启动训练扫描IOB4、IOB5和IOB6等待语音命令进行拐弯和返回处理软件流程图3.1.1 程序设计主程序见附录(1)3.2 模块设计3.2.1 中断流程图部分SPCE061单片机有两个外部中断,分别为EXT1和EXT2,两个外部输入脚分别为B口的IOB2和IOB
36、3的复用脚。EXT1(IOB2)和EXT2(IOB3)两条外部中断请求输入线,用于输入两个外部中断源的中断请求信号,并允许外部中断以负跳沿触发方式来输入中断请求信号。EXT1(IOB2)为黑线检测,确定小车位置,EXT2(IOB3)为轮子转数检测用于计算路程。IRQ4用做整个行程的时间计数。开IRQ3和IRQ4寄存器组出栈清中断标志位清中断标志位寄存器压栈保护中断返回是IRQ3中断吗IRQ3_EXT1中断吗清中断标志位IRQ3_EXT2中断吗车轮转速中断服务流程图3.2.2 语音识别部分在这里我们用的是SPCE061的特定语者辨识SD(Speaker Dependent),SD即语音样板由单个
37、人训练,也只能识别训练某人的语音命令,而他人的命令识别率较低或几乎不能识别。(1) 语音的准备:可利用计算机进行录音,选择录音效果一般的MIC比较好,因为小车跑动时要受环境的影响,效果一般的MIC录制的音更加接近凌阳单片机上的MIC所录制的。录制语音可为:“yeah”,“烦不烦”,“前进”,“倒退”,“拐就拐”。分别保存名称为:yeah.48k、qj.48k、dt.48k zg.48k、yg.48k.语音录制时,注意录制属性设置,最好选择为8Khz, 16位,单声道。语音录制好后,保存格式为“.wav”,利用凌阳单片机光盘内目录“TOOLSs480”下的工具进行语音压缩后放在程序目录“voic
38、e”下边,然后修改配置文件“Makefile”中的OBJFILES的值以及对应的语音文件的目录地址值和“clean”的值 ,并且配置值顺序必须对应于语音训练的过程。该程序模块包括三部分:训练样本、识别、语音提示。具体程序见主程序。见下图整体框图。初始化BSR_DeleteSDGroup(0)启动实时监控BSR_EnableCPUIndicator()调用训练模块TrainWord(intWordID, intRespondID)初始化识别器BSR_InitRecognizer(BSR_MIC)辨识处理BSR_GetResult() 语音辨识整体框图在程序中我们通过五条语句的训练演示特定人连续音
39、识别,其中第一条语句为触发名称。另外四条为命令,训练完毕开始辨识当识别出触发名称后,开始发布命令,则会听到自己设置的应答,具体流程图如图22。(2) 关于语音识别库函数的算法分析:众所周知,嵌入式语音识别最大难点在于如何在硬件资源相对有限(相对与PC机而言)的情况下,实现大量数据处理的语音识别算法。特别的,SPCE061A自带2K字的RAM,这样小容量的RAM空间是如何存储数据量较大的语音命令,是值得探讨的问题。时域分析中,语音信号作为缓慢时变的信号,在一小段时间里,例如10ms20ms,语音信号的特性基本不变,这些短段具有固定特性,短段间经常有一定的重叠,组合成一段语音,我们把语音信号分成这
40、样的小段(称为“帧”)作为提取语音信号特性的单元,这样的方法称为“短时”处理法。当以8K/S的速率采集语音信号时,假设以20ms为帧周期,加上12ms的帧移,帧长32ms,即每帧包括256个语音采集点,一个帧的特性参数占用1个字RAM,则存储一条2S长的语音命令信号占用2s/20ms*1=100字,与直接存储采样的语音数据相比更能节省嵌入式系统有限的硬件资源。在外界噪音的干扰下,对语音起止点的判别非常重要,若声音指令信号提取的不恰当,那么所得到的声音指令信号和我们发出的指令信号就会有很大的出入,不但会延迟语音识别的时效性,甚至会降低对这些语音信号的识别率。对语音信号的提取,主要是确定音头和音尾
41、的位置,即端点识别。常用的方法有短时能量和过零率等几种。短时能量表示了语音信号的幅度,其定义式为:(公式3)初始化定义存储器为BSR_DeleteSDGroup调用第一条提示音播放PlayRespond(RSP_INTR)训练名称TrainWord(NAME_ID,0)成功否?训练第一条命令TrainWord(CONMAMD_ONE_ID,1)成功否?训练第二条命令TrainWord(CONMAMD_TWO_ID,2)成功否?训练第三条命令TrainWord(CONMAMD_THREE_ID,3)成功否?开始识别辨别器初始化BSR_InitRecognizer(BSR_MIC)启动实时监控BS
42、R_EnableCPUIndicator()调用提示语音放PlayRespond(RSP_STAR)获取语音数据BSR_GetRessult()辨识主循环训练第四条命令TrainWord(CONMAMD_FOUR_ID,4)成功否? 语音辨识具体流程图短时平均过零率为一帧语音信号穿越零电平的次数,表示了短时信号的频率,其定义如下:(公式4)两式中的N为一帧语音的采集点数。语音采集过程中,计算当前一帧或多帧数据的能量或过零率数值,当大于预先设定的阈值时,即认为找到了语音命令的起始点,结束点的确定方法类似。在截取音头音尾间的信号并分帧后,我们就可以以帧为单位进行特征参数的提取,如线性预测倒谱系数法
43、。选择合适的特征参数,与语音样板参数通过动态时间弯折算法匹配,即可得出相应的识别结果。4 连接和操作说明4.1 硬件模块连接图连线图4.1.1 功能说明1. 小车运动控制:通过SPCE061A的I/O端口,驱动控制板的H桥电路,进而控制前轮电机和后轮电机。2. 声控功能:利用特定人语音识别实现小车的名称和动作训练,并根据相应的语音指令输入执行前进、后退、左转、右转、停车等动作。3. 定时控制功能:利用时基定时器设定运行时间,小车运行同时启动定时器,时间到小车停止运行。4.1.2 代码下载硬件连接完成之后,检查无误,接下来就可以下载程序了。具体的步骤为: 第一步:打开集成开发环境,打开“CarD
44、emo.spj”文件,编译链接。(注意:如果看不到CarDemo.spj,请在弹出的对话框中选择打开类型为spj或者所有文件) 第二步:点击菜单ProjectSelect Body,或者直接点击 图标打开如图 3-2所示的对话框: 图 7-3 Select Body对话框 第三步:在弹出的对话框中选择Body Name为SPCE060A_061A,选择Probe为Auto,点击OK按钮确定。 第四步:点击IDE工具栏上的图标选择Use ICE模式。 第五步:按F8快捷下载按钮,下载代码。4.1.3 训练小车成功下载程序以后,去掉下载线并复位系统(如果使用EZ-Probe还应将Probe选择跳线
45、S5拔去),小车就会提示对它进行训练。训练采用应答式训练,每条指令的训练次数为两次,每一条命令的训练过程都是一样的,以“前进”为例说明: 步骤一:小车提示“前进”; 步骤二:告诉小车“前进”; 步骤三:小车提示“请再说一遍”(重复训练提示音); 步骤四:再次告诉小车“前进”(重复训练一次)。 这是一个完整的训练过程,如果训练成功,小车会自动进入下一条指令的训练,并会提示下一条指令对应的动作;如果没有训练成功,小车会提示“说什么暗语呀”或者“没有听到任何声音”等信息,这样的话就要重复刚才所说的四个步骤,直到成功为止。整个的训练过程共有5次这样的训练,依次为:名称前进后退左拐右拐。整个的训练流程如下图所示: 小车训练流程图4.1.4 声控小车训练完小车之后,怎样进行声控操作,让小车运动或者停下来呢? 可以直接对小车说前进,或者倒车、左拐、右拐等,小车如果识别出指令会有一个回应信号,告知你它要执行的动作,然后执行该动作。如果想要小车执行其它动作,直接告诉小车将要执行动作对应的指令即可。比如在前进时告诉小车“倒车”,小车识别出之后就会直接倒车。如果在小车训练过程中想要小车停下来,可以直接呼叫小车的名字,小车准确识别之后就会停下来。4.1.5 重新训练在实际的使用过程当中,可能会对训练的结果不满意,或者其他人也想对它进行训练、控制。这样就要求小车可以被重新训
链接地址:https://www.31ppt.com/p-3940378.html