575203498毕业设计(论文) 智能语音玩具设计.doc
《575203498毕业设计(论文) 智能语音玩具设计.doc》由会员分享,可在线阅读,更多相关《575203498毕业设计(论文) 智能语音玩具设计.doc(45页珍藏版)》请在三一办公上搜索。
1、第一章 引言1.1 选题意义音识别以语音为研究对象,它是语音信号处理的一个重要研究方向,是模式识别的一个分支,涉及到生理学、心理学、语言学、计算机科学,以及信号处理等诸多领域,其最终目的是实现人与机器进行自然语言通信,用语言操纵计算机。 语音识别系统的分类方式及依据是根据对说话人说话方式的要求,可以分为孤立字(词) 语音识别系统,连接字语音识别系统,以及连续语音识别系统。 进一步分为两个方向:一是根据对说话人的依赖程度可以分为特定人和非特定人语音识别系统;二是根据词汇量大小,可以分为小词汇量、中等词汇量、大词汇量,以及无限词汇量语音识别系统。 不同的语音识别系统,虽然具体实现细节有所不同,但所
2、采用的基本技术相似,一个典型语音识别系统的实现过程如图1 所示。 图1目前,在智能语音玩具的研究中,语音这种人类最简单、最自然、最方便和最有效的交换信息的方式,在玩具上的应用还较少,显然,在玩具系统上增加语音接口,用语音代替键盘输入,并进行人机对话,让玩具能听会说,不仅十分诱人,而且具有广泛的应用前景,同时,也是玩具智能化的重要标志之一.而语音识别技术是近年来十分活跃的研究领域,语音识别系统的实用化研究是语音识别研究的一个主要方向。本文设计了一款智能语音交互式玩具系统,该玩具可以实现识别语音命令,完成相应的背唐诗、做算术题、唱歌等功能, 融合了较高的娱乐性, 也是未来智能语音玩具的一个发展方向
3、。1.2 当今应用领域智能语音拿玩具的发展趋势融合类个人电子终端发展到今天,我们已经看到PMP、手持游戏机、UMPC、PDA,以及智能手机的各显神通。但是在另一个领域玩具领域,智能玩具正在悄悄兴起,成为新一类的融合电子终端,代表着世界玩具业发展的趋势。在香港的玩具出口量中传统玩具包括洋娃娃的出口数字出现负增长,其占整体出口的比重,由2005年的约七成下跌至2007年的约五成,而非传统的智能玩具的比重,则由2005年的约27%上升至2007年的48%。说明互动性、高科技玩具已渐渐成为发展主流,电脑技术与玩具结合已成为创新的方向。去年,高科技玩具在美国玩具市场上的销售额已达到100亿美元,增长速度
4、远远高于传统玩具。2007年世界智能玩具销售收入达到23.5亿美元。 In-Stat预计到2012年这个数字将增长到90亿美元。智能玩具市场相比其他融合终端绝对是新兴市场,因为智能玩具是基于现成的主流融合终端上的技术而产生的创新,相对成本较低,不仅可以给投资者提供较好的投资回报,而且还有很好的市场反应。同时,中国内地玩具人均消费与欧美国家差距巨大,存在着很大的智能玩具市场空间。1.3 本课题主要研究内容智能语音玩具是现代玩具发展的一个必然趋势,其市场上的主要功能可以分为语音对话,即是由人与玩具进行对话模式,在有限的范围能,语音玩具能自动进行回答或者提问,根据芯片的语言编写不同,回答和提问的范围
5、也不同。 1.3.1 玩具设计要求 1、基本要求 (1)、简单语音对话交流 (2)、语音点播: 、唱儿歌 、朗诵古诗 、说英语 、讲科普知识 、讲笑话本项目志在开发一个将语音识别技术,传感器技术等技术引用其中,并集教育性、娱乐性和互动性于一体的智能玩具控制系统。 第二章 单片机及相关器件介绍2.1 STC10L08XE 单片机介绍 2.1.1 STC11/10xx系列单片机简介STC11lOxx系列单片机是宏晶科技生产的单时钟机器周期(IT)的单片机,是高速低功耗超强抗干扰的新一代8051单片机,指令代码完全兼容传统8051,但速度快8-12倍。内部集成高可靠复位电路,针对高速通信,智能控制,
6、强干扰场合。11/lOxx系列单片机的定时器0/定时器1串行口与传统8051兼容,增加了独立波特率发牛器,省去了定时器2。传统8051的111条指令执行速度全面提速,最快的指令快24倍,最慢的指令快3倍。v 增强型8051 CPU,IT,单时钟机器周期,指令代码完全兼容传统8051。v 工作电压: STCIIFxx系列工作电压:5.5V - 4.1V3.7V (5V单片机); STCIILxx系列工作电压:3.6V - 2.4V2.1V (3V单片机); STCIOFxx系列工作电压:5.5V - 3.8V3.3V (5V单片机); STCIOLxx系列工作电压:3.6V - 2.4V2.1V
7、 (3V单片机)。v 工作频率范围:035MHz,相当于普通8051的0420MHz。v STCIIF/Lxx系列单斤机用户应用程序空间: 1/2/3/4/5/6/8/16/20/3 2/40/4 8/5 2/5 6/60/62K字节。 STCIOF/Lxx系列单片机用户应用程序空间:4K6K8K10K12K14K字节。v STCllxx系列单片机:片上集成1280字节或256字节RAM; STCllxx系列单片机:片上集成512字节或256字节RAM。v 通用I/O口(36/40/12/14/16个)每个1/0口驱动能力均可达到20mA,复位后为 (1)、准双向口弱上拉(普通8051传统1/
8、0口); (2)、可设置成四种模式: 、准双向口弱上拉; 、强推挽强上拉; 、仅为输入高阻; 、开漏 。 v ISP(在系统可编程)IAP(在应用可编程),无需专用编程器,无需专用仿真器。 可通过串口(RxD/P3.0,TxD/P3.1)直接下载用户程序,数秒即可完成一片。v 有EEPROM功能。v 看门狗。v 内部集成MAX810专用复位电路(晶体频率在24MHz以下时,要选择高的复位门 槛电压,如4.1V以下复位,晶体频率在12MHz以下时,可选择低的复位门槛电压, 如3.7V以下复位,复位脚接IK电阻到地)。v 内置一个对内部Vcc迸行掉电检测的掉电检测电路,可设置为中断或复位。5v单片
9、 机掉电检测门槛电压为4.IV/3. 7V附近,3.3V单片机掉电检测门槛电压为2.4V附近。v 时钟源:外部高精度晶体时钟,内部R/C振荡器。用户在下载用户程序时,可选择是使用内部R/C振荡器还是外部晶体时钟; 常温下内部R/C振荡器频率为:4MHz8MHz;精度要求不高时,可选择使用内部时钟,但因为有制造误差和温漂,以实际测试为准。v 共2个16位定时器(与传统8051兼容的定时器计数器,16位定时器TO和T1), STCllxx/; STClOxx全系列都有1个独立波特率发牛器(故小必用T2做为波特率发牛器,详 细使用方法请参考独立波特率发牛器做串口通讯的相关使用说明及示例程序)。v 3
10、个时钟输出口,可由TO的溢出在P3. 4/TO输出时钟,可由Tl的溢出在P3. 5/TI 输出时钟,独立波特率发生器可以在Pl.0口输出时钟(部分型号无独立波特率发牛器,详情请参阅单片机选型一览表)。v 外部中断I/O口5路,传统的下降沿中断或低电平触发中断, Power Down模式可 v 由外部中断唤醒,INTO/P3.2,INTl/P3.3,INT/TO/P3.4,INT/T1/P3.5, INTINT/RxD/P3.0 r或INT/RxD/P1.6)。v PowcT、Down(掉电)模式可由内部掉电唤醒之用定时器唤醒(STCllxx系列有 此功能, STClOxx无此功能),也口J由上
11、而提到的外部中断口中断唤西星,由 于INT/RxD支持卜降沿中断,故也可支持远程通信唤醒。v 一个独立的通用全双工异步串行口(UART),做主机时可以当2个串口便用 RxD/P3.0,TxD/P3.1可以切换到RxD/PI.6,TxD/PI.7,通过将串口在P3口和Pl口之间来回切换,将1个串口作为2个主串口分时复用,可低成本实现2个串口,当然有其局限性。v 工作温度范围:-40 - +85(工业级)0- 75(商业级)。v 封装:SOP16/DIP16/DIP18/SOP20/DIP20/LSSOP20/PDIP-40/LQFP-44/PLCC-44(暂时尽量不要选PLCC44) 。SOP1
12、6/DIP16有12个1/0口,DIP18有14个1/0口,SOP20/PDIP20/LSSOP20有16个1/0口 ,LQFP44有40个1/0口,PDIP40/QFN40 (5mmx5mm)有36个1/0口。 2.1.2 STC11/10xx系列单片机的内部结构STC11lOxx系列单片机的内部结构框图如图2-1所示。STC11lOxx单片机中包含中央处理器(CPU)、程序存储器(Flash)、数据存储器(SRAM)、定时计数器、UART串口、I/O接口、看门狗及片内RjC振荡器和外部晶体振荡电路等模块。STC11lOxx系列单片机几乎包含了数据采集和控制中所需的所有单元模块,可称得上一个
13、片上系统。2.2 主要器件介绍LD3320LD3320芯片(图2-2)是一款“语音识别”专用芯片,由ICRoute公司设计生产。该芯片集成了语音识别处理器和一些外部电路,包括AD、DA转换器、麦克风接口、声音输出接口等。本芯片在设计上注重节能与高效,不需要外接任何的辅助芯片如Flash、RAM等,直接集成在现有的产品中即可以实现语音识别声控人机对话功能。并且,识别的关键词语列表是可以任意动态编辑的。 ( 图2-2 ) 2.2.1 功能介绍l 通过ICRoute公司特有的快速而稳定的优化算法,完成非特定人语音识别。不需要用户事先训练和录音,识别准确率95%。l 不需要外接任何辅助的Flash芯片
14、,RAM芯片和AD芯片,就可以完成语音识别功能。真正提供了单芯片语音识别解决方案。l 每次识别最多可以设置50项候选识别句,每个识别句可以是单字,词组或短句,长度为不超过10个汉字或者79个字节的拼音串。另一方面,识别句内容可以动态编辑修改,因此可由一个系统支持多种场景。l 芯片内部已经准备了16位A/D转换器、16位D/A转换器和功放电路,麦克风、立体声耳机和单声道喇叭可以很方便地和芯片管脚连接。立体声耳机接口的输幽功率为20mW,而喇叭接口的输出功率为550mW,能产生清晰响亮的声音。l 支持并行和串行接口,串行方式可以简化与其他模块的连接。l 可设置为休眠状态,而且可以方便地激活。l 支
15、持MP3播放功能,无需外围辅助器件,主控MCU将MP3数据依次送入LD3320芯片内部就可以从芯片的相应PIN输出声音。产品设计可以选择从立体声的耳机或者单声道喇叭来获得声音输出。支持MPEGI(ISO/IEC11172-3), MPEG2(ISO/IEC13818-3)和MPEG 2.5 layer 3等格式。l 工作供电为3. 3V,如果用于便携式系统,使用3节AA电池就可以满足供电需要。2.2.2 电路说明 以下为内部电路的简单逻辑图(图23): (图23)详细说明如下:电压要求:VDD 数字电路用电源输入 3. 0 V - 3. 3 VVDDIO 数字1/0电路用电源输入 1. 65
16、V - VDDVDDA 模拟电路用电源输入 3. 0 V - 4. 0 V建议用户可以用统一的3. 3v电压输入以简化设计。数字电压和模拟电压进行隔离可以使得芯片有更好的效果。芯片管脚输入电压范围:高电压(逻辑“1”):0. 7;lcVDDIOVDDIO 低电压(逻辑“0”):00. 3VDDIO因此,开发者需要保证自己使用的主控MCU同样工作在3.3v,保证主控MCU向LD3320的管脚输出的高电压不超过3.3V。v 时钟(Clock)芯片必须连接外部时钟,可接受的频率范围是4-48MHz;而芯片内部还有PLL频率合成器,可产生特定的频率供内部模块使用。v 复位对芯片的复位信号(RSTB:1
17、:)必须在VDD/VDDA/VDDIO都稳定后进行。无论芯片正在进行何种运算,复位信号都可以使它恢复初始状态,并使各寄存器复位。如果没有后续的指令(对寄存器的设置),复位后芯片将进入休眠状态。此后,一个CSB:1:信号就可以重新激活芯片进入工作状态。v 并行接口本芯片可通过并行方式和外部主CPU连接,此时使用8根数据线(PO-P7),4个控制信号(WRB#,RDB#,CS冰,AO),以及一个中断返回信号(INTB#)。v 串行接口串行接口通过SPI协议和外部主CPU连接,首先要将MD接高电平,而将(SPIS:1:)接地。此时只使用4个管脚:片选(SCS冰)、SPI时钟(SDCK)、SPI输入(
18、SDI)和SPI输出(SDO)。v 寄存器对芯片的设置和命令,包括传送数据和接受数据,都是通过对寄存器的操作来完成的。例如进行语音识别时,设置识别的关键词语列表,设定芯片的识别模式,谀别完成后获得识别结果都是通过读写寄存器来完成。播放声音时,就是将MP3格式的数据循环放入FIFO对应的寄存器。(识别结果是通过寄存器返回识别出的关键词语在关键词语列表中的排列序号Index数值,该Index数值是在设置关键词语列表时指定)。v 喇叭音量的外部控制除了特定寄存器来控制音量以外,芯片外部的电路可以控制喇叭的音量增益。使用的是EPI、EP2、EP3对应的管脚。2.2.3 管脚分布图(图24)(图24)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 575203498毕业设计论文 智能语音玩具设计 575203498 毕业设计 论文 智能 语音 玩具 设计

链接地址:https://www.31ppt.com/p-3930797.html