语音识别在多媒体课件中的应用研究.docx

资源ID：2030570 资源大小：412.22KB 全文页数：3页
资源格式： DOCX 下载积分：16金币

快捷下载

会员登录下载

三方登录下载：

下载资源需要16金币

邮箱/手机：
温馨提示：	用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）
支付方式：
验证码：	换一换

加入VIP免费专享

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

5、试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓。

网站客服

侵权投诉

语音识别在多媒体课件中的应用研究.docx

语音识别在多媒体课件中的应用研究于洪涛 121内蒙古民族大学教育科学学院内蒙古通辽 0280002吉林大学高等教育研究所吉林长春 130012内容提要：在介绍Macromedia公司的多媒体开发工具Authorware和微软公司的 Speech SDK 5.1语音开发包的基础上，通过FLASH动画设计课件实例，详细的论述了Authorware中结合MS Speech SDK 5.1开发语音识别多媒体课件的方法。关键词：Authorware MS Speech SDK 多媒体课件语音识别一、引言语言是人类交流信息最自然、最有效和方便的手段，让多媒体课件能听懂我们说的话，并按照我们的命令去运行，是多媒体课件开发所追求的目标。利用语音识别技术，就能够实现这个目标。语音识别是机器通过识别和理解过程把语音信号转变为相应的文本文件或命令的技术。目前，语音识别技术已经从实验室走向实用，许多公司都提供语音识别引擎，IBM公司的ViaVoice嵌入式语音识别系统，微软公司推出的Speech SDK提供了一个语音识别和语音合成的二次开发平台，可以识别英语、简体中文和日语，这些语音识别系统为开发语音识别多媒体课件提供了物质条件。目前，国内许多学者利用Speech SDK开发出了语音识别系统。例如火车票查询系统中语音识别的研究及实现1，机器人手术网络遥控系统中的语音识别2，都是利用Speech SDK结合VC+开发的。VC+开发工具，并不适合普通教师用来开发多媒体课件，那么，能不能在教师熟悉的开发软件，如Authorware中实现语音识别功能就是有待于解决的问题。二、Authorware开发语音识别多媒体课件概述微软公司 Speech SDK提供关于语音（Speech）处理的一套应用程序编程接口SAPI（Speech Application Programming Interface）。SAPI提供了实现文字-语音转换（Text-to-Speech）和语音识别（Speech Recognition）程序的基本函数，简化了语音编程的难度，降低了语音编程的工作量。Speech SDK采用COM标准开发，地层协议都以COM组件的形式完全独立于应用程序层，为应用人员屏蔽掉复杂的语音技术，充分体现了COM的优点。VC+、VB等程序都可以开发语音识别程序，目前，大部分基于Speech SDK语音识别程序都是用VC+开发的，用VC+、VB等开发工具开发多媒体课件，对大多数教师来说有一定的难度。Authorware是开发多媒体课件最常用的工具之一，提供了十一种交互，利用这些交互方式可以开发出优秀课件。许多教师都在运用Authorware开发课件，并且取得了丰富的研究成果。在论文在Authorware中实现多媒体数据库的构造与查询3中介绍了如何在Authorware中访问本地数据库，在论文运用Authorware7.0制作多媒体课件的几点技巧4中介绍制多媒体课件经验技巧。笔者查阅了大量关于语音识别和Authorware的资料，目前国内还没有用Authorware结合Speech SDK开发具有语音识别的功能的多媒体课件的案例。而大部分教师都参加Authorware培训，有一定的Authorware开发多媒体课件的经验，那么能不能用Authorware结合Speech SDK开发语音识别多媒体课件那？Authorware并不支持COM编程，不能直接调用Speech SDK。笔者通过搜索发现alSR.U32扩展函数5，alSR.U32是Authorware的一个外部函数，里面提供了一组函数可以让Authorware利用Speech SDK实现语音识别。因此我们可以在Authorware中通过调用外部函数来调用Speech SDK来开发语音识别多媒体课件。三、FLASH动画设计语音识别课件实例（一）FLASH动画设计课件简介FLASH动画设计多媒体课件是用Authorware开发的，讲解FLASH的五种动画设计方法，既能用与课堂教学，又适合于个别化学习，课件主菜单如图1所示图1Flash动画设计课件菜单（二）FLASH动画设计课件语音识别实现FLASH动画设计课件提供了鼠标交互和语音识别两中方式来选取教学内容，用鼠标选取按钮或说出按钮的名称都能进入相应教学内容，关于鼠标交互请参考其他书籍，这里只讨论语音识别的方式。我们可以运用语音来控制课件的运行，说出教学内容的名字，进入相应的学习内容，说“上一页”、“下一页”来进行翻页，说“返回”返回到主菜单，说“退出”关闭课件。Speech SDK提供了两种识别方式，听写识别方式和命令识别方式，由于听写识别方式识别率底，不能满足教学要求，在这里采用命令识别方式。本程序是用Authorware6.5开发，结构如图2。图2 Flash动画设计结构图1命令识别模式在命令识别模式计算图标中输入如下代码：alSRActivate(WindowHandle,2,FileLocation"111.xml","srevent")功能是选择从111.xml文件中读取命令词库，并把识别的文字赋给变量srevent。其中111.xml是命令词库，在本例中，内容如下：<?xml version="1.0" encoding="GB2312" ?> <grammar langid="804"> /804是汉语识别ID，409是英语识别ID<rule name="命令" toplevel="active"> <l> 逐帧动画 形状渐变动画 移动补间动画 引导线动画 遮罩动画 返回 退出 下一页 上一页 </l> </rule> </grammar>2判断识别内容根据识别到的语音命令，利用条件交互，结合goto()函数跳转到相关的学习内容，实现用命令来控制课件的运行。例如，用srevent =逐帧动画来判断学生是否说的是“逐帧动画”如果是用goto(Iconid”逐帧动画”)来跳转到指定的教学内容。四、结论本文讨论了Authorware调用Speech SDK实现语音识别的一种方法，并开发了FLASH动画设计课件，经过测试Speech SDK命令语音识别模式的识别率能够满足教学要求。在多媒体课件中运用语音识别技术更能体现出多媒体课件的人性化和智能化。参考文献：1、吴萍,胡瑞敏,等.火车票查询系统中语音识别的研究及实现J.计算机工程与应用,2003,(33).2272、周振辉,富钢, 陈文楷.机器人手术网络遥控系统中的语音识别J.2004,(6).283、周国强,吴新玲.在AUTHORWARE中实现多媒体数据库的构造与查询J.中国电化教育 2004,(1). 864、蔡儒冠.运用Authorware7.0制作多媒体课件的几点技巧J.中国电化教育2004,(8).765、

注意事项

本文（语音识别在多媒体课件中的应用研究.docx）为本站会员（小飞机）主动上传，三一办公仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知三一办公（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。