信息检索论文新疆少数名族语言语音识别技术的研究.doc
《信息检索论文新疆少数名族语言语音识别技术的研究.doc》由会员分享,可在线阅读,更多相关《信息检索论文新疆少数名族语言语音识别技术的研究.doc(12页珍藏版)》请在三一办公上搜索。
1、 目录摘要1关键词11 前言21、1语音识别技术概述21、2中国少数民族语言概述32 新疆少数民族语言发音特点分析42、1 中国少数民族语音特性分析42、2 中国少数民族语音识别研究现状53 少数语言研究中的关键技术和模型63、1语音识别技术流程63、2预处理算法63、2、1语音信号的获取63、2、2语音信号的降噪增强73、3端点检测算法73、4 针对语音特征建立语音识别模型83、5少数民族的语言模型84 建立相关的语音库85 结论9致谢9参考文献11新疆少数名族语言语音识别技术的研究摘要:语音识别是当今语音研究的热点,它是一门涉及多领域的交叉学科,也是模式识别和人工智能领域的重要分支。针对新
2、疆有着55个少数民族这一实际情况,不少语言都处于濒临状态,因此,本文主要介绍了语音识别在少数民族语言应用中的技术和概况。希望利用这一数字化技术达到保护少数民族语言文化遗产的目的。在新疆,少数民族尤其是维吾尔族在新疆人口中占有60%的比例。新疆地区官方语言是汉语和维吾尔语由于维吾尔语的语音特性,使得维汉之间的语言差异很大,正是这种少数民族的构成、人口与语言文字状况,使少数民族语言文字信息技术的开发与应用成为新疆信息化建设中不可或缺的一个重要方面,也是国家信息化的基础之一。而研究维吾尔语的语音识别技术是新疆信息化建设的内容之一,自然具有重大的研究意义。到目前为止,国外无一机构(包括微软、IBM等跨
3、国公司)能够实现对维吾尔语的实时识别以及合成。所以目前国际上在此领域的成果还是一片空白。而纵观目前新疆民族语言信息技术研发与应用现状,目前新疆信息业内还没有一个完备的维吾尔语的语音识别软件。随着新疆经济的发展,旅游资源的开发,维吾尔语人机对话系统的开发工作已是一个很紧迫的任务。语音系统广泛的应用市场以及维吾尔族用户所占比例表明维吾尔语语音识别系统研究开发工作的必要性及不可忽视的广阔的市场前景。维吾尔语语音识别研究不仅会给新疆地区语音研究领域建立牢固的基础,也将对促进维吾尔语言文化的繁荣、发展和科技进步具有积极的意义。关键词:语音识别,隐马尔可夫,数字化处理,少数民族语言1 前言:近几年,新疆的
4、语音识别技术趋于成熟,发展迅速,尤其是大词汇表汉语语音识别系统的研究使人们看到了语音技术走向大众化、实用化的愿景。至今为止,汉语的朗读及口语语音识别都已经达到了一个较好的识别性能,声学模型自适应、发音自适应等各种技术被广泛使用。无论是听写机、电话语音识别还是口语对话识别都正处于实验转化阶段。然而,新疆少数名族的语言文字博大精深,中文除汉语外还包含各种少数民族语言。各少数民族语言语音识别技术的研究还处于初期阶段。新疆地处中国西北边陲和亚欧大陆腹地,少数民族人数占新疆总人口的60.13%。这种特殊的地理、文化、环境原因,造成该地区在研究少数民族语音文字方面的优势。近年来,少数民族语言语音文字处理技
5、术的研究已逐步成为热点,在国家自然科学基金、社会科学基金和各部委研究基金的支持下,现代维吾尔语口语语料库建设不断完善,非特定人连续语音识别的研究水平有所提高。研究由固定内容、固定模式的朗读语音,逐步转向灵活性较强的口语对话。研究维吾尔语语音识别中发音变异现象将有助于提高少数民族语言语音基础和应用研究水平,探索和拓宽少数民族语音识别的研究道路,保证科研资源的共享和科学研究的延续性,既加速了推进。 1、1语音识别技术概述语音识别技术,也被称为自动语音识别(Automatic Speech Recognition, ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编
6、码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。语音识别技术是以语音信号处理为研究对象,让机器接收并识别、理解语音信号,并将其转换为相应数字信号的技术。让机器听懂人类的语言,这是人们长期以来梦寐以求的事情,而语音识别是一门非常复杂的交叉性学科,它涉及语音语言学、计算机科学、信号处理学、生理学、心理学等一系列学科,是模式识别的重要分支。50年代,是语音识别研究工作的开始时期,它以贝尔实验室研制成功可识别十个数字的Audry系统为标志。20世纪80年代语言识别研究进一步走向深入,基于特定人孤立语音技术的系统研制成功。在过去的30年里,隐马尔
7、可夫模型和人工神经元网络在语音识别中得到了成功的应用。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。并通过算法和计算机技术相结合的方式来实现。目前,这样的系统能够做到识别理解数十万条词汇的连续语音信号。这种现代模式识别系统除了在语音领域的应用外,还可以广泛应用于信号处理和模式识别的其他领域。语音识别一般分为两个步骤:学习和识别阶段。学习阶段的任务是建立识别基本单元的声学模型以及语言模型。识别阶段是将输入的目标语言的特征参数和模型进行比较,得到识别结果。语音识别系统本质上讲是一种模式识别系统,其原理如下图所示:图1语音识别原理示意图该流程简单
8、介绍如下:(1) 语音采集设备如话筒、电话等将语音转换成模拟信号。(2) 数字化一般包括预滤波、采样和A/D变换。该过程将模拟信号转变成计算机能处理的数字信号。(3) 预处理一般包括预加重、加窗分帧。经预处理后的信号被转换成了帧序列的加窗的短时信号。(4) 参数分析是对时信号进行分析并提取语音特征参数的过程,如时域、频域分析,矢量量化等。(5) 语音识别是目标语音根据特征参数与模型库中的参数进行比较,产生识别结果的过程。一般有模板匹配法、随机模型法和神经网络等。1、2中国少数民族语言概述语言是一种特殊的社会资源, 语言资源由语言本体和语言应用两部分构成。语言本体包括语音、词汇、语法、语义系统,
9、 是语言资源的物质基础语言应用包括人类社会对语言的各种使用及其所产生的影响, 是语言资源价值的具体体现。中国是一个统一的多民族国家,已确定民族成分的有56个民族,有55个人口较少的民族。多民族、多语言、多文种(文字和语音)并存是我国的一个基本国情。除回族、满族已全部转用汉语外,其他54个民族都有自己的语言,有30个民族有余自己的语言相一致的文字;分七种语系。由于有的民族使用一种以上的语言或文字,如瑶族使用3种语言,高山族使用13多种语言;傣族使用4种文字,景颇族使用2种文字等,因此,共有73种语言,55多种文字,63多种语言。随着社会开放程度的不断提高 ,民族语言文字的使用有衰退的趋势 ,中国
10、一些使用人口比较少的民族语言已经处于濒临状态 ,民族语言文字的消亡 ,直接危及民族文化的繁荣和发展 ,抢救和保护民族语言文字资源 ,是繁荣和发展民族文化的重要前提 ,而且刻不容缓。2 新疆少数民族语言发音特点分析 2、1 中国少数民族语音特性分析其中由于新疆爱那个是个多民族的省市,个少数民族的语音各有其特点,先统计如下表:表 1 新疆少数民族语言语音情况表表2 新疆少数民族语言语音情况表-续表1表3 新疆少数民族语言语音情况表-续表2表4 新疆少数民族语言语音情况表-续表32、2 中国少数民族语音识别研究现状在语音识别的领域中主要涉及到的研究内容包括:语音信号处理、特征提取和选择;语音识别模型
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息 检索 论文 新疆 少数 语言 语音 识别 技术 研究
链接地址:https://www.31ppt.com/p-4020886.html