小波去噪语音识别.ppt
《小波去噪语音识别.ppt》由会员分享,可在线阅读,更多相关《小波去噪语音识别.ppt(32页珍藏版)》请在三一办公上搜索。
1、笪庆1,方超2,单梦凡3,封孔飞4DaQing1,FangChao2,ShanMengfan3,FengKongfei4061221015061221021061221016061221022,摘要:语音作为一个交叉学科,具有深远的研究价值,近 50 年的研究发展,语音识别技术已经有了极大的发展,但大多数产品能存在与实验室,没有达到使用化的效果,所以语音识别的研究还要更加深入。本为主要阐述了小波变换在语音信号去噪的应用,语音端点的检测,语音特征的提取及一种简单的语音识别算法。,引言语音识别系统构成语音信号的小波去噪语音信号的端点检测语音特征的提取基于DTW的语音识别算法实验结果及分析,让计算机
2、能听懂人类的语言,是人类自计算机诞生以来梦寐以求的想法。随着计算机越来越向便携化方向发展,随着计算环境的日趋复杂化,人们越来越迫切要求摆脱键盘的束缚而代之以语音输入这样便于使用的、自然的、人性化的输入方式。尤其是汉语,它的汉字输入一直是计算机应用普及的障碍,因此,利用汉语语音进行人机交互是一个极其重要的研究课题。它正在直接与办公、交通、金融、公安、商业、旅游等行业的语音咨询与管理,工业生产部门的语声控制,电话、电信系统的自动拨号、辅助控制与查询,以及医疗卫生和福利事业的生活支援系统等各种实际应用领域相接轨,并且有望成为下一代操作系统和应用程序的用户界面了。,前端处理包括语音的录入、处理、特征值
3、的提取后端是个夸数据库的搜索过程,分为训练和识别训练是对所建的模型进行评估、匹配、优化,获得模型参数识别是一个专用的搜索数据库,获取前端数值后,有声学模型、一个语言模型和一个字典,声学模型表示一种语言的发音声音,可以通过训练来识别特定用户的语音模型和发音环境的特征,语言模型是对语料库单词规则化的概率模型。字典列出了大量的单词及发音规则。总体上说,语音识别是一个模式识别匹配的过程。在这个过程中,计算机首先要根据人的语音特点建立语音模型,对输入的语音信号进行分析,并抽取所需的特征,在此基础上建立语音识别所需的模板。然后,在识别过程中,计算机根据语音识别的整体模型,将计算机中已经存有的语音模板与输入
4、语音信号的特征进行比较,并根据一定的搜索和匹配策略找出一系列最优的与输入语音匹配的模板。最后通过查表和判决算法给出识别结果。显然,识别结果与语音特征的选择、语音模型和语言模型的好坏、模板是否准确等都有直接的关系。,语音去噪技术是语音信号处理的一个重要分支,它在解决噪声污染、改进语音质量、提高语音可懂度等方面发挥着越来越重要的作用。当噪声与语音的频谱相似时,传统的单纯时域或频域处理往往无法达到很好的效果。小波变换是一种多尺度的信号分析方法,是分析非平稳信号的有力工具。它克服了短时傅里叶变换固定分辨率的弱点,既可以分析信号的概貌,又可以分析信号的细节。利用小波变换实现信号去噪,具有很好的效果。小波
5、阈值去噪方法是实现最简单、计算量最小的一种方法,因而得到了最广泛的应用,设(t)L2(R)(L2(R)表示平方可积的实数空间,即能量有限的信号空间),其傅立叶变换为()。当()满足允许条件:,时,我们称(t)为一个基本小波或母小波,将母函数(t)经伸缩或平移后,就可以得到一个小波序列。,对于连续的情况,小波序列为,其中a为伸缩因子,b为平移因子。对于离散的情况,小波序列为,对于任意的函数f(t)L2(R)的连续小波变换为,,,小波去噪方法大致可分为三类,第一类是基于小波变换模极大值原理进行去噪;第二类是对含噪声信号作小波变换之后,计算相邻尺度间小波系数的相关性,根据相关性区别小波系数的类型;第
6、三类是阈值去噪。阈值去噪即对小波系数设置阈值,在众多小波系数中,把绝对值较小的系数置为零,而让绝对值较大的系数保留或收缩,然后对阈值处理后的系数进行小波逆变换,直接进行信号重构,即可达到去噪的目的。小波阈值去噪的主要理论依据为:信号在小波域内其能量主要集中在有限的几个系数中,而噪声的能量却分布于整个小波域内。因此经小波分解后,信号的小波变换系数要大于噪声的小波变换系数。于是可以找到一个合适的数作为阈值,当小波系数小于该阈值时,认为这时的小波系数主要是由噪声引起的;当小波系数大于该阈值时,则认为其主要是由信号引起的。选择一个合适的阈值,对小波系数进行阈值处理,就可以达到去除噪声而保留有用信号的目
7、的。,实验中通过改进matlab系统函数ddencmp求解得阈值,并对阈值进行了一定修改,由于实验中阈值很小,在经过多次比较后,决定把已经求得的阈值thr+0.3作为重建小波的阈值。,含高斯白噪声的随机信号,去噪后的信号,对于简单的直接加入高斯噪声的信号,去噪效果还是比较理想的,但在具体实验中,环境变量等其他因素引起的噪声情况比较复杂,效果并没有以上明显。考察主要因素还是阈值的确定存在缺陷,故还应在阈值函数上多加改进,语音信号的端点识别是语音处理和语音识别的基础,然而在噪声环境下识别语音信号的端点往往比较困难的。我们采用的是经典的双门限检测法,为了区分噪音和语音,很直观的一种方法是用信号的幅度
8、作为特征,只要设定一个门限,当信号的幅度超过该门限的时候,就认为语音开始,当幅度降低到门限以下就认为语音结束。实际上,一般我们是使用短时能量的概念来描述语音信号的幅度的。对于输入的语音信号x(n),其中n为采样点,首先进行分帧的操作,将语音信号分成2030毫秒一段,相邻的两帧之间有1020毫秒的交叠。具体的帧长和帧移随采样频率不同而不同。,对于第i帧,第n个样本,他与原始语音信号的关系为:,第i帧语音信号的短时能量可以用下面几种算法得到:,将语音信号分帧后计算每帧的短时能量,再设一个门限,就可以实现一个简单的端点检测算法。但是这样的算法是很不可靠的,因为人的语音分清音和浊音两种。浊音为声带振动
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 小波去噪 语音 识别
链接地址:https://www.31ppt.com/p-5969869.html