欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > DOC文档下载  

    小波及其在语音信号处理中的应用.doc

    • 资源ID:3942311       资源大小:405KB        全文页数:8页
    • 资源格式: DOC        下载积分:8金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要8金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    小波及其在语音信号处理中的应用.doc

    小波及其在语音信号处理中的应用谭鹏(北京邮电大学信息工程学院博士B006班 B20000073087)摘要 : 本文是作者在学习现代信号处理小波部分时的一些体会和心得的总结,全文分为两部分。第一部分讨论了小波的基本概念,小波的分类,多分辨率分析及Mallat算法和多孔算法。第二部分则介绍了小波在语音信号处理中的几种应用,包括语音编码,语音降噪,基音检测和语音信号特征提取。一小波1. 小波的基本概念小波变换是80年代后期发展起来的应用数学分支。其含义是:把某一成为基本小波(也叫母小波mother wavelet)的函数作位移后,再在不同尺度下与待分析信号x(t) 作内积 :, a>0 小波变换可以分为连续小波变换(连续时间,连续小波变换),连续时间离散分析,离散时间离散分析。理解小波的关键是理解小波母函数,小波母函数是指满足下面两个条件的函数(1) 完全重构条件 (2) 恒等分辨条件 为的傅立叶变换。而把小波母函数的扩张和伸缩称为小波基函数 把看作用t* 和 t给出中心和半径的窗函数,把看作由 和给出中心和半径的窗,则小波母函数的时间分辨率为t,频率分辨率为。可计算出小波基函数的时间分辨率为2at,频率分辨率为 ,时间窗为 ,频率窗为 。因此可以调节尺度参数a来调节小波基函数的时频域窗口位置和时频域分辨率。因为小波母函数可以看作是某一带通滤波器的冲激响应,所以小波基函数可以看作是一带通滤波器组。下面我们导出这组带通滤波器组的一个重要性质,即恒Q性质。设小波母函数所代表的带通滤波器的中心频率为,则小波基函数所表示的一组带通滤波器中心频率为 , 它们的相对带宽(即Q值)为 。因为,是固定的,所以该带通滤波器组为等Q滤波器组。总结上面的性质可以看出:小波变换在高频处具有较高的时间分辨率和较低的时间分辨率。在低频处具有较高的频率分辨率和较低的时间分辨率。非常适合处理具有恒Q特性的图像和话音信号。这类信号的慢变部分反映信号的低频分量,在时域允许较低的分辨率,而低频部分集中了信号的主要能量,应予以较大关注,需要较高的频率分辨率。话音信号时域的快变部分反映信号的高频分量,因此应使用较高的时间分辨率来观察,高频部分频带较宽,允许较低的频率分辨率。2. 小波的分类根据小波函数的类型,小波可分为下面三类:(1) 正交小波是指满足正交性条件:的小波。正交小波的基函数具有线性独立性。从信号重构的精度考虑,正交基信号是重构最理想的基函数,所以一般希望小波是正交小波。但除了Harr函数外,实值的紧支集正交小波既不可能是对称的,也不可能是反对称的。由于在信号处理中小波的作用是带通滤波器,所以对称和反对称分别等价为线性相位和广义线性相位。而如果一个带通滤波器不是线性相位或广义线性相位时,它将使通过的信号产生畸变,为了避免畸变,我们就必须使用其它小波。也就是说,我们必须舍弃小波的某种结构以保持小波的最小支撑。为了使构造的小波和对偶小波都是紧支撑的,并且是对称或反对称的,就必须放弃小波的正交性。因此还有下面两类半正交和双正交小波。(2)半正交小波一个在内的Riesz小波若满足“跨尺度正交性” 称为半正交小波。 由于半正交小波可以通过标准正交化运算转变为正交小波,所以一般不把半正交小波作为讨论的对象。(3)双正交小波如果 和它的对偶之间满足关系,则称为双正交小波。 显然,一个正交小波一定是双正交小波,但双正交小波一般不是正交小波。因此,正交小波是双正交小波的特例。3多分辨率分析把平方可积的函数看成是某一逐级逼近的极限情况。每级逼近都是用某一低通平滑函数对作平滑的结果,只是逐级逼近时平滑函数也作逐级伸缩,即用不同的分辨率来逐级逼近待分析函数。这就是“多分辨率分析”的基本思想。 一维小波变换取决于尺度函数和小波函数。设尺度函数生成尺度子空间,小波函数生成小波子空间。较低的分辨率与较粗的信号内容对应,从而对应更大的子空间;较高的分辨率与教细的信号内容对应,从而对应更小的子空间。因为的分辨率比高,所以尺度子空间有包容关系同时在正交小波基的构造中至少应保证,即,两者是的互补子空间。反复使用上式,分辨率为的多分辨率分析子空间可以用有限多个子空间逼近,即有:令代表分辨率为的函数的逼近,而代表逼近的误差(细节),则上式意味着 这表明,任何函数都可以根据分辨率为时的粗糙像和分辨率为下的细节“完全重构”,这也是著名的Mallat塔式重构算法的思想。由,可用子空间的基函数展开,令展开系数为,可得,该式称为尺度函数的双尺度方程。另一方面,由,知 ,故同理可得小波函数的双尺度方程 :设,分别为和的傅立叶变换,由尺度函数和小波函数的正交条件,可以推导出和之间的关系,从而得出和之间的关系。由尺度函数正交,有由小波函数正交,有由尺度函数和小波函数之间的正交,可得综合上面三式,可以解得 ,4. Mallat算法和多孔算法(algorithm atrous)由双尺度方程可得出各级系数(离散逼近, 细节信号)的递推公式平滑逼近 细节信号(小波变换系数) 原则上,可由,求得各代表分辨率下的离散概貌信号,也就是该分辨率下对的平滑逼近。各代表分辨率下的离散细节信号,也就是该分辨率下小波变换所得系数。只要,已知,就可以按上图结构由 逐级求得 和 由信号处理中的等效易位理论可知,位于二抽取后的传递函数可以移到二抽取前,只要把改成即可。因此Mallat可以等效为下面的分解过程: 图中,表示二插值,即将,每两个样本之间补一个零;,表示四插值,将,每两点间补三个零。所以这种算法叫“多孔算法”。二.小波变换在语音信号处理中的应用1. 小波变换用于语音压缩编码小波变换将语音信号进行多尺度分解,得到一个低频系数和几个高频层系数。因为低频层系数比较规则,幅度变化不大,所以可以用较小的数据量表示。高频层系数实际上是信号的平滑估计和实际信号之间的误差,可以选定一个阈值,只保留几个高频层系数。解码时,根据小波分解的低频系数和经过量化处理后的N层高频系数,进行一维小波重构。问题的关键是如何表示每级小波系数。实际上,可以将矢量量化应用到小波变换域,从而实现一种低编码率,高信噪比的编码方案。运用小波分析,得到原始语音信号的平滑版本和不同尺度上的一系列细节版本。对不同层上的细节信息进行矢量量化,应用LBG算法来设计矢量量化码书。对典型语音信号进行分析和训练以产生码书。训练序列由典型语音在对应分解层上的细节版本的一维矢量构成。初始码字由训练序列的形心 (Centriod) 分裂得到。整个码书由若干子码书构成,对应每层小波分解得到的细节版本分别有不同的子码书。编码时,只在对应的子码书中搜索,而不是在整个码书中搜索。考虑到不同分解层上的细节版本重要性不同,对它们采用不同的参数进行矢量量化码书设计。显然,从更平滑版本中经小波分解得到的细节版本更重要些,随着j的增加第j层细节版本对恢复语音信号质量的影响程度是增加的。因而允许的量化失真必须更小,反映在码书设计中即采用较小的量化维数、较大的码书尺寸和较为严格的收敛条件。平滑版本对应变化缓慢的低频信息,是语音内容的主要载体,对语音质量的影响最大。而细节版本对应高频信息,对应人耳不太敏感的频率。对平滑版本可以采用矢量量化,也可以采用其他量化方法。2. 小波变换用于语音去噪对于空间分布不均匀的函数,其小波系数只在少数点有大的值,而在大部分点的值很小。而白噪声对所有小波系数的影响是一样的。实际上,我们可以首先对信号进行小波分解(如进行三层分解),则噪声部分通常包含在细节信号,中。因而可以以门限阈值等形式对小波系数进行处理,然后对信号进行重构即可达到消噪的目的。用门限对小波系数进行处理的方法主要分为三种:1. 硬收缩(hard shrinkage) if if 2. 软收缩(soft shrinkage)ifif3.双曲线收缩(hyperbolic shrinkage)ifif其中门限值的确定主要有Universal Threshold和Cross Validation两种算法。由于语音信号有其特殊性,在对语音信号使用门限方法时,不能对清音部分造成影响。因为语音信号的清音部分包含有许多类似噪声的高频成分,在小波域简单地使用门限方法会消除这些成分,从而造成语音信号失真。因此,首先需要从带噪的语音信号中分辨出清、浊音,然后对不同的部分采用不同的门限方法。3. 小波变换用于基音提取基音周期是指声带每开启和闭合一次的时间,其倒数称为基音频率或音调,范围在50Hz-500Hz之间,因人而异,老人音调周期较低,女性和小孩的较低。精确的基音周期值,在语音合成,语音识别,语音编码以及话者辨识中有重要意义。在汉语语音识别中尤为重要,因为汉语语意不仅体现在音素上还体现在音调上,即汉语的四声同样表意,而汉语的四声判决就确决与能否精确跟踪语音中的基音频率变化。传统的基音检测算法一般采用计算有限长度或中心削波信号的自相关值,利用特定段信号的倒谱,计算残差信号的自相关值或者计算信号的平均幅差函数来找基音周期。这类方法虽然计算简单,但它们都是基于基音周期是平稳的这一假设,只能估计平均基音周期。但由于语音信号是非平稳信号,基音周期也是非平稳时变的,所以后来有人采用基于检测声带闭合时刻来计算基音周期的方法,虽然能跟踪基音变化,但计算量大,不适于实时语音处理。小波变换为我们提供了进行基音周期跟踪的有力工具。因为在语音信号中,声门闭合会导致气流的剧烈变化,表现在信号上就是信号会产生奇异点。而小波在确定信号奇异点中有良好的效果。在进行基音检测时,一般使用二进小波,它只对尺度参数进行了离散化,而对时间域上的平移参量保持连续变化,因此二进小波不破坏信号在时间域上的平移不变量。Mallat已经证明,如果小波函数是一个平滑函数的倒数,则二进小波的极大值点反映信号的快变部分,极小值点反映信号的慢变部分。而且位于信号处真正的剧烈变化位置在多个尺度二进小波变换下都不会改变。显然这种位置正好对应声门闭合时刻。因此一种有效的基音检测算法在于计算信号在尺度下的二进小波变换,找到一处极大值点,再计算尺度下二进小波变换的极大值点。比较各极大值点位置是否一致,如果一致则视为一处基音周期的起始点。如果语音的频带取3003400Hz,采样频率取8000Hz,则尺度值取3,4,5可以很好覆盖50-500Hz的基音频率,而且可以有效抑制基音频率的高次谐波和共振峰的影响。试验表明,基于小波变换的基音检测算法,不仅对语音分帧段长不敏感,而且具有良好的抗噪声性能,信噪比增加6dB仅对检测误差产生0.5个百分点的影响。由于小波变换的快速算法只涉及数字滤波,所以计算量也很小。4 小波变换用于语音特征参数提取基于语音信号短时平稳的LPC特征提取方法,把语音产生的模型参数提取出来作为特征,在一定程度上抓住了语音信号的特点,取得了一定的成功。但生理学的研究表明人类的听觉特性是一个常Q感知系统,这就启发我们去寻找一种既具有常Q特性,又可去掉短时平稳假设的分析方法来分析语音信号,以次做为特征参数。小波变换为这一思想提供了理论上的可能。对于语音信号,必须用时变非平稳的分析方法才能很好地描述。用语音的小波变换系数作为参数可以去掉短时平稳假设,并能反映语音信号的常Q特性。用Mallat算法对语音信号进行分解,得到语音信号在不同尺度下的平滑版本和细节版本(小波表示),其中小波表示就是我们的特征参数。因为语音信号的频带不超过20KHz,所以用第5级小波表示为特征即可。试验表明,小波变换参数在很大程度上抑制了个人信息,而且对噪声不敏感,Robust性强,第特别是爆破音这类非平稳性不好的信息有很好的描述。三 结束语本文结合作者在“现代信号处理”课上学习小波变换时的一些体会,讨论了小波变换的一些主要性质。重点探讨了小波在语音编码,降噪,基音提取以及作为语音特征参数方面的应用。当然小波目前是各国学者研究的热点问题,还有许多性质有待发现,其应用也远不只本文所提到的这些。

    注意事项

    本文(小波及其在语音信号处理中的应用.doc)为本站会员(文库蛋蛋多)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开