语音信号处理第14章.ppt
《语音信号处理第14章.ppt》由会员分享,可在线阅读,更多相关《语音信号处理第14章.ppt(47页珍藏版)》请在三一办公上搜索。
1、14.1概述14.2语音特性、人耳感知特性及噪声特性14.3滤波法语音增强技术14.4利用相关特性的语音增强技术14.5非线性处理法语音增强技术14.6减谱法语音增强技术14.7利用Weiner滤波法的语音增强技术,第十二章 语音增强,14.1 概述,语音信号作为信息的最普遍最直接的表达方式,在许多领域具有广泛的应用前景。现实生活中的语音不可避免的要受到环境的影响。噪声分类:按类别:可分为环境噪声等的加性噪声和残响及电器线路干扰等的乘法性噪声 按性质:平稳噪声和非平稳噪声LomBard现象:在噪声环境下,说话者情绪会发生变化,从而引起声带的变化(对语音处理系统的影响相对较小),国内外语音信号处
2、理研究成果,目前国内外的研究成果从增强思想上主要分为以下三类:1)采用语音增强算法,提高语音识别系统前端预处理的抗噪声能力,提高输入信号的信噪比。(与后端应用无关)2)第二类方法是寻找稳健的耐噪声的语音特征参数。如采用短时修正的相干系数(Short-Time Modified Coherence Coefficient,简称为SMC)作为语音特征参数。,3)第三类方法是基于模型参数适应化的噪声补偿算法,如针对加法性噪声的HMM合成法,和针对乘法性噪声的Stochastic Matching法等。通常只考虑到噪声环境是平稳的,在低信噪比语音以及非平稳噪声环境中的效果并不理想。,14.2语音特性、
3、人耳感知特性及噪声特性,语音特性语音信号是一种非平稳的随机信号任何语言的语音都有元音和辅音两种音素,根据发音机理的不同,辅音又可以分为清辅音和浊辅音。语音信号,作为非平稳、非遍历随机过程的样本函数,其短时谱的统计特性在语音增强中又着举足轻重的作用。(据中心极限定理,语音的短时谱的统计特性服从高斯分布。),14.2.2 人耳感知特性对于声波频率高低的感觉与实际频率的高低不呈线性关系,而近似为对数关系;对频率的分辨能力受声强的影响;对语音信号的幅度谱较为敏感,对相位不敏感。人耳掩蔽效应:产生一个声音由于另外一个声音的出现而导致该声音能被感知的阀值提高的现象。语音增强的最终效果度量是人耳的主观感觉,
4、所以在语音增强中可以利用人耳感知特性来减少运算代价。,14.2.3 噪声特性噪声可分为:平稳和非平稳噪声加法性噪声:冲激噪声、周期噪声、宽带噪声、语音干扰乘法性噪声:残响及传输网络的电路噪声(非加性噪声往往可以通过某种变换,如同态滤波,转为加性噪声),(1)冲激噪声:例如放电,打火,爆炸都会引起冲激噪声,它的时域波形是类似于冲激函数的窄脉冲。消除冲激噪声影响的方法通常有两种:对带噪语音信号的幅度求均值,将该均值做为判断阈,凡是超过该阈值的均判为冲激噪声,在时域中将其滤除;当冲激脉冲不太密集时,也可以通过某些点内插的方法避开或者平滑掉冲激点,从而能在重建语音信号去掉冲激噪声。(2)周期噪声:最常
5、见的有电动机,风扇之类周期运转的机械所发出的周期噪声,50Hz交流电源哼哼声也是周期噪声。在频谱图上它们表现为离散的窄谱,通常可以采用陷波器方法予以滤除。,3)宽带噪声:说话时同时伴随着呼吸引起的噪声,随机噪声源产生的噪声,以及量化噪声等都可以视为宽带噪声,应用中常近似为Gauss噪声或白噪声。其显著特点是噪声频谱遍布于语音信号频谱之中,导致消除噪声较为困难。一般需要采取非线性处理方法。(4)语音干扰:干扰语音信号和待传语音信号同时在一个信道中传输所造成语音干扰称为语音干扰。区别有用语音和干扰语音的基本方法是利用它们的基音差别。考虑到一般情况下两种语音的基音不同,也不成整数倍,这样可以用梳状滤
6、波器提取基音和各次谐波,再恢复出有用语音信号。(5)传输噪声:这是传输系统的电路噪声。与背景噪声不同,它在时间域里是语音和噪声的卷积。处理这种噪声可以采用同态处理的方法,把非加性噪声变换为加性噪声来处理。,通过语音增强技术来改善语音质量的过程如图14-1所示,14.3滤波法语音增强技术,14.3.1 陷波器法 对于周期噪声采用陷波器是较为简便和有效的方法,其基本思路和要求是设计的陷波器的幅频曲线的凹处对应于周期噪声的基频和各次谐波如图14.2所示,并通过合理设计使这些基频处的陷波宽度足够窄。,简单的数字陷波器的传递函数如下:由 可以看出 的频率将被滤除掉。根据数字信号处理的基本知识可以知道,数
7、字滤波器的极零点接近时,信号频谱变化较为缓慢,而在陷波频率处急剧衰减,故引入反馈:当 越接近1时,分母在零点附近处由抵消作用,梳齿带宽变得越窄,通带较为平坦,陷波效果越好。其模拟框图如图14-3所示,14.3.2 自适应滤波器1.基本型 自适应滤波器最重要的特性是能有效地在未知环境中跟踪时变的输入信号,使输出信号达到最优,因此可以用来构成自适应的噪声消除器,其基本原理框图如图14-4所示。,图中s(t)为语音信号,n(t)为未知噪声信号,y(t)带噪语音信号,r(t)为参考噪声输入,r(t)与s(t)无关,而与n(t)相关。图14-4中将 看作是r(t)估计y(t)而得到的误差,据最小均方准则
8、,当 为最小时的误差 也就是降噪后的。这里采用LMS递推算法简要说明横向滤波器系数的求法。,设横向滤波器的加权向量记为,误差信号,则有:为噪声 的输入向量。设代价函数为:对上式求导,可以得到最小均方意义下的最佳系数向量为:下面不加证明的给出Widrow-Hoff的LMS算法加权系数递推公式:,2对称自适应去相关的改进型 实际应用中,参考输入 r(t)除包含与噪声相关的参考噪声外,还可能含有低电平的信号分量。图14-5给出了原始语音信号 s(t)通过一个传输函数为 J(t)的信道泄露到参考输入中的情景。,为了解决信号分量的泄露导致系统性能恶化的问题,D.Van Compernolle 提出了对称
9、自适应去相关(SAD)算法,其基本原理如图14-6所示。,3 用延迟的改进型 从图14-4和图14-6中可以看出自适应滤波器需要有与n(t)相关的参考噪声r(t)输入,这在实际应用中往往比较困难,如果噪声相关性较弱时(例如白噪声),有如图14-7所示的改进型。,14.4利用相关特性的语音增强技术,14.4.1 自相关处理抗噪法语音增强技术 此方法利用语音信号本身相关,而语音与噪声、噪声与噪声可认为互不相关的性质,对带噪语音信号作自相关处理,可以得到与不带噪语音信号同样的自相关帧序列。下面说明:设带噪语音为:,其中,为纯净语音信号,为近似白噪声的噪声信号。考虑到他们的短时平稳的特性,计算 的自相
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语音 信号 处理 14
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-5841466.html