语音信号处理课件第05章同态滤波及倒谱分析.ppt
第5章 语音的同态滤波及倒谱分析,5.1 概述5.2 同态信号处理的基本原理5.3 复倒谱和倒谱5.4 语音信号两个卷积分量复倒谱的性质5.5 避免相位卷绕的算法5.6 语音信号的复倒谱分析实例,5.1 概述,在这一章中讨论的同态处理方法是一种非线性方法.它能将两个信号通过乘法合成的信号或通过卷积合成的信号分开.对于语音信号,我们的目的是要从声道冲激响应分量与激励分量的卷积中分开各原始分量本章主要讨论卷积同态系统,以及它在语音处理中的应用,如基音检测、共振峰分析以及同态声码器等.一帧语音信号=声门激励信号*声道冲激响应注意:此处符号*表示卷积运算语音分析的目的:将激励源与声道冲激响应分开来分别进行研究,它们被广泛用于各种语音编码、合成、识别以及说话人识别。,5.1 概述,“解卷”,即将各卷积分量分开,有时也称作反卷积。解卷算法分为两大类:第一类算法是“参数解卷”,包括线性预测分析等。第二类为“非参数解卷”,同态信号处理是其中最重要的一种。对语音信号解卷的好处:1)可对激励源进行研究,因而可以了解语音段是属于浊音还是清音,及确定浊音的基音频率2)可对声道冲激响应进行研究,因而可以了解声道特性及共振峰,5.1 概述,分离组合信号所采用的方法:1)分离加性信号常采用线性滤波的方法:2)分离非加性组合(如乘性或卷积性组合)信号,常采用同态滤波技术。,同态信号处理也称为同态滤波,它实现了将卷积关系变换为求和关系的分离处理。为了分离加性组合信号,常采用线性滤波方法。为了分离非加性组合(如乘积性或卷积性组合)信号,常采用同态滤波技术。同态滤波是一种非线性滤波,但它服从广义叠加原理。对语音信号进行同态分析后将得到其倒谱参数,所以同态分析也称为倒谱分析。由于对语音信号分析是以帧为单位进行的,所以得到的是短时倒谱参数。无论是对于语音通信、语音合成还是语音识别倒谱参数优点:所含的信息比其他参数多,也就是说语音质量好、识别正确率高;倒谱参数缺点:是运算量较大。尽管如此,倒谱分析仍是一种有效的语音信号分析方法。,5.1 概述,5.1 概述,广义叠加原理小四边形表示输入矢量之间的运算、小三角形表示输入矢量与标量之间的运算、小圆形表示输出矢量之间的运算、小菱形表示输出矢量与标量之间的运算。输入矢量之间的运算和输出矢量之间的运算可以为:加法、乘法或卷积等运算。输入矢量或输出矢量与标量之间的运算可以为:乘法、幂或开方等运算,5.1 概述,广义叠加原理数学表达:同态系统的规范形式:,5.2 同态信号处理的基本原理,同态信号处理的实质:把非线性问题转化为线性问题来处理。分类:1)乘积同态处理 2)卷积同态处理,图5-1卷积同态系统的模型该系统的输入输出都是卷积性运算。,5.2 同态信号处理的基本原理,卷积同态处理的基本原理:同态处理理论:任何同态系统都能表示为三个同态系统的级联,即同态系统可分解为:两个特征系统(它们只取决于信号的组合规则)第一个系统以若干信号的卷积组合作为其输入,并将它变换成对应输出的相加性组合。第二个系统是一个普通线性系统,它服从叠加原理。一个线性系统(它仅取决于处理的要求)。第三个系统是第一个系统的逆变换,即它将信号的相加性组合反变换为卷积组合。这种同态系统的重要性在于,可以使这种系统的设计简化为线性系统的设计问题。,5.2 同态信号处理的基本原理,卷积特征子系统:,图5-2同态系统的组成,5.2 同态信号处理的基本原理,加性信号的Z变换或逆Z变换仍然是加性信号,因而这种时域信号可以用线性系统处理。,5.2 同态信号处理的基本原理,线性系统,5.2 同态信号处理的基本原理,卷积逆特征子系统:,经过线性处理后,若将其恢复为卷积性信号,可以通过逆特征系统,它是特征系统的逆变换。,5.2 同态信号处理的基本原理,返回,5.3复倒谱和倒谱-两种同态处理方法,复倒谱定义:是一个时域序列,是x(n)的“复倒频谱”,简称为“复倒谱”,也称作对数复倒谱。复对数函数的单值性原则:它必须是一对一的变换;它必须满足广义的叠加原理;它必须是有效的z变换;它必须有唯一的定义(必须选定一个收敛域)。,1.复对数的多值性问题:并不是一对一的变换,5.3 复倒谱和倒谱,5.3 复倒谱和倒谱,虽然通过用其主值来取代原值的手段来解决复对数中 不明确的问题是相当普遍的,但是不能在这里采用此手段,因为它通常会使运算不再遵循广义叠加原理:,5.3 复倒谱和倒谱,但两个角度之和的主值通常不等于它们各自相应的主值之和。,5.3 复倒谱和倒谱,2.复对数函数的解析性问题:为了让同态滤波系统成为一个可实现系统,必须是因果、稳定和唯一的,因此 的收敛域包含单位圆,且在此收敛域内 是 z的解析函数,即 必须是关于 的连续函数,但 不是 的连续函数。,5.3 复倒谱和倒谱,5.3 复倒谱和倒谱,5.3 复倒谱和倒谱,倒谱(倒频谱/对数倒频谱):与复倒谱不同的是,在倒谱情况下一个序列经过正逆两个特征系统变换后,不能还原成自身,因为c(n)中只有幅值信息而无相位信息。尽管如此,但仍可用于语音信号分析中,因为人们的听觉对语音的感知特征主要包含在幅度信息中,相位信息不起主要作用。,X,c(n)即是 中的偶对称分量。是时间序列,因为它是从频率逆变换得到的。如果c1(n)和c2(n)分别是x1(n)和x2(n)的倒谱,并且x(n)=x1(n)*x2(n);那么x(n)的倒谱为c(n)=c1(n)+c2(n)。与复倒谱不同的是,在倒谱情况下一个序列经过正逆两个特征系统变换后,不能还原成自身;这是因为在计算倒谱的过程中将序列的相位信息丢失了。,5.3 复倒谱和倒谱,5.4 语音信号两个卷积分量复倒谱的性质,语音信号可看作是声门激励信号和声道冲激响应的卷积1.声门激励信号的复倒谱:(主要分析浊音激励),5.4 语音信号两个卷积分量复倒谱的性质,其中2)对上式取对数,并将对数部分展开为泰勒级数:,5.4 语音信号两个卷积分量复倒谱的性质,结论:一个有限长的周期冲激序列,其复倒谱除原点处也是一个周期冲激序列,且周期不变,只是序列变为无限长序列,同时其振幅随k的增大而衰减,且比原序列衰减更快。,除原点外,可以采用“高复倒谱窗”从语音信号的频谱中提取浊音激励信号的频谱(对于清音激励,也只损失了0nN-1的一部分的激励信息),从而可使用复倒谱提取基音。,5.4 语音信号两个卷积分量复倒谱的性质,2.声道冲激响应序列的复倒谱:若用最严格的零极点模型,则有,5.4 语音信号两个卷积分量复倒谱的性质,5.4 语音信号两个卷积分量复倒谱的性质,5.4 语音信号两个卷积分量复倒谱的性质,5.4 语音信号两个卷积分量复倒谱的性质,由此可得声道响应序列复倒谱的性质为:(1)是双边序列。(2)由于|ak|、|bk|、|ck|、|dk|均小于1,所以 是衰减序列,即|随|n|的增大而减小。(3)|随|n|增大而衰减的速度至少比1/|n|快。(4)如果x(n)是最小相位序列(极零点均在z平面单位圆内),即bk=0、dk=0,则 只在n0时有值,且由X(z)的表达示可知 是稳定的,即 为稳定因果序列。也就是说,最小相位信号序列的复倒谱是稳定因果序列。(5)与(4)相反,最大相位信号序列(极零点均在z平面单位圆外)的复倒谱是稳定非因果序列。,5.4 语音信号两个卷积分量复倒谱的性质,语音信号的复倒谱,在复倒谱分析中,z变换后得到的是复数,所以取对数时进行的是复对数运算。这时存在相位多值性问题,称为“相位卷绕”。相位卷绕使得求语音的复倒谱,以及从复倒谱中恢复语音等运算都会由于不确定性而产生错误。下面来分析复倒谱分析中相位卷绕是怎样产生的。,5.5 避免相位卷绕的算法,上式的相位也可表示为:式中,虽然l()和2()的范围均在(0,2)内,但()的值可能不在(0,2)之内,而计算机处理时总相位值只能用主值()(在(0,2)内)来表示。所以可能存在下面的情况:(k为整数)此时即产生了相位卷绕。显然,相位卷绕的产生是由于相位的多值性问题。它会使后面求复倒谱以及由复倒谱恢复语音等运算存在不确定性而产生错误。求复倒谱时避免相位卷绕的方法有限制法、微分法、最小相位信号法等。其中,限制法的思想是将复倒谱的相位限制在-()的范围内,从而有()=()。但对于语音信号来讲,由于语音信号是随机的,所以这种限制是不科学的。下面介绍其他两种求复倒谱时避免相位卷绕的方法。,5.5 避免相位卷绕的算法,5.5 避免相位卷绕的算法,1.微分法:本质:利用傅里叶变换微分、对数微分特性。微分特性:,x(n)的复倒谱,对数谱,5.5 避免相位卷绕的算法,5.5 避免相位卷绕的算法,图5-4利用傅里叶变换的微分特性求复倒谱的框图,缺点:会引起严重的频谱混叠原因:nx(n)频谱中的高频分量比x(n)的多,有效最高频率比x(n)的大,若仍按原取样率分析将引起此现象。,5.5 避免相位卷绕的算法,2.最小相位信号法:本质:由最小相位信号序列的复倒谱性质及希尔伯特变换的性质推导而来。适用范围:是一种好方法,但仅适用于最小相位信号。,5.5 避免相位卷绕的算法,原理:,5.5 避免相位卷绕的算法,5.5 避免相位卷绕的算法,图5-5因果序列的分解和恢复,5.5 避免相位卷绕的算法,图5-6最小相位信号法求复倒谱,5.5 避免相位卷绕的算法,3.递推法:适用范围:仅限于最小相位信号。基本原理:设 x(n)为最小相位序列,5.5 避免相位卷绕的算法,5.5 避免相位卷绕的算法,是一个因果序列:,是一个最小相位序列:,5.5 避免相位卷绕的算法,这是一个递推公式,求出n=0时的值,所有其它值均可求出。但n=0要用其他办法求出,5.5 避免相位卷绕的算法,5.5 避免相位卷绕的算法,缺陷:对某些信号,若初值x(0)过小,则复倒谱在递推计算时将出现发散的情况。,5.6 语音信号的复倒谱分析实例,在进行语音倒谱和复倒谱分析之前必须对语音信号进行加窗处理:,1.倒谱分析:,5.6 语音信号的复倒谱分析实例,在x(n)是最小相位序列的情况下,复倒谱与倒谱之间有以下的关系:,由于倒谱等于复倒谱的偶对称部分,故有着与复倒谱相同的特性,且为偶函数。,5.6 语音信号的复倒谱分析实例,先用窗w(n)选择一个语音段,再计算复倒谱,然后将欲得到的复倒谱分量用一个“复倒谱窗”l(n)分离出来。所得到的窗选复倒谱用逆特征系统进行处理以恢复所需的卷积分量。,图5-8语音同态滤波系统的构成,5.6 语音信号的复倒谱分析实例,2.倒谱分析实例:图(a)是一段加窗语音的时域波形图,窗长为15 ms,fs10 kHz,因此共包括150个语音样点。这段语音用海明窗加权,基音周期为Np45;图(b)所示为其对数幅度谱,其谐波分量是由输入信号的周期性所引起的;图(c)显示出相位主值的不连续性,,5.6 语音信号的复倒谱分析实例,2.倒谱分析实例:图(d)所示的避免了卷绕的相位谱就没有不连续性。图(b)和图(d)合在一起构成图(e)所示复倒谱的傅里叶变换。图(e)中正负两侧等于基音周期的时间点上出现的尖峰,迅速衰减的低复倒谱域分量表示声道、声门激励以及辐射的组合效应。图(f)所示为倒谱,它只是对对数幅度谱进行傅里叶反变换(即设相位恒为零)。实际上倒谱也表现出和复倒谱相同的一般性质,这是因为倒谱是复倒谱的偶对称分量。由图(f)可见,倒谱是一个偶函数;这是因为它是一个偶对称分量。,5.6 语音信号的复倒谱分析实例,图5-9浊音语音用同态滤波分离出声门激励和声道响应的示例(a)声道的对数幅频特性的估值;(b)声道相频特性的估值;(c)声道冲激响应的估值;(d)声门激励脉冲的估值,其中图(a)和图(b)为特征系统中得到的对数幅度谱及相位谱,经过低复倒谱窗l(n)和D*-1 之后的输出波形即声道冲激响应如图(c)所示。图(d)给出了声门激励信号。可以看出,声门激励波形近似于一个冲激串,其幅度随时间的变化关系保持了加权所用的海明窗形状。,5.6 语音信号的复倒谱分析实例,图5-10给出了相同条件下一段加窗清语音的时域波形及其倒谱。其中图(a)是一个海明窗乘过的清音语音段,图(b)为这段语音的对数幅度谱,图(c)为其倒谱。可见对数幅度谱的变化没有规律,没有体现出谐波分量,这是因为激励信号是随机的,因而语音的短时道中包含一个随机分量。此时,计算相位没有什么意义。由图(c)可见,倒谱中没有出现在浊音情况下的那种尖峰,然而低倒谱域部分包含了关于声道冲激响应的信息。由图(c)明显可见倒谱为偶函数。图(d)表明了这一点,它表示对图(c)的倒谱经低倒谱窗加权后得到的声道的对数幅频特性。,图5-10清音的同态分析窗选时域波形;(b)语音的短时对数幅度谱;(c)倒谱;(d)声道幅频特性的估值,5.6 语音信号的复倒谱分析实例,上面的举例表明:能够用同态滤波得到某些基本参数的近似表示。实际上,在大多数语音分析的应用中没有必要对语音波形完全解卷,一般满足于估计如基音周期和共振峰频率等一些基本参数,因而可以从复杂的相位计算中解脱出来。例如,比较图5-7(f)和图5-10(c)可知,用倒谱可以区分清音和浊音;而且,倒谱中存在着浊音的基音周期。同时,共振峰频率在声道的对数幅频特性中清楚地显现出来。,同态信号处理的基本原理(小结)不同信号的处理方法 加性信号 线性关系、叠加原理,处理方法成熟,乘性信号 卷积信号 非线性关系,不能用叠加原理,处理困难,卷积同态系统,y(n)=Hx(n)=Hx1(n)*Hx2(n),*表示离散时间卷积运算,卷积同态系统模型,任何同态系统可表示为三个子系统的级联,D*,L*,D*-1,*,*,+,+,+,+,特征系统,线性系统,逆特征系统,特征系统D*把卷积转换为和,把非线性变为线性,逆特征系统D*1 把和转换为卷积,把线性变为非线性,线性系统L*真正需要的处理算法,可利用信号与系统中所学过的各种处理手段,满足叠加原理,Z,ln,Z-1,*,+,+,+,Z,exp,Z-1,+,*,+,+,3 同态滤波的基本原理设有x(n)=x1(n)*x2(n)(1)D*,(2)D*-1 Z-exp-Z-1,Y1(z),Y2(z),名称?,4 复倒谱和倒谱 概念,是x(n)经特征系统后的值,是时间序列,是信号的频谱取对数的反变换。由于与x(n)的谱间的关系,给他起名:,复倒频谱,Complex Cepstrum Spectrum,DFT下的特征系统 DFT运算快,一般用DFT、IDFT代替z变换,(1)D*,(2)D*-1,x(n)的频谱,x(n)的对数频谱,x(n)的复倒谱,时间序列,复倒谱的幅度与相位 同傅立叶变换,复倒谱有幅频特性、相频特性,复数计算量大,考虑人的听觉对相位不敏感,为减少运算量,丢掉相位,倒谱,若c1(n)、c2(n)是x1(n)、x2(n)的倒谱,且x(n)=x1(n)*x2(n)有c(n)=c1(n)+c2(n),C(n)与x(n)一对多的关系,由c(n)不可还原x(n),因丢相位,