《语音信号处理》讲稿第6章.ppt
《《语音信号处理》讲稿第6章.ppt》由会员分享,可在线阅读,更多相关《《语音信号处理》讲稿第6章.ppt(27页珍藏版)》请在三一办公上搜索。
1、第6章 语音合成,本章主要讨论的问题:1.语音合成原理和方法2.线性预测合成技术3.语音音素合成技术,1.语音合成原理和方法,共振峰语音合成原理如下:浊音和清音分别采用不同的激励源。发不同语音对应不同声道路径和滤波器。发不同语音对应不同幅值控制和频率控制。共振峰和基频是语音信号的2个主要特征。Vortax公司推出的Computalker是一种典型的语音合成产品最早进入计算机业余爱好者市场。采用的便是共振峰语音合成原理。共振峰模型分为级联型、并联型、混合型三类。对于英语语音,一种采用混合型共振峰模型的共振峰语音合成器框图如图所示。,混合型共振峰语音合成模型,2.线性预测合成技术,线性预测技术有两
2、个特点:a.时域和频域技术相结合。可确定共振峰频率、带宽和振幅等频域参量。b.把具有音高和振幅的激励源与控制音素发音的声道滤波器分离开来,增强了语音存储的灵活性。,2.线性预测合成技术,(1)线性预测原理 线性预测技术可以看成是一种曲线的拟合技术。预测误差e(n)的表达式:e(n)=x(n)-x(n)=x(n)-akx(n-k)式中,x(n)=akx(n-k)为预测值,ak为预测系数。,2.线性预测合成技术,将预测误差e(n)的表达式进行Z变换得:E(Z)=X(Z)(1-akZ-k)由此,可得 X(Z)=E(Z)1/(1-akZ-k)此式即为语音的合成模型。,2.线性预测合成技术,对上式进一步
3、化简,得:X(Z)=H(Z)I(Z)其中,H(Z)=1/(1-akZ-k)为模拟声道滤波器传递函数。I(Z)为频谱分布为0dB/倍频程的脉冲激励源,即I(Z)=E(Z)。上式表明:利用线性预测可以把模拟声道的滤波器和模拟声源的脉冲激励分离开来。均方误差最小时,浊音对应脉冲波激励,清音对应白噪声。线性预测用于共振峰分析,如图所示。,线性预测用于共振峰分析,线性预测分析,多项式因式分解或峰值检测,共振峰 参数,a1,a2,a10,幅值,音高/幅值检测,音高,浊音/清音标志,激励源 参数,2.线性预测合成技术,线性预测编码(LPC)的关键问题是在均方误差最小条件下求出线性预测系数ak。此时,由x(n
4、)=akx(n-k)可近似地恢复x(n)。目前,有3种求线性预测系数ak的方法:直接法、自相关法、协方差法。,2.线性预测合成技术,直接法 求解线性预测系数的直接法与求出曲线的拟合系数的方法相同。总的均方预测误差为:,2.线性预测合成技术,对M求偏导数,并使aj的偏导数为0,得:,2.线性预测合成技术,利用上式的p个线性联立方程,可求出p个线性预测系数a1,a2,ap。这种求解方式在计算机上进行,很方便。n的求和范围一般为-n+。但考虑语音信号的特性,实际上,在一段时间求和(加窗函数n),即 x(n)*=nx(n)窗函数的长度一般为100250。,2.线性预测合成技术,自相关法 自相关法是上式
5、的另一种解法。设自相关函数为,2.线性预测合成技术,联立方程组可变换成:R(0)a1+R(1)a2+R(2)a3+R(p-1)ap=R(1)R(1)a1+R(0)a2+R(1)a3+R(p-2)ap=R(2)R(2)a1+R(1)a2+R(0)a3+R(p-3)ap=R(3)R(p-1)a1+R(p-2)a2+R(p-3)a3+R(0)ap=R(p)这是一个系数对称的线性联立方程。Durbin和Levinson提出了求解这种特殊方程组的最佳解算法。,2.线性预测合成技术,协方差法 这种方法无需对语音信号加窗,它能精确算出预测系数,而在帧内的分析时间比自相关法要短。这种方法假设n求和范围为定数N
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语音信号处理 语音 信号 处理 讲稿
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-6529231.html