语音信号线性预测分析仿真课程设计.doc
《语音信号线性预测分析仿真课程设计.doc》由会员分享,可在线阅读,更多相关《语音信号线性预测分析仿真课程设计.doc(21页珍藏版)》请在三一办公上搜索。
1、摘 要作为最有效的语音分析技术之一,线性预测是一种基于全极点模型假定和均方预测误差最小准则下的波形逼近技术,通过对音频信号的时域和频域分析对声道参数进行估值,以少量低信息率的时变参数精确地描述语音波形及其频谱的性质,能够在尽量保持原音质的基础上合成出高质量的语音。本文重点研究了线性预测(LPC)的原理、Levinson-Durbin算法,基于MATLAB进行语音线性预测仿真,并对参数的选取做了比较分析。关键词 语音信号 LPC Levinson-Durbin算法MATLAB仿真AbstractAs one of the most effective speech analysis techni
2、que, linear prediction is a kind of based on the pole model assumption and minimum mean square error criterion of wave approximation technique, based on the audio signal of time domain and frequency domain analysis of track parameters valuations, with a few low information rate of time-varying param
3、eters accurately describe the nature of the speech waveform and spectrum, to be able to try to keep the original sound quality on the basis of the synthesis of high quality speech. This paper mainly studies the linear prediction (LPC), Levinson - from the principle of the algorithm, based on MATLAB
4、speech linear prediction simulation, and the selection of parameters to do a comparative analysis. Keywords voice signal LPC Levinson - Durbin algorithm MATLAB simulation目 录第1章 绪论11.1 语音信号LPC分析技术的基本概念1第2章 线性预测编码的基本原理22.1 语音信号的产生22.2 线性预测的概念与原理22.2.1 线性预测分析的概念22.2.2 LPC和语音信号模型的关系42.3 解线性预测参数方程组的算法52.
5、3.1 Levinson-Durbin自相关解法52.3.2 利用格型法求解线性预测系数6第3章 simulink仿真的分析合成系统103.1 仿真内容103.2 仿真系统模型103.3 仿真工作过程113.3.1 语音信号采样113.3.2 预加重113.3.3 叠接窗分析133.3.4 汉明窗143.3.5 自相关算法143.3.6 数字滤波器163.4 仿真结果分析18参考文献18第1章 绪论1.1 语音信号LPC分析技术的基本概念语音是人们交流思想和进行社会活动的最基本手段, 我们要对语音信号进行测定并将其转变为另一种形式, 以提高我们的通信能力。线性预测(Linear Predict
6、ion)这一术语是维纳1947年首次提出的,此后,线性预测应用于许多领域中。1967年,板仓等人最先将线性预测技术直接应用到语音分析和合成中。线性预测作为一种工具,几乎普遍地应用于语音信号处理的各个方面。这种方法是最有效和最流行的语音分析技术之一。在各种语音分析技术中,它是第一个真正得到实际应用的技术。线性预测技术产生至今,语音处理又有许多突破,但这种技术目前仍然是唯一的最重要的分析技术基础。在估计基本的语音参数(例如基音、共振蜂、谱、声道面积函数,以及用低速率传输或储存语音等)方面,线性预测是一种主要的技术。其重要性在于它能够极为精确地估计语音参数,用极少的参数有效而又正确地表现语音波形及其
7、频谱的性质,而且可以用比较简单的计算和比较快的速度求得参数。线性预测分析是最有效的语音分析技术之一,在语音编码、语音合成、语音识别和说话人识别等语音处理领域中得到了广泛的应用。语音线性预测的基本思想是:一个语音信号的抽样值可以用过去若干个取样值的线性组合来逼近。通过使实际语音抽样值与线性预测抽样值的均方误差达到最小,可以确定唯一的一组线性预测系数。采用线性预测分析不仅能够得到语音信号的预测波形,而且能够提供一个非常好的声道模型。如果将语音模型看作激励源通过一个线性时不变系统产生的输出,那么可以利用LPC分析对声道参数进行估值,以少量低信息率的时变参数精确地描述语音波形及其频谱的性质。此外,LP
8、C分析还能够对共振峰、功率谱等语音参数进行精确估计,LPC分析得到的参数可以作为语音识别的重要参数之一。第2章 线性预测的基本原理2.1 语音的产生为了用数字信号处理的方法对语音信号进行处理,首先要建立语音信号产生的数字模型,因此,我们必须在对人的发声器官和机理上进行研究的基础上,才能建立精确的模型。空气由肺部排入喉部,经过声带进入声道,最后由嘴辐射出声波,这就形成了语音。在声门以左,称为“声门子系统”,它负责产生激励振动;右边是“声道系统”和“辐射系统”。当发出不同的语音,激励和声道的情况是不同的,它们对应的模型也不同。空气经过声带时,如果声带是紧绷的,则声带将周期性地开启和闭合。声带启开时
9、,空气流从声门喷出,形成一个脉冲,声带闭合时相应于脉冲序列的间隙期。因此,这种情况下在声门处产生一个准周期脉冲的空气流。该空气流经过声道流入声道后从嘴唇辐射出来,从而产生浊音。如果声带是完全舒展的,则空气流将不受影响的通过声门并进入声道。这时,如果声道有某部位收缩成一个狭窄的通道,则空气流到达此处时将被迫高速冲过此收缩区,并在附近形成湍流,这种空气湍流激励声道后便形成清音或摩擦音。这时,如果声道有部位完全闭合,则当空气流到达时将在此处形成空气压力,一旦闭合处突然开启便会让空气压力快速释放,激励声道后便会形成爆破音。语音信号是一种典型的非平稳信号。但是由于语音的形成过程与发音器官的运动密切相关,
10、这种物理运动比起声音振动速度来讲要缓慢得多,因此语音信号常常可假定为短时平稳的,即在1020ms这样的时间段内,其频谱特性和某些物理特征参量可以近似看做不变。这样,我们就可以采用平稳过程的分析处理方法。一般是用一个长度有限的窗序列截取语音信号进行分析,并让这个窗滑动以便分析任一时刻附近的信号。2.2 线性预测的概念与原理2.2.1 线性预测分析的概念线性预测编码原理:利用过去的样值对新样值进行预测,然后将样值的实际值与其预测值相减得到一个误差信号,显然误差信号的动态范围远小于原始语音信号的动态范围,对误差信号进行量化编码,可大大减少量化所需的比特数,使编码速率降低。线性预测分析又称LPC分析,
11、对分析就是用过去P个取样值的加权之和来预测信号当前取样值,如果利用P个取样值来进行预测,则称为P阶线性预测。预测信号为: (2.2.1),称为预测系数,由于语音信号性质变化缓慢,所以对于所分析的帧来说,预测系数是一组恒定的参数。预测误差为:(2.2.2)预测误差e(n)是信号s(n)通过如下系统的输出,A(z)称为LPC误差滤波器.图2.2该方程可以求出预测误差滤波器的传输函数为将(2.2.2)改写成下列形式现在输入信号是,输出信号是,传输函数为这是一个全极点滤波器,称为LPC的语音合成模型。系统A(z)为LPC误差滤波器,设计预测误差滤波器就是求解预测系数,使得预测误差e(n)在某个预定的准
12、则下最小,这个过程就是LPC分析。线性预测的基本问题就是由语音信号直接求出一组线性预数 ,这组预测误差滤波器就被看做语音产生模型中系统函数H(z)的参数,使得在一短段语音波形中均方预测误差最小。将 对各个系数求偏导,并令其结果为零,即(2.2.3)由式(2.2.2)可知(2.2.4)将式(2.2.4)代入(2.2.3)可得(2.2.5)式(2.2.5)表明预测误差与信号的过去p的取样值是正交的,称为正交方程。将式(2.2.2)代入(2.2.5)得(2.2.6)令s(n)的自相关序列为 (2.2.7)由于自相关序列为偶对称,因此 (2.2.8)这表明式(2.2.8)与一般的自相关序列的定义是一样
13、的。这样式(2.2.7)进一步表示为 (2.2.9)上式称为标准方程式,它表明只要语音信号是已知的,则p个预测系数 通过求解该方程即可得到。设 (2.2.10)上式矩阵形式为 或者 (2.2.11)通过求解上式即可求得p个线性预测系数 2.2.2 LPC和语音信号模型的关系如图1所示,为描述语音产生过程的离散时间信号模型。图中,准周期性脉冲序列发生器产生浊音的激励源,浊音的基音频率由脉冲重复的周期决定;随机噪声发生器产生清音的激励源,模拟湍空气湍流;清浊音开关控制清音和浊音的产生;嘴唇的辐射特性可以用一个一阶极点数字滤波器来实现;增益控制来控制语音的强度。模型中所有参数(基音频率,随即噪声的方
14、差,清浊音开关的位置,模型的参数)都是随着时间改变的。声门激励、声道调制和嘴唇辐射的合成贡献,可用如下数字时变滤波器表示上式既有极点又有零点。按其有理式的不同,有如下三种信号模型:(1)自回归滑动平均模型(ARMA模型);(2)自回归信号模型(AR模型);(3)滑动平均模型(MA模型)。 一般都用AR模型作为语音信号处理的常用模型。此时H(z)写为式中,增益G以及数字滤波器系数都可以随时间而变化,p为预测器阶数。当p足够大时,上式几乎可以模拟所有语音信号的声道系统。采用简化模型的主要优点:可以用线性预测分析法对增益G和滤波器系数进行直接而高效的计算。在语音产生的数字模型中,语音抽样信号s(n)
15、和激励信号之间的关系可用下列差分方程来表示:可见,如果语音信号准确服从上式的模型,则 ,所以预测误差滤波器A(z)是H(z)的逆滤波器,故有下式成立: 2.3 线性预测的概念与原理2.3.1 Levinson-Durbin自相关解法由于语音是一种短时平稳信号,因此只能利用一段语音来估计模型参数。将长的语音序列加窗,然后对加窗语音进行LPC分析,只要限定窗的长度就可以保证分析的短时性,这种方案称为自相关法。 )()()()( )()()()(11min2=-=-=piipiipinsneEansneEinsansneEneEE根据线性预测分析的原理可知,求解p个线性预测系数的依据,是预测误差滤波
16、器的输出方均值或输出功率最小。称这一最小方均误差为正向预测误差功率,即 (2.3.1)由式(2.2.5)正交方程知上式第二项为0。再将式(2.2.2)代入可得以上两式组合起来得称为尤勒-沃尔克(Yule-Walker)方程。方程的系数矩阵为托普利兹(Toeplitz)矩阵 可见,为了解得线性预测系数,必须首先计算出自相关序列R(k) ,为了简化计算,可根据语音信号的短时平稳特性将语音信号分帧,这样自相关序列R(k)可用下式估计 (2.3.2)如果将预测误差功率Ep理解为预测误差的能量,则上式中的系数对线性预测方程的求解没有影响,因此可以忽略。利用对称托普利兹(Toeplitz)矩阵的性质,自相
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语音 信号 线性 预测 分析 仿真 课程设计
链接地址:https://www.31ppt.com/p-3926732.html