《矢量量化》PPT课件.ppt
《《矢量量化》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《矢量量化》PPT课件.ppt(65页珍藏版)》请在三一办公上搜索。
1、2023/7/20,1,第四章 语音信号的矢量量化,4.1 概述4.2 矢量量化的基本原理4.3 失真测度4.4 最佳矢量量化器和码本的设计4.5 降低复杂度的矢量量化系统4.6 语音参数的矢量量化4.7 人工神经网络与VQ4.8 遗传矢量量化,2023/7/20,2,4.1 概述,量化分为两大类:一类是标量量化,另一类是矢量量化。标量量化:用若干个离散的数字值来表示每一个幅度具有连续取值(模拟值)的离散时域信号(采样信号)。,2023/7/20,3,矢量量化的定义:矢量量化(Vector Quantization)是将若干个取样信号分成一组,即构成一个矢量,然后对此矢量一次进行量化。将某一范
2、围内的矢量归为某一类,即所谓的矢量量化,2023/7/20,4,矢量量化研究的基础是信息论的一个分支:“率畸变理论”,其中有两项理论研究成果对于矢量量化算法的发展起关键作用。第一,该理论指出,对于一定的量化速率R(以每个采样信号平均所用的量化比持数衡量,用比特采样表示),量化畸变D(以量化信号与原信号之间的误差均方值和原信号均方值之比来衡量)是一定的。第二,无论对于何种信息源,即使是无记忆的信息源(即各个采样信号之间相互统计独立的情况),矢量量化总是优于标量量化,且矢量维数越大优度越高。,2023/7/20,5,矢量量化的应用:进入80年代以后,矢量量化技术引入语音处理领域,使之又有长足的进步
3、。目前这项技术已经用于语音波形编码,线性预测编码、语音识别与合成、图像压缩等。矢量量化的研究目的:针对待定的信息源和矢量维数,找到一种最优的矢量量化器,它能够在R一定时给出最低的畸变。,2023/7/20,6,上图的两维矢量空间里,存在6类矢量,每一类都有一个中心,称为室心,每一室心对应一个码字矢量。从量上来表征第i类矢量。集合 称为码本。,什么是矢量量化(VQ),2023/7/20,7,任意一个矢量V应该归为哪一类,要看它是“靠近”哪一类矢量,或者说它离哪一个室心最“近”。例如上图中虚线画出的矢量V最靠近V1,则将其规定为V1类,并用V1表示V,或者说V被量化为V1。这样作可以把本来无限多的
4、矢量只用有限个码字矢量来表示(此处为6个)。假如码本中的码字矢量是有序的,则被量化的矢量可用码字序号来表示。因此,可以大大压缩信息量。,2023/7/20,8,4.2 矢量量化的基本原理,矢量量化的过程是:将语音信号波形的A个样点的每一帧,或有k个参数的每一参数帧,构成k维空间中的一个矢量,然后对这个矢量进行量化。标量量化和矢量量化的区别:在标量量化时,在一维的零至无穷大值之间设置若干个量化阶梯,当某输入信号的幅度值落在某相邻的两个量化阶梯之间时,就被量化为两阶梯的中心值。而在矢量量化时,则将A维无限空间划分为M个区域边界,然后将输入矢量与这些边界进行比较,并被量化为“距离”最小的区域边界的中
5、心矢量值。,2023/7/20,9,下面以K=2为例进行说明。,2023/7/20,10,相关概念:若要对一个矢量X进行量化,首先要选择一个合适的失真测度,而后用最小失真原理,分别计算用量化矢量Yi替代x所带来的失真。其中最小失真值所对应的那个量化矢量,就是矢量X的重构矢量(或称恢复矢量)。通常把所有M个量化矢量构成的集合Yi称为码书或码本(Codebook)。把码书中的每个量化矢量Yi(i=1,2,M)称为码字或码矢。不同的划分或不同的量化矢量选取就可以构成不同的矢量量化器。,2023/7/20,11,矢量量化系统的组成:,矢量量化系统的组成框图,2023/7/20,12,矢量量化的特点:矢
6、量量化的两个问题:,有高度保密的优良性能;用于传输时,其传输速率可以进一步降低;稳定性能好。,如何划分M个区域边界。这个过程称为“训练”或建立码书,方法是:将大量的欲处理的信号的波形帧矢量或参数帧矢量进行统计划分,进一步确定这些划分边界的中心矢量值来得到码书。如何确定两矢量在进行比较时的测度。这个测度就是两矢量之间的距离,或以其中某一矢量为基准时的失真度。它描述了当输入矢量用码书所对应的矢量来表征时所应付出的代价。,2023/7/20,13,选择了失真测度以后,就可以进行矢量量化器的设计了。矢量量化器最佳设计的两个条件是:对给定的码本,(为码本尺寸),在矢量空间,中,找出所有码本矢量的最佳区域
7、边界,使平均失真最小。2)对给定的区域边界,,找出最佳码本矢量,使平均失真最小,也就是得到码本,。,2023/7/20,14,矢量量化器的性能指标:码书大小M、平均信噪比。矢量量化器的设计:,平均信噪比:定义为 方括号中的分子是一秒内信号矢量的平均能量,而分母是一秒内输入信号矢量与码书矢量之间的平均失真(即量化噪声)。从大量信号样本中训练出好的码书,从实际效果出发寻找到好的失真测度定义公式,设计出最佳的矢量量化系统,以便用最少的搜索和计算失真的运算量,来实现最大可能的平均信噪比。,2023/7/20,15,4.3 失真测度,失真的定义:失真测度必须具备的特性:,将输入信号矢量用码书的重构矢量来
8、表征时的误差或所付出的代价。必须在主观评价上有意义,即小的失真应该对应于好的主观语音质量。必须是易于处理的,即在数学上易于实现,这样可以用于实际的矢量量化器的设计。平均失真存在并且可以计算。,2023/7/20,16,失真测度的方法:,均方误差(即欧氏距离)、加权的均方误差、ItakuraSaito(板仓-斋藤)距离,似然比失真测度等。,2023/7/20,17,4.3.1 欧氏距离均方误差,设输入信号的某个k维矢量X,与码书中某个k维矢量Y进行比较,xi、yi分别表示X和Y的元素(1ik),则定义均方误差为欧氏距离,即有,2023/7/20,18,几种其他常用的欧氏距离:,2023/7/20
9、,19,4.3.2 线性预测失真测度,直接用由线性预测系数所描述的信号模型的功率谱来进行比较,采用板仓斋藤(ItakuraSaito)距离,简称IS距离。但是,这两种失真测度也有其局限性,它们都仅仅比较了两矢量的功率谱,而没有考虑其能量信息。,2023/7/20,20,4.3.3 识别失真测度,2023/7/20,21,4.4最佳矢量量化器和码本的设计4.4.1 矢量量化器最佳设计的两个条件,定义:所谓最佳设计,就是使失真最小。由于码书就是在这个设计过程中产生的,所以这也就是码书的设计过程。重要问题:划分量化区间和确定量化矢量。,2023/7/20,22,1最佳划分,对给定的码书yM=Y1,Y
10、2,.,YM(M为码书的尺寸),找出所有码书矢量的最佳区域边界Si(i=1,2,.,M),以使平均失真最小,即寻找最佳划分。由于码书已给定,因此可以用最近邻近准则NNR(Nearest Neighbor Rule)得到最佳划分。这个条件实际上是叙述了最佳矢量量化器的设计。由于给定码书共有M个码字,所以可以把矢量空间分成M个区间Si(i=1,2,.,M)。这些Si称为胞腔。,2023/7/20,23,下图给出了K=2的最佳划分示意图。,2023/7/20,24,2最佳码书,对于给定的区域边界Si,找出最佳码书矢量,使码书的平均失真最小,也就是得到码书yM。这里,使平均失真最小,码字Yi必须为给定
11、的Si(i=1,2,.,M)的形心。形心就是该区域空间的几何中心。这些形心就组成了最佳码书中的码字。这个条件实际上叙述了码书的设计方法。,2023/7/20,25,4.4.2 LBG算法,2023/7/20,26,4.4.3 初始码书的生成,1随机选取法定义:从训练序列中随机地选取M个矢量作为初始码字,从而构成初始码书,就是随机选取法。优点:不用初始化计算,从而可大大减少计算时间缺点:可能会选到一些非典型的矢量作为码字,即被选中的码字在训练序列中的分布不均匀。这样码字就没有代表性,导致码书中有限个码字得不到充分利用,使矢量量化器的性能变差。这种方法带有一定的“盲目性”。,2023/7/20,2
12、7,2分裂法,方法原理:先认为码书尺寸为M=1,即初始码书中只包含一个码字。计算所有训练序列的形心,将此形心作为第一个码字(i=0)。然后,将它分裂为 此时码书中包含有两个元素,一个是i=0,另一个是i=1;并按M=2用训练序列对它设计出M=2的码书。接着,再分别将此码书的两个码字一分为二,这时码书中就有了4个码字。这个过程重复下去,经过log2M次设计,就得到所要求的有M个码字的初始码书。特点:初始码书性能较好,以此码书设计的矢量量化器性能也较好;但是随着码书中码字的增加,计算量也迅速增加。,2023/7/20,28,3乘积码书法,这种码书初始化的方法,是用若干个低维数的码书作为乘积码,求得
13、所需的高维数的码书。比如说,要设计一个高维数的码书,可简单地用2个低维数的码书作乘积来获得。即维数为k1,大小为M1的码书乘以维数为k-k1,大小为M2的码书,得到一个k维码书,其大小为M=M1M2。,2023/7/20,29,4.5 降低复杂度的矢量量化系统,方法分类:无记忆的矢量量化、有记忆的矢量量化器。4.5.1 无记忆的矢量量化系统1树形搜索的矢量量化系统 分类:二叉树、多叉树。,2023/7/20,30,如图:码本尺寸M=8的二叉树,它的码本中共包含有14个码字。输入信号矢量为X,先与Y0与Yl比较,计算出失真d(X,Y0)和d(X,Y1)。如果后者较小,则走下面支路,同时送“1”输
14、出。类似地,如果最后到达Yl0l,则送出的输出角标就是101。这个过程也就是矢量量化的过程。,2023/7/20,31,优点:可以减少运算量。缺点:存储容量增大且性能会有所降低。,2023/7/20,32,2多级矢量量化系统,2023/7/20,33,2023/7/20,34,4.5.2 有记忆的矢量量化系统,概念:有记忆的矢量量化在量化每一个输入矢量时,不仅与此矢量本身有关,而且也与其前面的矢量有关。也就在量化时,它通过“记忆”,利用了过去输入矢量的信息,利用了矢量与矢量之间的相关性,从而提高了矢量量化的性能。优点:在语音编码中,引入记忆后,还可利用音长、短时的非平稳统计特性,清音、浊音和无
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 矢量量化 矢量 量化 PPT 课件
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-5558579.html