语音信号处理课件第七章.ppt
《语音信号处理课件第七章.ppt》由会员分享,可在线阅读,更多相关《语音信号处理课件第七章.ppt(66页珍藏版)》请在三一办公上搜索。
1、第7章 矢量量化,7.1 概述,1,7.2 矢量量化基本原理,7.3 最佳矢量量化器,3,7.4 矢量量化器的设计算法及MATLAB实现,4,7.5 降低复杂度的矢量量化系统,5,2,7.1 概述,量化分为两大类:标量量化和矢量量化。标量量化:把抽样后的信号值逐个进行量化。矢量量化:将k(k2)个抽样值形成K维空间Rk中的一个矢量,然后将此矢量进行量化,。矢量量化优于标量量化,为不可逆压缩方法,具备比特率低、解码简单、失真较小的优点。矢量量化广泛应用于图像、语音压缩编码、移动通信、语音识别、文献检索及数据库检索等领域。,矢量量化的理论基础是仙农的率-失真理论。率-失真理论指出,利用矢量量化,编
2、码性能有可能任意接近率-失真函数,其方法是增加维数k;该理论指出了矢量量化的优越性。率-失真理论在实际应用中的重要指导意义:常作为一个理论下界与实际编码速率相比较,分析系统还有多大的改进余地。但是,率-失真理论是一个存在性定理而非构造性定理,因为它没有指出如何构造矢量量化器。,矢量量化技术的发展历程,最佳矢量量化问题,Steinhaus,1956年,如何划分量化区间及求量化值问题,Loyd和Max,1957年,提出实际矢量量化器,Buzo,1978年,LBG算法,Linde,Buzo和Gray,1980年,7.2 矢量量化基本原理 7.2.1 矢量量化的定义(1)定义:矢量量化是先把信号序列的
3、每K个样点分成一组,形成K维欧氏空间中的一个矢量,然后对此矢量进行量化。,xn X1 X2 X3 X4 Xn/4,图示输入信号序列xn,每4 个样点构成一个矢量(取K=4),共得到n/4个4维矢量:X1,X2,X3,Xn/4,矢量量化就是先集体量化X1,然后量化X2,依次向下量化。下面以K=2为例说明其量化过程。,(2)几个概念 量化矢量(或称重构矢量):利用最小失真原则,分别计算用量化矢量Yi(i=1,2,7)替代X所带来的失真,其中最小失真所对应的那个矢量Yj,就是模拟矢量X 的量化矢量。码书:量化矢量构成的集合称为码书(Codebook)。码字:码书中的每个矢量Yj(i=1,2,N)称为
4、码字(Codeword)。,7.2.2 失真测度 失真测度的选择直接影响矢量量化系统的性能。失真测度是以什么方法来反映用码字Yi代替信源矢量X时所付出的代价。这种代价的统计平均值(平均失真)描述了矢量量化器的工作特性,即 式中E表示求期望。,常用的失真测度有如下几种:平方失真测度 这是最常用的失真测度,易于处理和计算,且在主观评价上有意义,即小的失真值对应好的主观评价质量。,绝对误差失真测度 主要优点:计算简单,硬件容易实现。加权平方失真测度 式中 T 矩阵转置符号;W 正定加权矩阵。,要使所选用的失真测度有实际意义,必须要求它具有以下几个特点:1.必须在主观评价上有意义,即小的失真对应好的主
5、观质量评价;2.必须在数学上易于处理,能导致实际的系统设计;3.必须可计算并保证平均失真D=ED(X,Q(X)存在;4.采用的失真测度,应使系统容易用硬件实现。,7.2.3 矢量量化器 通常用最小失真的方法-最近邻准则NNR(Nearest Neighbor Rule))来设计矢量量化器,也就是要满足下式:式中 IN=1,2,i,N;N 码书的大小;符号 表示充分必要条件。,矢量量化器的工作过程是:在编码端,输入矢量X与码本中的每一个或部分码字进行比较,分别计算出它们的失真。搜索到失真最小的码字Yj 的序号(或此码字在码本中的地址),并将j的编码信号通过信道传送到译码端;在译码端,先把信道传送
6、来的编码信号译成序号j,再根据序号(或码字Yj 所在地址),从码本中查出相应的码字Yj。Yj 是输入矢量X的重构矢量。,矢量量化系统通常可以分为两个映射的乘积 式中:是编码器,它是将输入矢量 映射为信道符号集IN=i1,i2,iN中的一个元素ij;是译码器,它是将信道符号集ij映射为码书中的一个码字Yi。即,(X)=ij X,ij IN(ij)=Yi ij IN Yi YN,矢量量化定义:把一个K维模拟矢量的有序集(称为信源矢量集合)中的某个矢量X映射为N个量化矢量构成的有限集(码书或码本)中的某个矢量(码字或码矢)Y,这种映射称为矢量量化。,一个矢量量化器可以表示成以下三个部分:码书:空间划
7、分:S=映射:q:其中,Si是Rk的一个子集且满足 矢量量化器Q()的性能,以其输入矢量X和输 出矢量Y=q(X)的失真平均值而定,失真平均值为:,D(Q,F)=Ed(X,Y)=Ed(X,q(X),补充:矢量量化与标量量化的比较 矢量量化是把一个K维模拟矢量映射为一个K维量化矢量。标量量化实际是维数K=1的矢量量化。一般情况下,矢量量化均指K2的多维量化。与标量量化的两个主要步骤相对应,矢量量化首先要将抽样值构成的矢量即K维空间的无穷多点划分成有限个胞腔,然后从每一个胞腔取一个代表值,凡是落入该胞腔的矢量均用该代表值进行量化。,与标量量化比较,矢量量化还具有如下特点:(1)矢量量化是把量化矢量
8、(码字)分别存储在编码器和译码器两端的码书中,在信道中传输的并不是输入矢量X的量化矢量Y本身,而是码字Y的下标j的编码信号;(2)在相同的速率下,矢量量化的失真比标量量化的失真明显的小;(3)在相同的失真条件下,矢量量化所需要的速率比标量量化所需的速率低的多;,(4)矢量量化是一种多维模式匹配、多维优化过程,而标量量化是一维模式匹配、一维优化过程。一般来说,用一维优化是得不到多维优化的结果的。(5)矢量量化的复杂度随维数成指数增加,所以矢量量化的复杂度比标量量化的复杂度高。归结起来,正如率-失真理论所指出的,组编码总是优于单个输出的逐个编码的,当编码长度K趋于无穷大时,可以达到率失真界。,7.
9、3 最佳矢量量化 1.最佳矢量量化器的概念 矢量量化器的速率定义为:r=B/K=(logN)/K(bit/样值或每维)式中 B=log N表示每个码字的编码比特数;N码书的大小;K维数。,最佳矢量量化器的概念:给定条件下,失真最小的矢量量化器,称为这个条件下的最佳矢量量化器。给定矢量量化器的码书大小N,求最小失真 式中QN为所有码书大小为N的K维矢量量化器的集合。,2.设计最佳矢量量化器的必要条件 一是在给定码书的条件下,寻找信源空间的最佳划分,使平均失真最小;二是在给定划分的条件下,寻找最佳码书,使平均失真最小。(1)最佳划分 给定码书,可以用最近邻准则NNR得到最佳划分。图7.4为最佳划分
10、示意图。,图7.4 最佳划分示意图,最佳划分定义:信源空间中任一点X,若XSj,当且仅当矢量X与码字Yj的失真小于X和其它码字 失真,即:则Sj为最佳划分。Voronoi划分:把信源空间划分成与码书大小相同的 N个区间Sj(j=1,2,N)。这种划分称为Voronoi划分。Voronoi胞腔:Voronoi划分对应子集Sj(j=1,2,N)称为Voronoi胞腔(Cell),简称胞腔。,(2)最佳码书 给定了划分Si(并不是最佳划分)后,为了使码书的平均失真最小,码字Yi 必须为相应划分Si(i=1,2,N)的形心,即:式中min-1表示选取的Yi使平均失真 Ed(X,Y)|XSi为最小的Y。
11、,对于由训练序列定义的样点分布和常用的均方失真测度,形心由下式给出:式中|Si|表示集合Si中元素的个数(即Si集中有|Si|个X)。,7.4 矢量量化器的设计算法及MATLAB实现 7.4.1 LBG算法 设计矢量量化器的主要任务是设计码书。码字数目N给定时,由Linde,Buzo,和Gray三人1980年首次提出矢量量化器的一个设计算法,通常称为LBG算法。,已知训练序列设计算法的具体步骤如下:给定初始码书,即给定码书大小N和码字,并置n=0,设起始平均失真 D(-1),给定计算停止门限(01)。,已知训练序列的LBG设计算法:,用码书 为已知形心,根据最佳划分原则把 训练序列TS=划分为
12、N个胞腔,即:,计算平均失真与相对失真。平均失真为 式中,相对失真为 若,则停止计算,当前的码书 就是设计好的码书,否则进行第步。,利用 计算这时划分的各胞腔的形心,由这N个新形心 构成新的码书,并置n=n+1,返回第步再进行计算,直到,得到所要求的码书 为止。,2 初始码书的选定与胞腔的处理 初始码书如何选取,对最佳码书设计很有影响。下面介绍初始码书选取方法。(1)随机选取法 这种方法最先用于K-均值聚类算法中,它是从训练序列中随机选取N 个矢量作为初始码字,构成初始码书。,优点:(1)不用初始化计算,可以大大减少计算时间;(2)初始码字选自训练序列中,无空胞腔问题。缺点:(1)可能会选到一
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语音 信号 处理 课件 第七
链接地址:https://www.31ppt.com/p-5841467.html