第三章多媒体数据压缩技术ppt课件.ppt
《第三章多媒体数据压缩技术ppt课件.ppt》由会员分享,可在线阅读,更多相关《第三章多媒体数据压缩技术ppt课件.ppt(94页珍藏版)》请在三一办公上搜索。
1、第3章 多媒体数据压缩技术,本章重点:1.数据压缩的基本概念2.各种压缩技术的分类3.预测编码的基本原理4.变换编码的基本原理5.统计编码的基本原理6.分析合成编码的基本原理7.声音压缩标准8.图像视频压缩标准,3.1 数据压缩的基本原理和方法,3.2 音频的压缩,3.3 图像和视频的压缩,第3章 多媒体数据压缩技术,3.1 数据压缩的基本原理和方法,压缩的必要性 音频、视频的数据量很大,如果不进行处理,计算机系统几乎无法对它进行存取和交换。,例如,一幅具有中等分辨率(640480)的真彩色图像(24b/像素),它的数据量约为7.37Mb/帧,一个 100MB(Byte)的硬盘只能存放约100
2、帧图像。若要达到每秒25帧的全动态显示要求,每秒所需的数据量为184Mb,而且要求系统的数据传输率必须达到184Mb/s。对于声音也是如此,若采用16b样值的PCM编码,采样速率选为44.1kHZ,则双声道立体声声音每秒将有176KB的数据量。,3.1 数据压缩的基本原理和方法,视频、图像、声音有很大的压缩潜力 信息论认为:若信源编码的熵大于信源的实际熵,该信源中一定存在冗余度。,原始信源的数据存在着很多冗余度:空间冗余、时间冗余、视觉冗余、听觉冗余等。,3.1.1 数据压缩技术的性能指标,节省图象或视频的存储容量,增加访问速度,使数字视频能在PC机上实现,需要进行视频和图象的压缩。,有三个关
3、键参数评价一个压缩系统:,压缩比,图象质量,压缩和解压的速度,另外也必须考虑每个压缩算法所需的硬件和软件。,3.1.1 数据压缩技术的性能指标,1压缩比压缩性能常常用压缩比定义(输入数据和输出数据比),例:512480, 24bit/pixel(bpp) 输出15000byte 输入737280byte 压缩比737280/1500049:1,3.1.1 数据压缩技术的性能指标,2图象质量压缩方法: 无损压缩(图象质量不变)和有损压缩有损压缩:失真情况很难量化,只能对测试的图象进行估计。,3.1.1 数据压缩技术的性能指标,3压缩和解压速度 在许多应用中,压缩和解压将在不同时间、不同的地点、不
4、同的系统中进行。所以,压缩、解压速度分别估计。,静态图象中,压缩速度没有解压速度严格;动态图象中,压缩、解压速度都有要求,因为需实时地从摄像机或VCR中抓取动态视频。,3.1.1 数据压缩技术的性能指标,4硬软件系统 有些压缩解压工作可用软件实现。设计系统时必须充分考虑: 算法复杂 压缩解压过程长 算法简单 压缩效果差,目前有些特殊硬件可用于加速压缩/解压。 硬接线系统速度快,但各种选择在初始设计时已确定,一般不能更改。因此在设计硬接线压缩/解压系统时必须先将算法标准化。,(1)空间冗余,在同一幅图像中,规则物体和规则背景的表面物理特性具有相关性,这些相关性的光成像结果在数字化图像中就表现为数
5、据冗余。,(2)时间冗余,时间冗余反映在视频帧序列中,相邻帧图像之间有较大的相关性,一幅图像中的某物体或场景可由其他帧图像中的物体或场景重构出来。,1.数据冗余的类型:,3.1.2 数据冗余的类型与压缩方法分类,(3)信息熵冗余,信息熵冗余是指数据所携带的信息量少于数据本身而反映出来的数据冗余。,(4)视觉冗余,人类的视觉系统由于受生理特性的限制,对于图像场的注意是非均匀的,人眼并不能察觉图像场的所有变化。事实上人类视觉的一般分辨能力为26灰度等级,而一般图像的量化采用的是28灰度等级,即存在着视觉冗余。,3.1.2 数据冗余的类型与压缩方法分类,(5)听觉冗余,人耳对不同频率的声音的敏感性是
6、不同的,不能察觉所有频率的变化,对某些频率不必特别关注,因此存在听觉冗余。,(6)结构冗余,数字化图像中物体表面纹理等结构往往存在着数据冗余,这种冗余称为结构冗余。,(7)知识冗余,由图像的记录方式与人对图像的知识之间的差异所产生的冗余称为知识冗余。,3.1.2 数据冗余的类型与压缩方法分类,3.1.2 数据冗余的类型与压缩方法分类,2. 数据压缩技术分类 根据解码后数据与原始数据是否完全一致可以分为两大类:一类是熵编码、冗余压缩法,也称无损压缩法、无失真压缩法;二是熵压缩法,也称有损压缩法、有失真压缩法。 从“熵”损失角度分为无损压缩和有损压缩两种:,无失真压缩,又称熵编码。由于不会失真,多
7、用于文本数据的压缩,但也有例外,非线性编辑系统为了保证视频质量,有些高档系统采用的是无失真压缩方法。,有失真压缩,又称熵压缩法。大多数图像、声音、动态视频等数据的压缩是采用有失真压缩。,3.1.2 数据冗余的类型与压缩方法分类,从信息语义角度分为“熵(平均信息量)编码”和“源编码”两种: 熵 (平均信息量)编码(Entropy Coding),熵编码是一种泛指那些不考虑被压缩信息的性质的编码和压缩技术。它是基于平均信息量的技术把所有的数据当作比特序列,而不根据压缩信息的类型优化压缩。也就是说,平均信息量编码忽略被压缩信息的语义内容。,熵编码分为:重复序列消除编码 (含:消零、行程编码)、统计编
8、码等。,3.1.2 数据冗余的类型与压缩方法分类,源编码(Source Coding),源编码的冗余压缩取决于初始信号的类型、前后的相关性、信号的语义内容等。源编码比严格的平均信息量编码的压缩率更高。当然压缩的程度主要取决于数据的语义内容,比起平均信息量编码,它的压缩比更大。,源编码主要分为:预测编码、变换编码、向量量化等,3.1.2 数据冗余的类型与压缩方法分类,Entropy Coding,Run Length Coding,Statistical Coding,Huffman,Arithmetic,3.1.3 常用数据压缩方法的基本原理,1. 统计编码 方法是:识别一个给定的流中出现频率
9、最高的比特或字节模式,并用比原始比特更少的比特数来对其编码。即就是,频率越低的模式,其编码的位数越多,频率越高的模式编码位数越少。若码流中所有模式出现的概率相等,则平均信息量最大, 信源就没有冗余。,3.1.3 常用数据压缩方法的基本原理,(1)行程编码(Run Length Coding) 是最简单、最古老的压缩技术之一,主要技术是检测重复的比特或字符序列,并用它们的出现次数取而代之。该方法有两大模式:一是消零(消空白),二是行(游)程(run length)编码。,消零(或消空白)法:将数字中连续的“0”或文本中连续的空白用一个标识符(或特殊字符)后跟数字N(连续“0”的个数)来代替。 如
10、数字序列: 742300000000000000000055 编码为: 7423Z1855,3.1.3 常用数据压缩方法的基本原理,行程编码法:任何重复的字符序列可被一个短格式取代。该算法适合于任何重复的字符。 一组 n 个连续的字符 c 将被 c 和一个特殊的字符取代。当然,若给定字符仅重复两次就不要用此方法。任何重复4次或4次以上的字符由“该字符记号(M)重复次数”代替。 例如数字序列:Name: . . . . . . . . . . CR 编码为:Name: . M10 CR,3.1.3 常用数据压缩方法的基本原理,(2) LZW编码 LZW算法在压缩文本和程序数据的压缩技术中唱主角。
11、它的压缩率高,压缩处理所化费的时间比其它方式要少。,LZW编码时,首先将原始的数据分成多个条纹,每个条纹都单独进行压缩。,LZW算法基于一个转换表或字串表,它将输入字符映象到编码中,使用可变长代码,最大代码长度为12位。,3.1.3 常用数据压缩方法的基本原理,LZW算法中的字串表对于每个条纹都不同,并且不必保留给解压缩程序,因为解压缩过程中能自动建立完全相同的字串表。实际上,它是通过查找冗余字符串并将此字符串用较短的符号标记替代的压缩技术。,3.1.3 常用数据压缩方法的基本原理,(3) 哈夫曼编码1952年Huffman提出了对统计独立信源能达到最小平均码长的编码方法,也即最佳码。最佳性可
12、从理论上证明。这种码具有即时性和唯一可译性。,该编码是常见的一种统计编码。对给定的数据流,计算其每个字节的出现频率。根据频率表,运用哈夫曼算法可确定分配各字符的最小位数,然后给出一个最优的编码。代码字存人代码表中。,3.1.3 常用数据压缩方法的基本原理,哈夫曼编码过程:,例:现有A、B、C、D、E五个待编码的符号,它们的概率分别是0.3846、0.1795、0.1538、0.1538、0.1283,用哈夫曼算法求出这五个符号所分配的代码和熵、平均码长?,(1)初始化,根据符号概率的大小,按由大到小顺序对符号进行排序。,(2)把概率最小的两个符号组成一个节点,如D和E组成节点P1。,3.1.3
13、 常用数据压缩方法的基本原理,(3)重复步骤2,得到节点P2、 P3、 P4,形成一棵“树”, P4为根节点。,(4)从根节点P4开始到相应每个符号的“树叶”,从上到下标上“0”(上枝)、“1”(下枝)。,注:至于哪个为“1”哪个为“0”则无关紧要,最后的结果仅仅是分配的代码不同,而代码的平均长度是相同的。,3.1.3 常用数据压缩方法的基本原理,Huffman编码的优缺点优点:当信源符号概率是2的负幂次方时, Huffman 编码法编码效率达到100%。一般情况下,它的编码效率要比其它编码方法的效率高,是最佳变长码。,3.1.3 常用数据压缩方法的基本原理,缺点:,(1)编码中每个符号的编码
14、长度只能为整数,如果源符号集的概率分布不是2的负n次方的形式,则无法达到熵极限。,(2)为可变长度码, 译码复杂,(3)需要事先知道输入符号集的概率分布,(4)没有错误保护功能,3.1.3 常用数据压缩方法的基本原理,(4) 算术编码算术编码把一个信源集合表示为实数线上的0到1之间的一个区间。这个集合中的每个元素都要用来缩短这个区间。信源集合的元素越多,所得到的区间就越小,当区间变小时,就需要一些更多的数位来表示这个区间,这就是区间作为代码的原理。算术编码首先假设一个信源的概率模型,然后用这些概率来缩小表示信源集的区间。,3.1.3 常用数据压缩方法的基本原理,新子区间的起始位置前子区间的起始
15、位置当前符号的区间左端前子区间长度新子区间的长度前子区间的长度当前符号的概率(等价于范围长度)最后得到的子区间的长度决定了表示该区域内的某一个数所需的位数。,3.1.3 常用数据压缩方法的基本原理,例:假设信源符号为00,01,10,11,这些符号的概率分别为0.1,0.4,0.2,0.3,根据这些概率可把间隔0,1)分成四个子区间0,0.1),0.1,0.5),0.5,0.7),0.7,1)。如果二进制消息序列的输入为:10 00 11 00 10 11 01,请运用算数编码进行编码。,3.1.3 常用数据压缩方法的基本原理,2. 预测编码(Prediction Coding) 预测编码是指
16、利用前面的一个或多个信号对下一个信号进行预测,然后对实际值和预测值的差进行编码。DPCM与ADPCM是两种典型的预测编码。,3.1.3 常用数据压缩方法的基本原理,(1)差分脉码调制(DPCM) PCM(Pulse Code Modulation),原始的模拟信号经过时间采样,然后对每一样值进行量化,作为数字信号传输。,DPCM不对每一样值都进行量化,而是预测下一样值,并量化实际值和预测值之间的差。,DPCM是基本的编码方法之一,在大量的压缩算法中被采用,比如JPEG的DC分量就是采用DPCM编码的。,3.1.3 常用数据压缩方法的基本原理,举例说明DPCM编码原理: 设DPCM系统预测器的预
17、测值为前一个样值,假设输入信号已经量化,差值不再进行量化。若系统的输入为0 1 2 1 1 2 3 3 4 4 ,则预测值为0 0 1 2 1 1 2 3 3 4 ,差值为0 1 1 1 0 1 1 0 1 0 ,差值的范围比输入样值的范围有所减小,可以用较少的位数进行编码。,3.1.3 常用数据压缩方法的基本原理,量化器,编码器,+,预测器,信道,译码器,+,预测器,Xn,dn,d1n,x1n,x2n,d1n,x1n,x2n,发送端,接收端,DPCM典型的工作原理,误差 qn = xn-x1n=xn-(x2n+d1n)=(xn-x2n)-d1n=dn-d1n,3.1.3 常用数据压缩方法的基
18、本原理,(2)自适应差分脉码调制(ADPCM) 为了进一步改善量化性能或压缩数据率,可采用自适应量化或自适应预测的方法。只要采用了其中的任一种自适应方法,均称为ADPCM。,自适应预测 预测参数的最佳化依赖于信源的统计特性,要得到最佳的预测参数是一件繁琐的工作。 而采用固定的预测参数往往又得不到好的性能。为了既能使性能较佳,又不致于有太大的工作量,可以将上述两种方法折衷考虑,采用自适应预测。,3.1.3 常用数据压缩方法的基本原理,具体方法是:预测参数仍采用固定的;但此时有多组预测参数可供选择。这些预测参数根据常见的信源特征求得。编码时具体采用哪组预测参数根据信源的特征来自适应的确定。,为了自
19、适应的选择最佳参数,通常将信源数据分区间编码,编码时自动地选择一组预测参数,使该区间实际值与预测值的均方误差最小。随着编码区间的不同,预测参数自适应的变化,以达到准最佳预测。,3.1.3 常用数据压缩方法的基本原理,例如,Microsoft 的ADPCM采用二预测参数,提供7组预测系数,如右表所示。编码时,根据选定的准则(如最小均方误差准则),每个编码区间自动地选取一组最佳的参数。,自适应量化根据信号分布不均匀的特点,系统具有随输入信号的变化而改变量化区间大小, 以保持输入给量化器的信号基本均匀的能力,这种能力称为自适应量化。,3.1.3 常用数据压缩方法的基本原理,3.1.3 常用数据压缩方
20、法的基本原理,3.变换编码(Transformation Coding) 在变换编码时,初始数据要从初始空间或时间域进行数学变换,变换为一个更适于压缩的抽象域。该过程是可逆的;即使用反变换可恢复原始数据。如将时域信号变换到频域,因为声音、图像大部分信号都是低频信号,在频域中信号的能量较集中,再进行采样、编码就可以压缩数据。,3.1.3 常用数据压缩方法的基本原理,变换本身是可逆的,因而其也是一种无损技术。然而,为了取得更满意的结果,某些重要系数的编码位数比其他的要多,某些系数干脆就被忽略了。这样,该过程就成为有损的了。,数学家们已经构造了多种数学变换。除了傅里叶变换外,还有余弦、 Hadama
21、rd、 Haar、Karhunen Loeve变换。最实用最常用的数学变换是离散余弦变换(DCT)。,3.1.3 常用数据压缩方法的基本原理,典型的变换编码系统框图:,信源序列,变换,变换域采 样,量化编码,存储或传 输,译码,填零,反 变换,再现序列,变换编码系统压缩数据的三个步骤,3.1.3 常用数据压缩方法的基本原理,(1) 最佳变换(KL变换) 数据压缩主要是去除信源的相关性。若考虑到信号存在于无限区间上,而变换区域又是有限的,那么表征相关性的统计特性就是协方差矩阵。,当协方差矩阵中除对角线上元素之外的各元素都为零时,就等效于相关性为零。所以,为了有效地进行数据压缩,常常希望变换后的协
22、方差矩阵为一对角矩阵,同时也希望主对角线上各元素随,的增加很快衰减。因此,变换编码的关键在于:在已知的条件下,根据它的协方差矩阵去寻找一种正交变换,使变换后的协方差矩阵满足或接近为一对角矩阵。,3.1.3 常用数据压缩方法的基本原理,当经过正交变换后的协方差矩阵为一对角矩阵,且具有最小均方误差时,该变换称最佳变换,也称Karhunen-Loeve变换。可以证明,以矢量信号的协方差矩阵的归一化正交特征向量所构成的正交矩阵,对该矢量信号所作的正交变换能使变换后的协方差矩阵达到对角矩阵。,3.1.3 常用数据压缩方法的基本原理,(2) 离散余弦变换(DCT变换) 如果变换后的协方差矩阵接近对角矩阵,
23、该类变换称准最佳变换,典型的有DCT、DFT、WHT、HrT等。其中,最常用的变换是离散余弦变换DCT。,DCT是从DFT引出的。DFT可以得到近似于最佳变换的性能,但DFT的运算次数太多,且需要复数运算。DCT从DFT中取实部,并可用快速余弦变换算法,因此大大加快了运算。同时其压缩性能十分逼近最佳变换的压缩性能。所以,DCT在图像压缩中得到了广泛的应用。,3.1.3 常用数据压缩方法的基本原理,4. 分析-合成编码 通过对原始数据的分析,将其分解为一系列更适合于表示的基元或者从中提取出更有本质意义的参数,编码仅对这些基本单元或者特征参数进行,而解码时则借助于一定的规则或者模型,按照一定的算法
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第三 多媒体 数据压缩 技术 ppt 课件

链接地址:https://www.31ppt.com/p-1428373.html