第六章多媒体数据压缩教材课件.ppt
《第六章多媒体数据压缩教材课件.ppt》由会员分享,可在线阅读,更多相关《第六章多媒体数据压缩教材课件.ppt(102页珍藏版)》请在三一办公上搜索。
1、2023/4/3,1,多媒体技术,2,2023/4/3,第6章 多媒体数据压缩,3,2023/4/3,6.1 多媒体数据压缩概述,6.1.1 多媒体数据压缩的必要性 原始采样的媒体数据量巨大 有效利用存储器存储容量 提高通信线路的传输效率 消除计算机系统处理视频I/O瓶颈,4,2023/4/3,6.1 多媒体数据压缩概述,6.1.2 多媒体数据压缩的可能性常见的图像数据冗余种类:空间冗余 时间冗余 结构冗余 知识冗余 视觉冗余,5,2023/4/3,空间冗余,在任何一幅图像中,均有由许多灰度或颜色都相同的邻近像素组成的区域,它们形成了一个性质相同的集合块,即它们相互之间具有空间上的强相关性,在
2、图像中就表现为空间冗余。,例如,一块表面颜色均匀的区域中所有点的光强和色彩以及饱和度都是相同的,这就是空间冗余。,6,2023/4/3,时间冗余,这是序列图像(电视图像、运动图像)表示中经常包含的冗余。图像序列中两幅相邻的图像有较大的相关,这反映为时间冗余。,运动图像的相邻帧往往包含相同的背景和移动物体,只不过物体所在的位置略有不同,由于相邻帧记录了相邻时刻的同一场景,所以称为时间冗余。,7,2023/4/3,结构冗余,在有些图像的纹理区,图像的像素值存在着明显的分布模式。例如,方格状的板图案等,我们称此为结构冗余。已知分布模式,可以通过某一过程生成图像。,8,2023/4/3,知识冗余,有些
3、图像的理解与某些知识有相当大的相关性。例如:狗的图像有固定的结构,狗有四条腿,头部有眼、鼻、耳朵,有尾巴等。这类规律性的结构可由先验知识和背景知识得到,我们称此类冗余为知识冗余。,9,2023/4/3,视觉冗余,人类的视觉系统对图像场的敏感度是非均匀的。但是,在记录原始的图像数据时,通常假定视觉系统近似线性的和均匀的,对视觉敏感和不敏感的部分同等对待,从而产生比理想编码(即把视觉敏感和不敏感的部分区分开来的编码)更多的数据,这就是视觉冗余。人类视觉系统的一般分辨能力估计为26灰度等级,而一般图像的量化采用的是28的灰度等级。这也被称之为视觉冗余。,10,2023/4/3,6.1 多媒体数据压缩
4、概述,6.1.3 多媒体数据压缩的原理1.图像数据压缩的主要依据有两个一是图像数据中有许多重复的数据,使用数学方法来表示这些重复数据就可以减少数据量;另一个依据是人眼睛对图像细节和颜色的辨认有一个极限,把超过极限的部分去掉,这也就达到了数据压缩的目的。,基于数据冗余的压缩技术是无损压缩技术,基于人眼视觉特性的压缩技术是有损压缩技术,11,2023/4/3,6.1.3 多媒体数据压缩的原理,2.图像压缩说明视频压缩与语音相比,语音的数据量较小,且基本压缩方法已经成熟,目前的数据压缩研究主要集中于图像和视频信号的压缩方面。压缩处理过程有两个过程,编码过程是将原始数据经过编码进行压缩,以便存储与传输
5、;解码过程是对编码数据进行解码,还原为可以使用的数据。,12,2023/4/3,6.1.3 多媒体数据压缩的原理,3.与压缩相关的指标衡量一种数据压缩技术的好坏有四个重要的指标:压缩比大:即压缩前后所需要的信息存储量之比要大。算法简单:实现压缩的算法简单,压缩、解压速度快,尽可能地做到实时压缩解压。恢复效果好:恢复效果好,要尽可能地恢复原始数据。压缩能否用硬件实现。,13,2023/4/3,6.1.3 多媒体数据压缩的原理,14,2023/4/3,6.1.3 多媒体数据压缩的原理,冗余压缩法也称无损压缩法,是指使用压缩后的数据可以解压缩,且解压之后的数据与原来的数据完全相同。它利用数据的统计冗
6、余进行压缩,可完全恢复原始数据而不引入任何失真,但压缩率受到数据统计冗余度的理论限制,一般为2:1到5:1。,15,2023/4/3,6.1.3 多媒体数据压缩的原理,熵压缩法也称有损压缩法,有失真压缩,是指使用压缩后的数据进行解压缩,解压之后的数据与原来的数据有所不同,但不会让人对原始资料表达的信息造成误解。,16,2023/4/3,6.1.3 多媒体数据压缩的原理,熵压缩法与冗余压缩法的比较在图像压缩系统组成中,变换和编码是无损耗的,而量化是有损耗的。无损压缩方法仅利用了统计冗余,而没有利用量化器。有损压缩方法既利用了统计冗余又采用了量化器,利用了心理视觉冗余。,17,2023/4/3,6
7、.1.4 数据压缩方法的分类,1.根据编、解码后数据是否一致来进行分类,数据压缩的方法一般被划分为两类:可逆编码(无损编码)。此种方法的解码图像与原始图像严格相同,压缩比大约在2:15:1之间。主要编码有Huffman编码、算术编码、行程长度编码等。不可逆编码(有损编码)。此种方法的解码图像与原始图像存在一定的误差,但视觉效果一般可以接受,压缩比可以从几倍到上百倍调节。常用的编码有变换编码和预测编码。,18,2023/4/3,6.1.4 数据压缩方法的分类,2.根据压缩方法的原理,可将其具体划分为以下几种:量化与向量量化编码 预测编码 变换编码 信息熵编码 混合编码变换编码与预测编码相结合,1
8、9,2023/4/3,量化与向量量化编码,对像元点进行量化时,除了每次仅量化一个点的方法外,也可以考虑一次量化多个点的做法,这种方法称为向量量化。即利用相邻数据间的相关性,将数据系列分组进行量化。,20,2023/4/3,预测编码,预测编码预测编码是根据离散信号之间存在着一定关联性的特点,利用前面一个或多个信号预测下一个信号进行,然后对实际值和预测值的差(预测误差)进行编码。如果预测比较准确,误差就会很小。在同等精度要求的条件下,就可以用比较少的比特进行编码,达到压缩数据的目的。如:增量调制(DM)、差分脉冲编码调制(DPCM)、自适应增量调制(ADPCM)等。主要用于声音编码。,21,202
9、3/4/3,变换编码,变换编码将图像时域信号转换为频域信号进行处理。数据处理时可以将主要的注意力集中在相对较小的区域,从而实现数据压缩。一般采用正交变换,如:离散余弦变换(DCT)、离散傅立叶变换(DFT),22,2023/4/3,信息熵编码,信息熵原理让出现概率大的信号用较短的码字表示,反之用较长的码字表示。常见的编码方法Huffman编码Shannon编码算术编码,23,2023/4/3,6.2 数据压缩的技术基础,6.2.1 熵的概念表示一条信息中真正需要编码的信息量,即数据压缩的理论极限。对于任何一种无损数据压缩,最终的数据量一定大于信息熵,数据量越接近于熵值,说明其压缩效果越好。,2
10、4,2023/4/3,6.2 数据压缩的技术基础,6.2.2 信息熵的计算1.信息量信息量是指从N个等概率事件中选出一个事件所需要的信息含量。设从N个数中选定任一个数xj的概率为p(xj),假定选定任意一个数的概率都相等,即p(xj)1/N,因此定义信息量如下:,概率相等,概率不等,25,2023/4/3,6.2.2 信息熵的计算,2.信息熵:平均信息量信源X发出的xj(j=1,2,n)共n个随机事件,每个事件产生的平均信息量为:H(X)称为信源X的“熵”,即信源X发出任意一个随机变量的平均信息量。其中:等概率事件的熵最大,假设有N个事件,则此时熵为:,最大熵,概率信息量,26,2023/4/
11、3,6.2.3 信息熵的范围,当P(x1)1时,P(x2)P(x3)P(xj)0,则此时熵为:由上可得熵的范围为:,最小熵,27,2023/4/3,6.2.4 平均码长,在编码中用熵值来衡量是否为最佳编码。若以Lc表示编码器输出码字的平均码长,则当LcH(X)有冗余,不是最佳。LcH(X)不可能。LcH(X)最佳编码(Lc稍大于H(X))。熵值为平均码长Lc的下限。平均码长Lc的计算公式为:,(j=1,2,n),其中:P(xj)是信源X发出xj的概率,L(xj)为xj的编码长。,28,2023/4/3,6.2.5 冗余度、编码效率与压缩比,在数字图像通信系统中,冗余度、编码效率与压缩比是衡量信
12、源特性以及编解码设备性能的重要指标。设原图像的平均码长为L,熵为H(X),压缩后图像的平均码长为Lc,则编码效率为:冗余度为:1-压缩比为:,Lc,29,2023/4/3,6.3 常用的无损数据压缩方法,6.3.1 Huffman编码6.3.2 算术编码6.3.3 行程RLE编码6.3.4 词典编码,30,2023/4/3,6.3.1 Huffman编码,基本原理依据信源字符出现的概率大小来构造代码,对出现概率较大的信源字符,给予较短码长,而对于出现概率较小的信源字符,给予较长的码长,最后使得编码的平均码字最短。,31,2023/4/3,6.3.1 Huffman编码,具体的编码步骤将信源出现
13、的概率由大到小排序。将两处最小概率组合相加,形成新概率。将新概率与未编码的字符一起重新排序。重复步骤2、3,直到出现的概率和为1。分配代码代码分配从最后一步开始反向进行,对最后两个概率一个赋予0代码,一个赋予1代码。记录下从树的根到每个信源符号终节点的0和1序列。,至于哪个为“1”哪个为“0”则无关紧要,最后的结果仅仅是分配的代码不同,而代码的平均长度是相同的。,32,2023/4/3,6.3.1 Huffman编码,Huffman编码中求平均码长的方法:概率码长,33,2023/4/3,6.3.1 Huffman编码,Huffman编码练习一:设输入图像的灰度级a1,a2,a3,a4,a5,
14、a6出现的概率分别是0.4、0.2、0.12、0.15、0.1、0.03。试进行哈夫曼编码,并计算平均码字长度。,34,2023/4/3,6.3.1 Huffman编码,Huffman编码练习二:信源符号的概率如下,请按要求作答:画出其Huffman编码的编码树给出各信源符号的码字与码长计算该信源的平均码长。(说明:大概率符号赋予0,小概率符号赋予l,相同概率情况下上面的是0,下面的是1。),35,2023/4/3,Huffman编码练习一答案,最终编码结果为:a1=1,a2=011,a3=001,a4=010,a5=0001,a6=0000,1,0,1,0,0,1,0,36,2023/4/3
15、,Huffman编码练习一答案,据公式图像信源熵为:H(X)=-(0.4log20.4+0.2log20.2+0.12log20.12+0.15log20.15+0.1log20.1+0.03log20.03)=2.25 bit 根据哈夫曼编码结果,平均码字长度:Lc=0.41+0.23+0.153+0.123+0.14+0.034=2.33编码效率、压缩比和冗余度分别为:96.6%、1.2、3.4%,r=1-=3.4%,37,2023/4/3,Huffman编码练习二答案,38,2023/4/3,6.3.1 Huffman编码,Huffman编码注意事项哈夫曼编码没有错误保护功能,在译码时,
16、如果码串中没有错误,那么就能一个接一个的正确译出代码。但如果码串中有错误,哪怕仅是1位出现错误,不但这个码本身译错,后面的译码可能全错,这种现象称为错误传播(Error Propagation)。哈夫曼编码是可变长度码,很难随意查找或调用压缩文件中间的内容,然后再译码,这就需要在存储代码之前加以考虑。,39,2023/4/3,6.3.2 算术编码,算术编码(arithmetic coding AC)是利用0和1之间的间隔来表示信源编码的一种方法,其编码值是间隔的上、下限包含的相同二进制。编码过程中的间隔决定了符号压缩后的输出。算术编码用到两个基本的参数符号的概率和它的编码间隔。信源符号的概率决
17、定压缩编码的效率,也决定编码过程中信源符号的间隔,而这些间隔包含在0到1之间。,40,2023/4/3,6.3.2 算术编码,编码过程:设信源符号为A,B,C,D,其概率分别为 0.1,0.4,0.2,0.3,按概率可把间隔0,1分成4个子间隔:0,0.1),0.1,0.5),0.5,0.7),0.7,1,其中x,y)表示半开放间隔,即包含x不包含y,如下表所示。,41,2023/4/3,6.3.2 算术编码,如果消息序列的输入为:CADACDB,其编码过程如下:首先输入的符号是C,找到它的编码范围是0.5,0.7);由于消息中第2个符号A的编码范围是0,0.1),因此它的间隔就取0.5,0.
18、7)的第一个1/10作为新间隔0.5,0.52);编码第3个符号D时取新间隔为0.514,0.52);编码第4个符号A时,取新间隔为0.514,0.5146),。,42,2023/4/3,6.3.2 算术编码,43,2023/4/3,6.3.2 算术编码,消息的编码输出可以是最后一个间隔中的任意数,整个编码过程如下图所示。最后在0.5143876,0.514402)中选择一个数作为编码输出值:0.51439。解码时,解码器由编码输出值:0.51439,可马上解得一个字符为C,然后依次得到唯一解A,D,A,C,D,B。,44,2023/4/3,6.3.2 算术编码,译码过程如下:,45,2023
19、/4/3,6.3.2 算术编码,在算术编码中需要注意的几个问题:由于计算机精度不可能无限长,运算中容易出现溢出,但多数机器都有16位、32位或者64位的精度,因此可使用比例缩放方法解决。算术编码器对整个消息只产生一个码字,这个码字是在间隔0,1)中的一个实数,因此译码器在接受到所有位之前不能进行译码。算术编码也是一种对错误很敏感的编码方法,如果有一位发生错误就会导致整个消息译错。,46,2023/4/3,6.3.2 算术编码,算术编码练习一:假设有4个符号的信源,它门的概率如下表所示:输入序列为Xn:a2,a1,a3,。试画出它的编码过程,47,2023/4/3,6.3.2 算术编码,算术编码
20、练习二:假设信源符号为1,0,如果消息序列的输入为1101。这些符号的概率分别为:画出其编码过程!,48,2023/4/3,算术编码练习一答案,最后的编码结果是:0.59375,0.609375,49,2023/4/3,算术编码练习二答案,最后的编码结果是:121/256,37/64),50,2023/4/3,6.3.3 行程长度编码,RLE(Run-Length Encoding)是一个针对包含有顺序排列的多次重复的数据的压缩方案。其原理就是把一系列的重复值用一个单独的值再加上一个计数值来取代,行程长度就是连续且重复的单元数目。如果想得到原始数据,只需展开这个编码就可以了。,51,2023/
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第六 多媒体 数据压缩 教材 课件

链接地址:https://www.31ppt.com/p-4094780.html