《数据压缩技术》PPT课件.ppt
《《数据压缩技术》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《数据压缩技术》PPT课件.ppt(83页珍藏版)》请在三一办公上搜索。
1、第5章,多媒体技术,第 5 章,多媒体数据压缩技术,5.1 数据压缩基本原理 5.1.1 信息、数据与编码 5.1.2 数据压缩的条件 5.1.3 数据冗余5.2 数据压缩算法 5.2.1 数据压缩算法分类 5.2.2 预测编码原理 5.2.3 变换编码原理 5.2.4 统计编码原理 5.2.5 霍夫曼编码原理 5.2.6 行程编码原理,5.2.7 算术编码原理 5.2.8 LZW压缩编码5.3 静态图像JPEG压缩编码技术 5.3.1 JPEG标准的由来 5.3.2 JPEG压缩算法 5.3.3 无失真预测编码 5.3.4 有失真DCT压缩编码5.4 动态图像MPEG压缩编码技术 5.4.1
2、 基本原理 5.4.2 MPEG技术标准,数据压缩基本原理,5.1,数据压缩的对象是数据。数据是信息的载体,用来记录和传送信息。真正有用的不是数据本身,而是数据所携带的信息。大的数据量并不代表含有大的信息量。而对于去掉冗余的数据对信息没有本质的影响称为压缩。,数据压缩原理,5.1.1 信息、数据与编码,我们了解的东西,描述它用的信息量少,不了解的东西,描述它用的信息量大。在信息论中,可以说:信息是用不确定的度量来定义的;一个消息的可能性越小,其信息含量越大;消息的可能性越大,则信息含量越小。,自然现象,数据压缩基本原理,5.1,5.1.1 信息、数据与编码,1信息和熵,信息量的大小和消息有一定
3、的关系。在数学上,消息是其出现概率 的单调下降函数。信息量越大,消息的可能性越小,反之亦然。信息量:为了从N个相等的可能事件中挑选出一个事件所需的信息 度量和含量,所提问“是或否”的次数。也就是说,在N个事件中辨 识特定的一个事件要询问“是或否”次数。,例,随着每次询问,有半数的可能事件被取消,这个过程由公式表示:,可看出:对于256个数的询问只要进行8次,即可确定一个具体的数。设:从N个数中选定任意一个数x的概率为p(x),假定选定任意一个数的概率都相等,即p(x)=1/N,则信息量为:,如果将信息源所有可能事件的信息量进行平均,即可得到信息的“熵”(熵是平均信息量),信息源X的符号集为xi
4、(i=1,2,N)。设:xi出现的概率为p(xi),则信息源X的熵为:,信息与数据,2.,信息可以用函数表示,该函数由信息论创始人香农提出,以概率论的观点对信息进行定量描述,具体的信息函数表达式为:,公式中,Pi(i=1,2,r)是随机消息组合Xa1,a2,ar中的消息ai(i=1,2,r)的先验概率。Pi 可以度量ai(i=1,2,r)所含的信息量。而I(ai)(i=1,2,r)在X的先验概率空间Pp1,p2,pr中的统计平均值为信息源X的熵:,信息源X的熵用来度量X中每种消息所包含的平均信息量。信息熵主要表示信息系统的有序程度,而不是热力学中系统的无序程度。,例2-1 设信源有16种符号,
5、其出现的概率相同,即 P(Xi)=1/16。计算其平均信息熵。,例2-2 某信源有8种符号,其出现的概率如下:,信源中含有自然冗余度,这些冗余度既来自于信源本身的相关性,又来自于信源概率分布的不均匀性,只要找到去除相关性或改变概率分布不均匀性的手段和方法,也就找到了信息熵编码的方法。但信源所含有的平均信息量(熵)是进行无失真编码的理论的极限,只要不低于此极限,就能找到某种适宜的编码方法,去逼近信息熵,实现数据压缩。,香侬理论的要点,2.,多媒体信息的数据量,3.,考虑一张 640480 的全彩影像 64048038=7,372,800 Bits调制解调器(Modem)为 36Kbps 7372
6、800/36000=204.8(sec)=3.41(min)假设压缩算法(JPEG)的压缩率为1:12(7372800/12)/36000=17.1(sec)对图片压缩效果较好,但对色彩单纯的图形則效果一般不很理想。,数据压缩的条件,数据冗余度(重复数据、可忽略数据),信息传输与存储的限制(压缩 传输或存储 解压缩),44.1kHz/Stereo 1.3MB,22.0kHz/Mono 0.3MB,Stop,数据冗余,冗余基本概念,冗余 信息所具有的各种性质中多余的无用空间,冗余度 多余的无用空间的程度,音频数据8kHz采样8bit60秒=3840KBit(合480KB/分钟),冗余分类,1 空
7、间冗余规则物体的物理相关性,2 时间冗余视频与动画画面间的相关性,3 统计冗余具有空间冗余和时间冗余,6 视觉冗余视觉、听觉敏感度和非线性感觉,7 知识冗余凭借经验识别,4 结构冗余规则纹理、相互重叠的结构表面,5 信息熵冗余编码冗余,数据与携带的信息,8 其他冗余上述7种以外的冗余,冗余分类,1 空间冗余规则物体的物理相关性,2 时间冗余视频与动画画面间的相关性,3 统计冗余具有空间冗余和时间冗余,6 视觉冗余视觉、听觉敏感度和非线性感觉,7 知识冗余凭借经验识别,4 结构冗余规则纹理、相互重叠的结构表面,5 信息熵冗余编码冗余,数据与携带的信息,8 其他冗余上述7种以外的冗余,冗余分类,1
8、 空间冗余规则物体的物理相关性,2 时间冗余视频与动画画面间的相关性,3 统计冗余具有空间冗余和时间冗余,6 视觉冗余视觉、听觉敏感度和非线性感觉,7 知识冗余凭借经验识别,4 结构冗余规则纹理、相互重叠的结构表面,5 信息熵冗余编码冗余,数据与携带的信息,8 其他冗余上述7种以外的冗余,冗余分类,1 空间冗余规则物体的物理相关性,2 时间冗余视频与动画画面间的相关性,3 统计冗余具有空间冗余和时间冗余,6 视觉冗余视觉、听觉敏感度和非线性感觉,7 知识冗余凭借经验识别,4 结构冗余规则纹理、相互重叠的结构表面,5 信息熵冗余编码冗余,数据与携带的信息,8 其他冗余上述7种以外的冗余,冗余分类
9、,1 空间冗余规则物体的物理相关性,2 时间冗余视频与动画画面间的相关性,3 统计冗余具有空间冗余和时间冗余,6 视觉冗余视觉、听觉敏感度和非线性感觉,7 知识冗余凭借经验识别,4 结构冗余规则纹理、相互重叠的结构表面,5 信息熵冗余编码冗余,数据与携带的信息,8 其他冗余上述7种以外的冗余,冗余分类,1 空间冗余规则物体的物理相关性,2 时间冗余视频与动画画面间的相关性,3 统计冗余具有空间冗余和时间冗余,6 视觉冗余视觉、听觉敏感度和非线性感觉,7 知识冗余凭借经验识别,4 结构冗余规则纹理、相互重叠的结构表面,5 信息熵冗余编码冗余,数据与携带的信息,8 其他冗余上述7种以外的冗余,冗余
10、分类,1 空间冗余规则物体的物理相关性,2 时间冗余视频与动画画面间的相关性,3 统计冗余具有空间冗余和时间冗余,6 视觉冗余视觉、听觉敏感度和非线性感觉,7 知识冗余凭借经验识别,4 结构冗余规则纹理、相互重叠的结构表面,5 信息熵冗余编码冗余,数据与携带的信息,8 其他冗余上述7种以外的冗余,印度金庙泰姬陵,冗余分类,1 空间冗余规则物体的物理相关性,2 时间冗余视频与动画画面间的相关性,3 统计冗余具有空间冗余和时间冗余,6 视觉冗余视觉、听觉敏感度和非线性感觉,7 知识冗余凭借经验识别,4 结构冗余规则纹理、相互重叠的结构表面,5 信息熵冗余编码冗余,数据与携带的信息,8 其他冗余上述
11、7种以外的冗余,声音频率文字组句色彩渐变主观意识:,数据压缩算法,5.2,5.2.1 数据压缩算法分类,压缩比:2:15:1,压缩比:1:100,视频压缩算法结构图,视频压缩,无损压缩,有损压缩,霍夫曼编码行程编码算术编码LZW编码,预测编码变换编码模型编码基于重要性混合编码,DPCMADPCM运动编码,DCT变换小波变换子带编码,分形变换,滤波子采样矢量量化,H.261MPEG,预测编码原理,预测编码 有损压缩编码,主要对统计冗余进行压缩。,1预测编码的基本原理 用原样本值对新样本进行预测,得到新样本的预测值。接着,取新 样本的实际值和预测值进行比较,二者相减得到差值,然后对差值 进行编码。
12、,变换编码原理,变换编码(Transform coding)有损压缩编码,用于对统计冗余(图像数据)的压缩。,工作原理 首先对时域上的信号进行函数运算,并变换到频域上,然后在频域上对变换后的信号进行编码。在频域上,信息是按照频谱的能量和频率分布进行排列的。,例如,声音中的频谱分析实际上是对语音波形进行了快速傅里叶变换(FFT),将时域信号变到了频域中,可以清楚地看到能量集中在哪些频率范围内。,5.2.4 统计编码原理,统计编码 无损压缩编码。根据消息出现的概率分布特性,在消息和码字之间确定严格的对应关系,以便准确无误地恢复数据。一般而言,图像中某些数据出现概率比较高,而另一些出现概率较低。对出
13、现概率高的数据分配短码,对出现概率低的数据分配长码。此种方式不舍弃数据冗余,只改变编码分配的长度,因此总数据流量降低。,霍夫曼编码原理,霍夫曼编码 无损编码。,设信号源为X=、a、e、I、m、t、c、h、r。对应的概率为p=O.22、0.22、0.14、O.07、0.07、0.07、0.07、0.07、0.07,试给出该信源的霍夫曼编码方案。解:若传送一个串字符串“I am a teacher”,共14个字符。若用ASCII传送,每个字符8位,共需112位。该字符串中有9个不同的符号,至少需要4位二进制才能表示,这样传送该字符串也要56位。若用刚计算的Huffman编码,只需要42位。,霍夫曼
14、编码举例,霍夫曼编码过程,可以得到:a的编码00 e的编码 111 I的编码1101 m的编码1100 t的编码1011 c的编码 1010 h的编码1001 r的编码 1000原字符串(二进制)长度:=112(148)位Huffman编码长度:=42位(01 00 111 1101 1100 1011 1010 1001 1000),行程编码原理,行程编码(Run Length Coding)无损压缩编码。,设有数据流“AAABBBBCCCCCDAAAAAA”,试计算该数据的行程编码。解:A重复3次,B重复4次,C重复5次,D不重复,A重复6次,RLC数据流为:“SA3SB4SC5DSA6”
15、,其中S为指示符。总共占用13个字节,而源数据占用19个字节。有时行程编码不用指示符,重复与否相同对待,则相应的RLC为“A3B4C5D1A6”占用10个字节。,例,算术编码原理,算术编码 无损压缩编码,属于统计编码。,20世纪60年代由Elias提出,某些方面优于霍夫曼编码。因此,在JPEG标准的扩展系统中,算术编码已经取代了霍夫曼编码。,LZW压缩编码,LZW(Lempel Ziv Welch)无损压缩编码,用于图像数据的压缩。,LZW(Lempel Ziv Welch)是一种字典式无损压缩编码。1977年两位以色列教授Lempel和Ziv提出了查找冗余字符和用较短的符号标记替代冗余字符的
16、概念。1985年美国人Welch将该技术发展到实际运用阶段,命名为LZW技术。LZW把数据流中复杂的数据用简单的代码来表示,并把代码和数据的对应关系建立一个转换表(“字符串表”)。该转换表是在压缩或解压缩过程中动态生成的表,并用于压缩和解压缩过程中。LZW被广泛用于图像压缩领域。,LZW压缩编码,静态图像JPEG压缩编码技术,5.3,5.3.1 JPEG标准的由来,1991年,联合专家组提出了ISO CD建议草案,后经过国际电子技术委员会ISO/IEC的批准,正式成为第10918号标准,并正式命名为“JPEG高质量静止图像压缩编码标准”,简称“JPEG标准”。,计算机业内人士探寻一种压缩比大、
17、图像质量高的压缩编码。在这种背景下,压缩标准成为急待解决的问题。1986年CCITT和ISO共同成立了JPEG联合图像专家组,从事图像压缩的工业标准和学术意义的研究、探索。提出了ISO CD建议草案、即多灰度静止图像的数字压缩编码标准。,JPEG算法概述,JPEG算法根据人眼对亮度和颜色变化比较敏感的原理,在对图像数据进行压缩时,只保存亮度和颜色变化的数据部分,而舍弃人眼不敏感的成分,以达到压缩的目的。在图像还原时,并不重新建立原始图像,而是生成类似图像,该图像保留了人眼敏感的色彩和亮度。JPEG适合于连续色调、多级灰度、彩色或黑白图像的数据压缩。,JPEG压缩算法,适用于连续色调、多级灰度、
18、彩色或黑白图像的数据压缩。,无损压缩比:大约为4:1。有损压缩比:在10:1100:1之间。不大于40:1时,还原的图像在色彩、清晰度、颜色分布等方面与原始图像相比,误差不大,基本上保持了原始图像的风貌。,JPEG算法更多,无失真预测编码,无失真预测编码 无损压缩,压缩比一般为2:1。,有失真DCT压缩编码,采用DCT(Discrete Cosine Transform)离散余弦变换的压缩算法。,1DCT离散余弦变换,有失真DCT压缩编码,3图像的质量与压缩比,采用DCT算法存在失真,但是,只要量化表中的元素更科学、更 符合人类视觉敏感度,则压缩后的图像不会产生过大的视觉变化。,动态图像MPE
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据压缩技术 数据压缩 技术 PPT 课件

链接地址:https://www.31ppt.com/p-5519457.html