多媒体数据压缩技术课件.ppt
《多媒体数据压缩技术课件.ppt》由会员分享,可在线阅读,更多相关《多媒体数据压缩技术课件.ppt(48页珍藏版)》请在三一办公上搜索。
1、2023/1/19,第四章 多媒体数据压缩技术,第 1 页,第四章 数据压缩技术Data Compression Technologies,本章主要介绍目前用得最多和技术最成熟的数据压缩编码技术。数据压缩可分成两种类型,一种叫做无损(lossless)压缩,另一种叫做有损(lossy)压缩。无损压缩编码技术包括霍夫曼编码、算术编码、RLE编码和词典编码。有损压缩技术如离散余弦变换、小波变换等。,2023/1/19,第四章 多媒体数据压缩技术,第 2 页,内容提纲,4.1 数据压缩技术概述4.2 霍夫曼(Huffman)编码算法4.3 算术(Arithmetic)编码算法4.4 RLE编码(Ru
2、n Length Encoding)算法4.5 词典(Dictionary)编码算法,参考文献与作业,2023/1/19,第四章 多媒体数据压缩技术,第 3 页,作业,运用Huffman,算术编码,LZ77分别对下段文字进行编解码:(Huffman编码可设置码表),Grid computing is becoming an important framework for enabling applications to utilize widely distributed collections of computational and data resources,however curre
3、nt grid software is still immature and rather difficult to use.The Globus Grid Toolkit is a set of low-level tools,protocols and services that has become a de facto standard for basic grid computing infrastructure.The Globus Resource Allocation and Management(GRAM)service provides for the management
4、 and remote execution of jobs defined using a standard Resource Specification Language(RSL).Currently,the GRAM has very limited functionality,which makes it more difficult to develop grid applications.One limitation is the lack of support for applications that require a special execution environment
5、,such as Java applications that run within a Java Virtual Machine.Cumbersome workarounds are necessary to run such applications.The current GRAM addresses these problems in a rather ad hoc way for certain specific cases,however there is no general,well-defined mechanism for supporting arbitrary exec
6、ution environments.Here we outline some of the problems with the current Globus GRAM specification and provide a proposal for how they might be addressed by defining some extensions to the standard RSL supported by the GRAM,as well as some modifications to the design of the GRAM that would enable it
7、 to support arbitrary execution environments.We give examples of how our proposed system can provide improved support for Java applications and cluster management systems,and describe our ongoing work in implementing prototypes of these proposed GRAM extensions.,2023/1/19,第四章 多媒体数据压缩技术,第 4 页,参考文献,题名
8、:多媒体数据压缩技术丛编题名:全国高技术重点图书ISBN号:7-5053-2206-0出版项:北京 电子工业出版社 1994.4著者:高文题名:数据压缩技术及其应用丛编题名:计算机科学大众丛书ISBN号:7-5053-3253-8出版项:北京 电子工业出版社 2019 著者:袁玫,袁文题名:数据压缩技术原理与范例ISBN号:7-03-004846-6出版项:北京 科学出版社 2019著者:(美)Mark Nelson题名:数据压缩技术及其应用ISBN号:7-115-03835-X出版项:北京 人民邮电出版社 1989.6 著者:(美)林奇(Lynch,T.J.),2023/1/19,第四章 多
9、媒体数据压缩技术,第 5 页,数据压技术缩概述An Introduction to Data Compression,基本概念与定义 数据压缩技术的分类 常用的数据压缩方法,4.1,2023/1/19,第四章 多媒体数据压缩技术,第 6 页,数据压缩的必要性,数据通信数据存储,24 Bit Bitmap(193k),JPEG(10k),2023/1/19,第四章 多媒体数据压缩技术,第 7 页,考虑的因素,不能失真磁盘文件。允许失真在不影响“质量”的情况下,ABCAACBBC,ABCAACBBC,#$%&*,压缩编码,数据还原,256 color(66k),24 bit(193k),2023/
10、1/19,第四章 多媒体数据压缩技术,第 8 页,基本概念,无损压缩(Lossless Compression)是指使用压缩后的数据进行重构(或者叫做还原,解压缩),重构后的数据与原来的数据完全相同。有损压缩(Lossy Compression)是指使用压缩后的数据进行重构,重构后的数据与原来的数据有所不同,但不影响人对原始资料表达的信息造成误解。,无损压缩用于要求重构的信号与原始信号完全一致的场合。一个很常见的例子是磁盘文件的压缩。根据目前的技术水平,无损压缩算法一般可以把普通文件的数据压缩到原来的1/21/4。一些常用的无损压缩算法有霍夫曼(Huffman)算法和LZW(Lenpel-Zi
11、v&Welch)压缩算法。,有损压缩适用于重构信号不一定非要和原始信号完全相同的场合。例如,图像和声音的压缩就可以采用有损压缩,因为其中包含的数据往往多于我们的视觉系统和听觉系统所能接收的信息,丢掉一些数据而不至于对声音或者图像所表达的意思产生误解,但可大大提高压缩比。,2023/1/19,第四章 多媒体数据压缩技术,第 9 页,数据压缩技术的分类,2023/1/19,第四章 多媒体数据压缩技术,第 10 页,统计编码中“熵”的基本概念,熵(Entropy)熵是信息量的度量方法,它表示某一事件出现的消息越多,事件发生的可能性就越小,数学上就是概率越小。某个事件的信息量用 表示,其中pi为第i个
12、事件的概率,0 pi 1。信源s的熵的定义:按照香农(Shannon)的理论,信源s的熵定义为其中:pi 为 si 在 s 中出现的概率,表示包含在 si 中的信息量,也就是编码所需要的位数,例如,一幅用256级灰度表示的图像,如果每一个象素点灰度的概率均为 pi=1/256,编码每一个象素点就需要8位。,2023/1/19,第四章 多媒体数据压缩技术,第 11 页,常用的压缩方法,统计编码图像。预测编码音频。变换编码图像。混合编码标准,量化也是实现数据压缩的一种手段,2023/1/19,第四章 多媒体数据压缩技术,第 12 页,霍夫曼编码Huffman Encoding System,霍夫曼
13、(Huffman)在1952年提出的一种编码方法,即从下到上的编码方法。该方法根据待编码信息的统计特征(熵),先按出现频率的大小从下到上构建编码树;然后按类似于前序(后序)遍历的方法赋予树的每条边一个码值,“0”或“1”;最后探索根到叶结点,根到叶所经历边码的序列即为该字符的“码值”。霍夫曼编码分为定长编码和变长编码两种。后者的应用比较广泛。此外,霍夫曼编码自含同步码,码串中不需要另加标记。,4.2,2023/1/19,第四章 多媒体数据压缩技术,第 13 页,编码算法,主要步骤(可变长编码)统计各字符出现的频率根据贪心策略构建编码树按类似于前序遍历的方法递归地遍历编码树,对于连接左子树的边赋
14、予边码为“0”,连接右树的边码为“1”。反过来亦可。即算从“根”到“叶”的边码序列,得到某字符的编码。,0.1282,0.1538,0.1539,0.1795,0.3846,0.2820,0.3334,0.6154,1.0000,0,1,0,0,1,1,1,0,A,B,C,D,E,A:“0”,B:“100”,C:“101”,D:“110”,E:“111”,2023/1/19,第四章 多媒体数据压缩技术,第 14 页,编码方法,Huffman编码举例,从下到上按贪心策略进行选择来构建二进制编码树。在进行编码树遍历时规定连接“左”子数的边码为“0”,右子树的码为“1”。反过来也可以。从根到叶的边码
15、序列为该叶节点的编码,如C的编码为“101”。,2023/1/19,第四章 多媒体数据压缩技术,第 15 页,霍夫曼编码小结,霍夫曼码的码长虽然是可变的,但却不需要另外附加同步代码(自含同步码,在编码之后的码串中都不须要另外添加标记符号)。例如,码串中的第1位为0,那末肯定是符号A,因为表示其他符号的代码没有一个是以0开始的,因此下一位就表示下一个符号代码的第1位。同样,如果出现“110”,那么它就代表符号D。如果事先编写出一本解释各种代码意义的“词典”,即码簿,那么就可以根据码簿一个码一个码地依次进行译码采用霍夫曼编码时有两个问题值得注意:霍夫曼码没有错误保护功能,在译码时,如果码串中没有错
16、误,那么就能一个接一个地正确译出代码。但如果码串中有错误,哪仅是1位出现错误,不但这个码本身译错,更糟糕的是一错一大串,全乱了套,这种现象称为错误传播(error propagation)。计算机对这种错误也无能为力,说不出错在哪里,更谈不上去纠正它。霍夫曼码是可变长度码,因此很难随意查找或调用压缩文件中间的内容,然后再译码,这就需要在存储代码之前加以考虑。,2023/1/19,第四章 多媒体数据压缩技术,第 16 页,算术编码Arithmetic Encoding System,算术编码在图像数据压缩标准(如JPEG,JBIG)中扮演了重要的角色。在算术编码中,消息用0到1之间的实数进行编码
17、,算术编码用到两个基本的参数:符号的概率和它的编码间隔。信源符号的概率决定压缩编码的效率,也决定编码过程中信源符号的间隔,而这些间隔包含在0到1之间。编码过程中的间隔决定了符号压缩后的输出。,4.3,2023/1/19,第四章 多媒体数据压缩技术,第 17 页,关于算术编码,简要历史:20世纪60年代初,Elias提出了算术编码(Arithmetic Coding)概念。1976年Rissanen和Pasco首次介绍该实用技术。基本原理:将编码的信息用0到1之间的实数区间进行编码 算术编码用到两个基本的参数:符号的概率:信源符号的概率决定压缩编码的效率,也决定编码过程中信源符号的间隔,而这些间
18、隔包含在0到1之间。编码间隔:编码过程中的间隔决定了符号压缩后的输出。,2023/1/19,第四章 多媒体数据压缩技术,第 18 页,算术编码简介,编码举例假设信源符号、出现的概率和处世间隔如下:编码过程:假设消息序列的输入顺序为:10 00 11 00 10 11 01。,2023/1/19,第四章 多媒体数据压缩技术,第 19 页,算法描述,考虑一个有M个符号ai=(1,2,M)的字符表集,假定ai的概率 p(ai)=pi,而输入的符号用xn表示,第n个子间隔的范围用表示,其中:l0=0,d0=0,p0=0,ln表示间隔左边界的值,rn表示间隔右边界的值,dn=rn-ln表示间隔长度。,2
19、023/1/19,第四章 多媒体数据压缩技术,第 20 页,算法描述,编码步骤如下:,步骤1:首先在1和0之间给每个符号分配一个初始子间隔,子间隔的长度等于 它的概率,初始子间隔的范围为I1。令 d1=r1-l1,L=l1 和 R=r1。步骤2:L 和 R 的二进制表达式分别表示为:和 其中 uk和 vk等于“1”或者“0”。比较 u1和 v1:如果,不发送任何数据,转到步骤3。反之,发送二进制符号 u1。比较 u2和 v2:如果,不发送任何数据,转到步骤3;反之,发送二进制符号u2。这种比较一直进行到两个符号不相同为止。步骤3:令 n=n+1,读下一个符号。假设第 n 个输入符号为 xn=a
20、i,按照以 前的步骤把这个间隔分成子间隔 In;并令 L=In,R=rn 和 dn=rn-ln,转步骤2。,2023/1/19,第四章 多媒体数据压缩技术,第 21 页,算法描述,编码过程:,2023/1/19,第四章 多媒体数据压缩技术,第 22 页,算法描述,译码过程,2023/1/19,第四章 多媒体数据压缩技术,第 23 页,算术编码小结,在算术编码中需要注意的几个问题:由于实际的计算机的精度不可能无限长,运算中出现溢出是一个明显的问题,但多数机器都有16位、32位或者64位的精度,因此这个问题可使用比例缩放方法解决。算术编码器对整个消息只产生一个码字,这个码字是在间隔0,1)中的一个
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体 数据压缩 技术 课件

链接地址:https://www.31ppt.com/p-2146995.html