静态图像压缩与编码技术.ppt
《静态图像压缩与编码技术.ppt》由会员分享,可在线阅读,更多相关《静态图像压缩与编码技术.ppt(95页珍藏版)》请在三一办公上搜索。
1、多媒体信息技术October 222023年10月,计算机与信息学院,主要内容,数据压缩概述经典数据压缩理论香农范诺与霍夫曼编码算术编码行程编码词典编码预测编码变换编码现代数据压缩理论小波分形多媒体数据压缩编码的国际标准,数字信号的压缩与编码是多媒体的核心技术和重要内容;音频信号的差分/自适应/LPC编码就是典型的压缩编码.,多媒体信息技术October 222023年10月,计算机与信息学院,数据压缩技术是多媒体技术的关键技术,也是多媒体技术发展的基础。在多媒体技术发展到的今天,大家已经知道数据是可以压缩的,但数据为什么要压缩?为什么能够实现数据压缩?理论基础与原理是什么?实现数据压缩的具体
2、方法有哪些?目前世界通用的数据压缩标准是什么?其规范与实现的途径又有哪些?,思 考,多媒体信息技术October 222023年10月,计算机与信息学院,4.1 多媒体数据压缩编码的重要性和分类,数据压缩就是在一定的精度损失条件下,以最少的数码表示信源所发出的信号,什么是数据压缩,多媒体信息技术October 222023年10月,计算机与信息学院,4.1.1 多媒体数据压缩编码的重要性,数据压缩的必要性多媒体信号的数据量巨大,如:一幅1024*1024真彩图有3MB5分钟的CD音乐有50.47MB90分钟的PAL视频数字化后有204.68GB为了节省存储空间和传输带宽,进行实时高质的多媒体通
3、信,必须对多媒体数据进行压缩编码,多媒体信源引起了“数据爆炸”,如果不进行数据压缩,传输和存储都难以实用化。,多媒体信息技术October 222023年10月,计算机与信息学院,4.1.2 多媒体数据压缩的重要性,1分钟数字音频信号需要的存储空间,多媒体信息技术October 222023年10月,计算机与信息学院,1分钟数字视频信号需要的存储空间,4.1.2 多媒体数据压缩的重要性,多媒体信息技术October 222023年10月,计算机与信息学院,数据压缩的好处,时间域压缩迅速传输媒体信源频率域压缩并行开通更多业务空间域压缩降低存储费用能量域压缩降低发射功率,多媒体信息技术Octobe
4、r 222023年10月,计算机与信息学院,4.1.2 多媒体数据压缩的可能性,声音、视频、图像数据表示有很大的压缩潜力,多媒体数据和人类的感觉存在着各种冗余,如:空间冗余:在同一幅图像中,规则物体和规则背景的表面物理特性具有相关性,这些相关性的光成像结果在数字化图像中就表现为数据冗余。,压缩的可能,多媒体信息技术October 222023年10月,计算机与信息学院,4.1.2 多媒体数据压缩的可能性,时间冗余:时间冗余反映在图像序列中就是相邻帧图像之间有较大的相关性,一帧图像中的某物体或场景可以由其它帧图像中的物体或场景重构出来。音频的前后样值之间也同样有时间冗余。,F2,A,F1,A,多
5、媒体信息技术October 222023年10月,计算机与信息学院,4.1.2 多媒体数据压缩的可能性,听觉冗余:人耳对不同频率的声音的敏感性是不同的,并不能察觉所有频率的变化,对某些频率不必特别关注,因此存在听觉冗余。信息熵冗余:信源编码时,当分配给第i个码元类的比特数b(yi)=log pi,才能使编码后单位数据量等于其信源熵,即达到其压缩极限。但实际中各码元类的先验概率很难预知,比特分配不能达到最佳。实际单位数据量dH(S),即存在信息冗余熵。,多媒体信息技术October 222023年10月,计算机与信息学院,4.1.2 多媒体数据压缩的可能性,视觉冗余:人眼对于图像场的注意是非均匀
6、的,人眼并不能察觉图像场的所有变化。事实上人类视觉的一般分辨能力为26灰度等级,而一般图像的量化采用的是28灰度等级,即存在着视觉冗余。结构冗余:图象有非常强的纹理结构。如草席图结构上存在冗余。,多媒体信息技术October 222023年10月,计算机与信息学院,4.1.2 多媒体数据压缩的可能性,知识冗余:图像的理解与某些基础知识有关。例:人脸的图像有同样的结构:嘴的上方有鼻子,鼻子上方有眼睛,鼻子在中线上 其它冗余:图象空白的非定长性。,多媒体信息技术October 222023年10月,计算机与信息学院,4.1.3 多媒体数据压缩技术的性能指标,数据压缩技术的性能指标有三个关键参数评价
7、一个压缩系统压缩比图象质量压缩和解压的速度另外,也必须考虑每个压缩算法所需的硬件和软件。,多媒体信息技术October 222023年10月,计算机与信息学院,4.1.3 多媒体数据压缩技术的性能指标,压缩比压缩性能常常用压缩比定义输入数据和输出数据比 例一幅512480pixels图像,24bit/pixel 输入512480(24/8)=737280 byte 输出15000 byte 压缩比7372801500049,多媒体信息技术October 222023年10月,计算机与信息学院,4.1.3 多媒体数据压缩技术的性能指标,图象质量无损压缩(图象质量不变)有损压缩:失真情况很难量化,
8、只能对测试的图象进行估计。模拟图象质量的指标:信噪比、分辨率、颜色错,但必须在观察了实际图象以后。,多媒体信息技术October 222023年10月,计算机与信息学院,4.1.3 多媒体数据压缩技术的性能指标,压缩/解压速度在许多应用中,压缩和解压缩可能不同时用,所以,压缩、解压速度分别估计。静态图象中,压缩速度没有解压速度严格;动态图象中,压缩、解压速度都有要求,因为需实时地从摄像机或VCR中抓取动态视频。,多媒体信息技术October 222023年10月,计算机与信息学院,4.1.4 多媒体数据压缩的硬、软件系统,硬、软件系统有些压缩、解压工作可用软件实现。一般地讲,设计系统时必须充分
9、考虑:算法复杂 压缩解压过程长算法简单 压缩效果差目前有些特殊硬件可用于加速压缩解压。硬接线系统速度快,但各种选择在初始设计时已确定,一般不能更改。因此在设计硬接线压缩/解压系统时必须先将算法标准化。,多媒体信息技术October 222023年10月,计算机与信息学院,多媒体数据压缩技术,数据压缩(data compression)与信号编码(signal coding)往往含义相同压缩(compress)解压缩/还原/重构(decompress)编码(encode/coding)解码/译码(decode)相关学科:信息论、数学、信号处理、数据压缩、编码理论和方法,多媒体信息技术Octobe
10、r 222023年10月,计算机与信息学院,无损压缩是指使用压缩后的数据进行重构(或者叫做还原,解压缩),重构后的数据与原来的数据完全相同;无损压缩用于要求重构的信号与原始信号完全一致的场合。有损压缩是指使用压缩后的数据进行重构,重构后的数据与原来的数据有所不同,但不影响人对原始资料表达的信息造成误解。有损压缩适用于重构信号不一定非要和原始信号完全相同的场合。,4.1.5 数据压缩技术的分类,多媒体信息技术October 222023年10月,计算机与信息学院,4.1.5 数据压缩技术的分类(2),多媒体信息技术October 222023年10月,计算机与信息学院,4.1.5 数据压缩技术的
11、分类(3),1.熵编码熵编码(entropy encoding)是一类利用数据的统计信息进行压缩的无语义数据流的无损编码。它是基于平均信息量的技术把所有的数据当作比特序列,而不根据压缩信息的类型优化压缩。如RLE、LZW、Huffman编码2.信源编码(信)源编码(source coding)是一类利用信号原数据在时间域和频率域中的相关性和冗余进行压缩的有语义编码。种类繁多,可进一步分为预测编码:利用先前和现在的数据对在时间或空间上相邻的下面或后来的数据进行预测,从而达到压缩的目的。如DM、ADPCM变换编码:采用各种数学变换方法,将原时间域或空间域的数据变换到频率域或其他域,利用数据在变换域
12、中的冗余或人类感觉的特征来进行压缩。如DCT、DWT分层编码:将原数据在时空域或频率域上分成若干子区域,利用人类感觉的特征进行压缩编码,然后再合并。如子采样、子带编码其他编码:如矢量量化、运动补偿、音感编码,多媒体信息技术October 222023年10月,计算机与信息学院,4.1.5 数据压缩技术的分类(4),4.混合编码混合编码(hybrid coding)=熵编码+源编码大多数压缩标准都采用混合编码的方法进行数据压缩,一般是先利用信源编码进行有损压缩,再利用熵编码做进一步的无损压缩。如H.261、H.263、JPEG、MPEG常见,多媒体信息技术October 222023年10月,计
13、算机与信息学院,4.2 压缩编码研究史(1),1843年莫尔斯(Morse)的电报码是最原始的变长码数据压缩实例。1938年里夫斯(Reeves)、1946年德劳雷恩(E.m.Delorain)以及贝尔公司的卡特勒(C.C.Cutler)分别发明了脉冲编码调制(Pulse Code Modulation,PCM)、增量调制(Delta Modulation,)以及差分脉冲编码调制(Differential PCM,DPCM)。,多媒体信息技术October 222023年10月,计算机与信息学院,4.2 压缩编码研究史(2),1948年香农(C.E.Shannon)在其经典论文“通信的数学原理
14、”中首次提到信息率失真函数概念,1959年又进一步确立了率失真理论,从而奠定了信源编码的理论基础。1948年提出电视信号数字化后,就开始了图像压缩编码的研究工作。1952年霍夫曼(D.A.Huffman)给出最优变长码的构造方法。同年贝尔实验室的奥利弗(B.M.Oliver)等人开始研究线性预测编码理论;1958年格雷哈姆(Graham)用计算机模拟法研究图像的DPCM编码方法;1966年奥尼尔(J.B.ONeal)对比分析了DPCM和PCM,又于1969年进行了线性预测的实验。,多媒体信息技术October 222023年10月,计算机与信息学院,4.2 压缩编码研究史(3),20世纪60年
15、代,科学家们也开始探索比预测编码效率更高的编码方法。包括KL变换、傅立叶变换等正交变换。1968年安德鲁斯(H.C.Andrews)等人采用二维离散傅立叶变换(2D-DFT)提出了变换编码。此后相继出现了沃尔什-哈达玛(Walsh-Hadamard)变换、斜变换(Slant变换,由Enomoto和Shibata引入)、K-L变换、离散余弦变换(DCT)等。1976年美国贝尔系统的克劳切(R.E.Crochjiere)等人引入了语音的子带编码,1985年奥尼尔(S.D.ONeil)将子带编码推广到对图像的编码。,多媒体信息技术October 222023年10月,计算机与信息学院,4.2 压缩编
16、码研究史(4),1983年瑞典的Forchheimer 和Fahlander提出了基于模型图像编码(Model-Based Coding)。1986年,Meyer在理论上证明了一维小波函数的存在,创造性地构造出具有一定衰减特性的小波函数。1987年Mallat提出了多尺度分析的思想及多分辨率分析的概念,成功地统一了在此之前各种具体小波的构造方法,提出了相应的快速小波算法Mallat算法,并把它有效地应用于图像分解和重构;1989年,小波变换开始用于多分辨率图像描述。,多媒体信息技术October 222023年10月,计算机与信息学院,4.2 压缩编码研究史(5),1988年美国Georgia
17、理工学院的M.F.Barnsley在BYTE上发表了分形压缩方法,1992年A.Jacquin实现分块迭代函数系统(PIFS),完善了分形编码压缩方法。1988年在图像压缩编码的发展历史中是极为重要的一年。几十年研究的成果集中表现在确定了H.261和JPEG两个建议的原理框架,奠定了20世纪90年初相继提出的MPEG-1、MPEG-2、H.263等标准的基础。,多媒体信息技术October 222023年10月,计算机与信息学院,4.2 压缩编码研究史(6),1991年3月,“联合图片专家组”(JPEG,Joint Photographic Expert Group)提出JPEG标准草案,19
18、94年正式通过(ISO 10918)。1991年为二值图像编码制订了JBIG标准(ISO 11544)。新的JPEG版本是JPEG-LS(ISO/IEC 14495,1999),和JPEG 2000(ISO/IEC 15444,等同的ITU-T编号T.800),于1999年3月形成工作草案,2000年正式颁布的。JPEG的这些标准主要应用于静止图像处理。H.263(H.261 P x 64)涉及低分辨率的视频序列。它可以与为ISDN和移动通信开发的音频编码标准一起实现,这些标准已成为CCITT标准。,多媒体信息技术October 222023年10月,计算机与信息学院,4.2 压缩编码研究史(
19、7),1992年,“运动图片专家组”(MPEG,Moving Picture ExpertGroup)提出了“用于数字存储媒体运动图像及其伴音率为1.5Mbit/s的压缩编码”,简称为MPEG-1,作为ISO CD11172号建议通过,1993年正式通过。1993年提出MPEG-2标准草案,1994年正式通过(ISO/IEC 13818,视频部分为ITU-T H.262),处理能力可达广播级水平。MPEG-2标准兼容MPEG-1标准,适应于1.5Mbit/s 80Mbit/s编码范围。MPEG-2标准也是DVD和高清晰度电视(HDTV)全数字方案所采用的数据压缩标准。,多媒体信息技术Octob
20、er 222023年10月,计算机与信息学院,4.2 压缩编码研究史(8),1995年1月,国际标准化组织ITU-TLBC工作组为极低数码率可视电话(VeryLowBitRateVisualTelephony)的工作形成了H.263视频压缩编码草案。1997年11月提出了MPEG-4用于极低数码率数据压缩,1999年MPEG-4形成国际标准。又一个MPEG标准MPEG-7,是“多媒体内容描述接口”,在2001年正式颁布。目前正在开发的新的MPEG-21。,多媒体信息技术October 222023年10月,计算机与信息学院,4.3 量化,量化处理是使数据比特率下降的一个强有力的措施。脉冲编码调
21、制(PCM)的量化处理是采样之后进行,从理论分析的角度,图像灰度值是连续的数值,而我们通常看到的是以(0255)的整数表示图像灰度,这是经A/D变换后的以256级灰度分层量化处理了的离散数值,这样可以用log2256=8比特表示一个图像像素的灰度值,或色差信号值。,4.4.1 量化原理,多媒体信息技术October 222023年10月,计算机与信息学院,4.3 量化,数据压缩编码中的量化处理,不是指A/D变换后的量化,而是指以PCM码作为输入,经正交变换、差分、或预测处理后,熵编码之前,对正交变换系数、差值或预测误差的量化处理。量化输入值的动态范围很大,需要以多的比特数表示一个数值,量化输出
22、只能取有限个整数,称作量化级,希望量化后的数值用较少的比特数便可表示。每个量化输入被强行归一到与其接近的某个输出,即量化到某个级。量化处理总是把一批输入,量化到一个输出级上,所以量化处理是一个多对一的处理过程,是个不可逆过程,量化处理中有信息丢失,或者说,会引起量化误差(量化噪声)。,4.4.1 量化原理,多媒体信息技术October 222023年10月,计算机与信息学院,4.3 量化,量化器的设计要求 通常设计量化器有下述两种情况:给定量化分层级数,满足量化误差最小。限定量化误差,确定分层级数,满足以尽量小的平均比特数,表示量化输出。,4.4.2 标量量化器的设计,多媒体信息技术Octob
23、er 222023年10月,计算机与信息学院,4.3 量化,量化方法有标量量化和矢量量化之分,标量量化又可分为:均匀量化非均匀量化自适应量化,4.4.2 标量量化器的设计,多媒体信息技术October 222023年10月,计算机与信息学院,4.3 量化,均匀量化特性曲线,非均匀量化特性曲线,多媒体信息技术October 222023年10月,计算机与信息学院,4.3 量化,矢量量化编码是近年来图像、语音信号编码技术中颇为流行的一种新型量化编码方法。矢量量化编码方法一般是有失真编码方法。矢量量化的名字是相对于标量量化而提出的。对于PCM数据,一个数一个数地进行量化叫标量量化。若对这些数据分组,
24、每组K个数构成一个K维矢量,然后以矢量为单元,逐个矢量进行量化,称矢量量化。,4.4.3 矢量量化,矢量量化编码解码框图,多媒体信息技术October 222023年10月,计算机与信息学院,4.4 常用多媒体压缩方法,一编码准备模数转换(A/D):A/D连续模拟信号 离散数字信号采样/量化预处理:对得到的初始数字信号进行必要的处理,包括过滤、去噪、增强、修复等,以达到除去数据中的不必要成分、提高信号的信噪比、修复数据的错误等目的,编码过程,多媒体信息技术October 222023年10月,计算机与信息学院,编码与解码,A/D 预处理 压缩多媒体信号 数字信号 处理过的数字信号 压缩数据(子
25、)采样/量化 过滤/去噪/增强/修复源编码/熵编码存储 解码D/A 压缩数据 重构的数字信号 显示/播放传输 还原/重构(插值),二编解码过程,多媒体信息技术October 222023年10月,计算机与信息学院,熵编码,信息量和信息熵 图像的概率分布、信息量和信息熵之间有什么关系?在图像编码压缩理论研究中,为什么要引入信息论中“熵”值的概念,有什么重要意义?这是我们下面需要说明的问题。,信息论中的信源编码理论解决的主要问题:(1)数据压缩的理论极限(2)数据压缩的基本途径,多媒体信息技术October 222023年10月,计算机与信息学院,熵编码,编码器,信源(消息集),编码输出集(接收端
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 静态 图像 压缩 编码 技术

链接地址:https://www.31ppt.com/p-6378852.html