欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > DOC文档下载  

    毕业设计(论文)图像压缩方法研究.doc

    • 资源ID:3978237       资源大小:408KB        全文页数:25页
    • 资源格式: DOC        下载积分:8金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要8金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    毕业设计(论文)图像压缩方法研究.doc

    图像压缩方法研究The Research of Image Compression Method 专 业:电子信息科学与技术学 号:03111252姓 名: 指导教师:目录内容摘要IABSTRACTII第一章 绪 论11.1 课题背景11.2 图像数据压缩的必要性11.3 图像数据压缩的可能性21.4 图像压缩技术研究的起源与发展3第二章 数字图像压缩的原理42.1 数字图像的压缩概述42.2 图像压缩的基本原理42.2.1 信息论基础42.2.2 图像的基本压缩方式52.3 图像压缩系统概述及压缩系统评价62.3.1 图像压缩系统的组成62.3.2 图像压缩系统评价7第三章 数字图像的编码方式103.1 数字图像编码的分类103.2 无损数字图像编码方式103.2.1 游程编码103.2.2 LZW编码103.2.3 霍夫曼编码113.2.4 算术编码113.3 有损图像压缩编码方式123.3.1 失真度理论和有损压缩133.2.2 变换编码133.2.3 预测编码143.2.4 矢量量化编码153.2.5 DCT变换编码163.2.6 小波编码17结束语19参考文献20致 谢21内容摘要随着计算机多媒体技术的发展,人们期望更高性能的图像压缩技术的出现。基于对图像存储技术和图像通信的考虑,良好的图像压缩技术不仅能够实现高压缩率和高保真率,还能满足诸如渐进传输、图像渐现等网络应用的需要。因此,为了满足实际应用的需要,有必要对图像数据压缩处理进行深入细致的研究,目前已发展成为专门的研究领域:图像编码。常见的主要编码方法有预测编码、变换编码、矢量量化编码、小波编码、分形编码等等。论文首先对数字图像压缩技术进行了综述,回顾了图像压缩技术的起源与发展,详细阐述了图像压缩的必要性和可能性,分析图像压缩的一般模型,以及复原图像质量的性能评价标准。然后重点介绍图像压缩编码的分类,对图像压缩编码,特别是预测编码、变换编码、矢量量化编码、小波编码的原理和特点进行分析,并阐述图像压缩编码的作用。关键词: 图像压缩,图像编码,小波变换,图像质量AbstractWith the ever-growing multimedia technique, people are looking forward to new image compression techniques with better performance. Taking the storage and transfer of mass image data into consideration, not only could favorable image compression techniques achieve high compression ratio and fidelity, they should also meet the demands of web applications. Image compression needs further detailed study, thus a specialized research field known as image coding develops. Frequently used major coding methods include pedicel code, transform code, vestal quantization, wavelet transform code, and fractal code. The paper firstly summarizes the image compression technology, presents the general conception of image compression technique, and briefly introduces several image compression algorithms. Also, it introduces the general model of image compression, as well as the performance appraising criterion of recovered image Quality. Then,it expatiates on the classification of image coding and analyzes the images compression coding , especially to pedicel code, transform code, vestal quantization, wavelet transform code, fractal code. At last, the function of image compression coding is described. Keywords: Image coding,Image compression,Wavelet, Image quality第一章 绪 论1.1 课题背景图像压缩编码技术始于五十年代初的电视信号数字化。当时图像压缩技术主要局限在预测编码、亚采样以及内插复原等技术上。七十年代后出现了变换编码技术,并且由于通信技术的发展,对活动图像压缩技术也有较多的研究,如运动估值和运动补偿。进入八十年代中后期,出现了许多新的图像压缩编码方法,例如小波、分形和神经网络图像压缩方法。这新的图像编码方法从图像压缩机制及处理方法上都有新的突破,获得了更高的图像压缩效率。因而使图像压缩的技术和理论取得了很大的发展。此外,对活动图像压缩编码技术的研究也取得了许多重要研究成果:电视电话/会议电影的MIT H.2b3建议和静止及活动图像压缩的JPEG, MPEG-1和 MPEG-2国际标准。所有这些己成为成熟的技术并获得了厂-泛的应用。1998年底,针对低比特率的活动图像压缩编码国际标准MPEG-4也正式制定,新的静止图像压缩标准JPEG2000也已施行。鉴于图像压缩所具有的重要性,己引起世界各国的广泛重视,图像压缩编码技术己成为当今信息技术中最具吸引力的热门研究领域之一。近年来随着基础理论和科学技术的进步,人们一直在寻求更好的压缩编码的方法。在新提出的编码方法中,小波变换方法和分形几何方法被认为是有较大应用潜力的,受到该领域专家们的广泛关注,掀起了研究的热潮。随着现代通信技术的飞速发展和通信业务的不断拓展,图像信息传输已经成为现代通信系统所提供的基本服务。在当前这样一个信息爆炸的社会中,人们在交换图像及声音等媒体信息方面的需求越来越大,对交换的质量要求也越来越高。通常图像经数字化后形成的数据量非常大。例如,一副分辨率为 1024768的24bit真彩色静止图像,就有 2.36MB的数据量。如果进行视频处理,假设每秒 30帧,则每秒产生近 70MB的数据,也就是说,一张普通的光盘只能容纳9s的图像。但是具有庞大数据量的数字图像难以传输和存储,数字图像通信与通信网容量的矛盾日益突出,极大地制约了图像通信的发展,已经成为图像通信领域中的“瓶颈”问题。为了解决数字图像数据量巨大的问题,必需对图像数据进行有效地压缩。因此,数字图像压缩编码,已经成为现代信息社会中一个研究的热点问题。1.2 图像数据压缩的必要性长期以来,人类获取到的信息其80来源于图像媒体,15来源于语音。所以,人们在自然界感受到的最主要的信息是视觉信息,这说明图像是人们生活中信息交流最为重要的载体也是蕴含信息量最大的媒体。但与此不同,在早期的计算机和通信领域,能够处理和传输的主要是文字和声音,因此,早期的计算机和通信设备的处理能力跟人类的需求有很大的差距。随着通信信道及计算机容量和速度的提高,图像信息已经成为通信和计算机系统的一种重要的处理对象。 与文字信息不同,图像信息需要大的存储容量和宽的传输信道,尤其是在需要实现大规模图像数据库或传输高分辨率实时图像序列的场合。正因为这一点,图像也给人们的信息交流(传输)、信息的保留(存储)带来很大的困难。特别是数字化地球的今天和未来,这一问题尤为突出。但是,由于信息社会的到来人类追求高质量的信息通信,采用数 字化信息是必经之路。这是因为数字化信息具有如下特点: (1)易交换,畅通无阻,无处不达; (2)高容量以惊人的传输速度满足人们的信息需求; (3)高分辨率,信息质量优化; (4)高稳定性。传输途中不易受干扰,能原原本本地还它本来面目等。图像数字化后计算机面临的最大难题之一是海量数据的存储与传送问题。 1.3 图像数据压缩的可能性经研究发现,与音频数据一样,图像数据中存在着大量的冗余,原因在于原始图像数据是高度相关的。通过去除那些冗余数据可以节约文件所占的码字从而极大地降低原始图像数据量,解决图像数据量巨大的问题,达到数据压缩的目的。图像之所以能够进行压缩有以下几个方面的原因: (1)原始图像数据是高度相关的,存在很大的数据冗余。如种信源编码,其信源是各种类型的图像信息。图像恢复的过程叫图像内相邻像素之间的空间冗余度、系列图像前后帧之间的时做解码,根据解码后的数据与原始数据是否一致,图像压缩方法间冗余度、多光谱遥感图像各频谱间的频率域冗余度等,它们造成了大量的比特数浪费,消除这些冗余就可以节约码字,大大减少数据量,达到数据压缩的目的。(2)信源符号出现的概率不同,若用相同码长表示不同出现概率的符号,就会造成符号冗余度。如果采用可变长编码技术,对出现概率高的符号用短码字,对出现概率低的符号用长码字表示,就可以消除符号冗余度,从而节约码字。(3)人眼具有视觉冗余,允许图像编码有一定的失真。人类视觉系统是有缺陷的,人眼对于某些失真不敏感难以察觉。在许多场合中,并不要求经压缩及复原以后的图像和原始图像完全相同,可以允许有少量的失真,只要这些失真并不被人眼所察觉即可。这就为压缩比的提高提供了十分有利的条件,这种有失真的编码称为限失真编码。在多数应用中,人眼往往是图像信息的最终接受者,图像编码方法如果能充分利用人眼的视觉特性,就可以在保证复原图像主观质量较好的前提下取得较高的压缩比。(4)还可以利用先验知识来实现图像编码,降低知识冗余度。例如,在可视电话中,编码对象可为人的头和肩等,这时可利用对编码对象的先验知识为编码对象建立模型,通过提取模型参数,对参数进行编码而不对图像直接进行编码,可以达到非常高的压缩比。图像数据压缩技术就是研究如何利用图像数据的冗余性来减少图像数据量的方法。因此,进行图像压缩研究的起点是研究图像数据的冗余性。1.4 图像压缩技术研究的起源与发展图像压缩的研究起源于 20世纪 40年代。1948年,Oliver首先提出了电视信号的线性PCM理论,开辟了图像压缩理论的先河。随后,1958年Graham采用计算机模拟试验的方法,提出了静止图像压缩的前值预测编码法,该方法能获得约4bits/pix的图像质量。70年代A.Habibit进行了帧间预测编码的研究,并在80年代初针对运动补偿 (MC)所用的运动估值 (ME)进行了研究。这些早期的预测编码方法都是对象素为处理单元,其理论是线性预测理论。这些预测理论的思想至今仍被广泛应用,但由于预测编码的最小方差不能反映人的视觉特性及它的压缩比的限制,导致其在90年代开始被编码效率更高的变化编码所取代。1968年H.C.Andrews等人提出了变换编码的概念,采用的是二维离散傅立叶变换。此后相继出现了用其它变换方法的变换编码,其理论基础是把图像看成广义平稳随机场,用线性变换去实现相关,如 K-L变换,DCT变换等。其实现方法均是通过正交变换把图像从相关性很强的空间域变换到相关性很弱的频域,再保留方差较大的变换系数,忽略方差较小的变换系数,从而实现图像压缩。1990年通过的ITU-T&H.261建议,是图像编码技术走向实用化的重要一步它是图像编码40年研究结果的结晶。90年代初相继提出的MPEG-1, MPEG-2,H.263等等都是在 H.261的基础上发展和改进的。这些国际建议普遍采用的混合编码技术是当今最实用的高效编码方法,得到了广泛的推广应用,已成为当今图像编码方法的主流。但基于线性方法 (预测法和分块DCT相结合)的H.261 /MPEG的核心算法既不能有效的反映图像的固有统计特性,也不能有效的反映人们的视觉特性,这两方面还有待理论上的突破。因此,随后人们针对这两方面的不足进行了深入的分析和研究提出了许多新的理论和方法。 目前已提出和正在进行研究的图像编码方法列举如下: 1小波变换图像编码。 2利用人工神经网络的压缩编码。 3利用分形集合的图像编码 (IFS编码)。4利用数学形态学的图像编码等。第二章 数字图像压缩的原理2.1 数字图像的压缩概述图像压缩是数据压缩编码中的一种。所谓数据压缩就是以尽量少的数据表示尽量多的信息,如果经压缩处理后的数据所表示的信息丝毫不发生变化,则称为无损压缩,比如对文字或数字的压缩。无损压缩虽然精确地保存了数据,但压缩效率很低。随着多媒体及网络通信的应用日益广泛,要求计算机能实时传送和播放图像。在这些场合,对压缩算法精确性的要求不是那么苛刻。相反,由于信道及存储资源的限制,压缩效率则成了关键问题。因此必须采用压缩效率高的有损压缩技术对图像进行压缩。由于数字图像像素之间存在着相关性,即存在冗余,这就为图像压缩提供了可能. 所谓压缩,其实就是考虑一种实现方法,能够去除掉整个图像数据中无关的或者是重复的数据 (即冗余量),最终用较少的信息量就可表达出原图像。图像能够进行压缩的依据主要是图像数据中存在冗余,如式2-1表示: (2-1)其中I, D,分别为信息量,数据量与冗余量。2.2 图像压缩的基本原理图像压缩编码的主要任务是去掉各种冗余和不相干的信息,保留有用的信息,将一个大的数据文件转换成较小的文件,以尽量少的比特数来表征图像,同时保持复原图像的质量,使它符合预定应用场合的需求。压缩数据量和提高有效性是图像压缩编码的首要目的。通常把图像压缩编码简称为图像编码,它是一种信源编码,其信源是各种类型的图像信息。图像恢复的过程叫做解码,根据解码后的数据与原始数据是否一致,图像压缩方法可以分为无损压缩编码和有损压缩编码。2.2.1 信息论基础1948年,Shannon发表了通信的数学原理,应用概率论对信息作了定量的描述。作为Shannon信息论的研究对象-信息,被假设为由一系列的随机变量所代表,它们往往用随机出现的符号来表示。我们称输出这些符号集的源为“信源”。由信源输出的随机符号,如果其取值于某一连续区间,就称为连续信源;如果取值于某一离散集合,就叫离散信源。我们研究的是数字化系统,均为离散信源,本文讨论的数字图像为离散空间函数。自信息量和一阶熵:记字符,出现的概率为,那么按概率的公理化定义必须有 ;(j=1,2,3m); (2-2)则Shannon信息论把字符出现的自信息量定义为: (2-3)式中的符号可以保证其为正值。在计算机科学系统中,通常对对数的底取2,单位为比特 (bit), 亦称为自信息函数,其含义是:随机变量X取值为a,时所携带的信息的度量。我们把信息量的概率平均值,即随机变量的数学期望,叫做信息熵或者简称熵(Entropy),记为 (2-4)单位为比特/字符,通常也称为一阶熵,它代表每个字符所给出的平均信息量。于是,H(X)就是离散信源进行无失真编码的基本极限(不经映射变换,只作熵编码)。2.2.2 图像的基本压缩方式图像压缩的基本方法主要有以下两种:概率匹配和条件概率。2.2.2.1 压缩基本方法之一 -概率匹配如果对字符码的编码长度为,则显然,也是一个非负的随机变量,不妨记做: () (2-5)那么对信源.编码的平均码长就是 (2-6)而信息论中已 经证明熵具有极值性,即 (2-7)其中等号仅在=时成立·这就告诉我们,对于离散无记忆源,必须准确得到字符集率,对各字符的编码长度都达到它的自信息量。在式中,若令=1/m,便得到最大离散熵定理,所有概率分布P;所构成的熵,以等概率时为最大。即: ;在数字化系统中,通常使。若各字符以等概率出现,则,则,此时可以说,R的二进制码字包含有R bit的自信息量。对256级灰度图像,样本数目为256,最大熵为8bit/字符,如果各字符以非等概率出现,就减少。因此,最大值与熵之间的差值,就是信源X所含有的冗余度(Redundancy),即 (2-8)由此可见,离散无记忆信源的冗余度隐含在信源字符的非等概率分布之中。只要信源不是等概率分布的,就存在着数据压缩的可能性。在数据压缩技术中,一般将压缩前每个信源字符的编码位数 ()与压缩后每个字符的编码位数(l)之比,定义为数据压缩比(CR:Compression Ratio) (2-9)也可以使用CR的倒数来衡量压缩效果,称为压缩率。2.2.2.2 压缩基本方法之二- 条件概率若信源x的各分量不是相互独立的,就称为有记忆信源,实际上信源大多是这种信源。在遮掩的一个信号序列中,任意字符的出现总是要附带的接触前面的或后面字符的若干不确定性,即各字符是相关的,要用条件概率和条件熵的方法来处理。而且字符间的相关性越强,对前面的字符知道的越多,下一个字符的信息量越小.因此对于离散有记忆信源,可以利用条件概率进行编码,减少信源的极限熵.2.3 图像压缩系统概述及压缩系统评价2.3.1 图像压缩系统的组成一个图像压缩系统包括两个不同的结构块:一个编码器和一个解码器。编码器又包括一个信源编码器和一个信道编码器,同样解码器包括了一个信道解码器和一个信源解码器。编码器和解码器都是彼此相关的函数或子块。图2-1表示了一个一般的图像压缩系统模型框图。图2-1 一般图像压缩系统模型2.3.1.1 信源编码器和信源解码器信源编码器的任务是减少或消除输入图像中的冗余。它包含以下三部分 (量化器不是必须的): 图2-2表示了信源编码器和信源解码器的模型。图2-2 (a)信源编码甜和(b)信源解码器(1)转换器:它的作用是将输入数据转换为可以减少输入图像中象素间冗余的格式。这部分操作通常是可逆的。(2)量化器:它的作用是将转换程序的输出精度调到与预设的保真度准则相一致。该操作是不可逆的,如果要进行无损压缩时,必须略去这一步。(3)符号编码器:它生成一个固定的或可变长编码用于表示量化器输出并将输出转化为与编码相一致。它是可逆的操作。信源解码器仅包含两部分:一个符号解码器和一个反向转换器。因为量化过程会导致不可逆的信息损失,故反向量化器不包含在信源解码器模型中。2.3.1.2 信道编码器和解码器信道编码器和解码器通过信源编码数据中插入预置的冗余数据来减少信道噪声的影响。汉明(Hamming)编码是一种有效的信道编码技术。2.3.2 图像压缩系统评价图像压缩系统的性能评价分为主、客观评价.2.3.2.1 主观评价采用平均判分MOS(Mean Option Score)或多维计分等方法进行测试,所评价出的图像质量不仅与图像本身特征有关,也与观察者特性以及观察者的环境条件有关。观察者将复原图像与原图像相对比,比较损伤程度,可参照表1给评定的图像打上一定的质量等级,最后用平均的方法得到图像的分数。表1 图像质量主观评价尺度表质量尺度妨碍尺度5.非常好5.丝毫看不出图像质量变坏4.好4.能看出图像质量变坏,但不妨碍观看3.一般3.能清楚的看出图像质量变坏,对观看有妨碍2.差2.对观看有妨碍1.非常差1.非常严重的妨碍观看2.3.2.2 客观评价客观评价的参数有以下几个:的参数有以下几个:(1)编码效率 (2-10) 其中H为信源的熵,, (N代表信源长度,A分别为信源中第k个字符的编码长度和出现概率)为平均码长。(2)冗余度冗余度r可表示为: (3)压缩比:;其中n. L分别为编码前、后每个符号的平均码长,通常为二进制表示的比特数。(4)比特率: (bit/s或b/s)式中为取样频率,R表示对每个取样的幅度值编码的平均码长。己知不变时,I就用R简单表示,一般对静止图像,指每个像素平均所需的比特数,单位为bit;对活动图像,指每秒输入或输出的比特数,单位为Mb/s,Kb/s等。(5)复杂度:复杂度是指为实现编码算法所需的硬件设备,典型的可用算法的运算量及需要的存储量来度量。系统的复杂度由数据压缩算法决定,它既包括编码器的复杂度,也包括解码器的复杂度。一般要求的比特率越低,系统的复杂度越高。(6)时延: 时延过大的算法不能用于实时通信。实际允许的单程通信总时延(编码时延加解码时延)可以小到(像没有回波抑制的电话网),也可以大到约 500ms (比如在甚低码率可视通信中,为了能收到较好的图像不得不容忍较大的通信延迟),但一般控制在200m,以内。(7)信噪比(SNR):给定一幅数字化图像和参考图像.它们之间的相似性通常用均方误差(MSE)和 MSE的各种变形表示。当图像大小为M*N时,MSE为: (2-11)还常使用峰值信噪比PSNR (Peak Signal to Noise Ratio)作为质量测度, (2-12)其中二为最大灰度值,对于具有256个灰度级的黑白图像,常取255. PSNR是衡量编码器性能的一个常用指标,但用它来度量主观感觉并不适合。例如,稍有倾斜的图像在感觉上可以接受,但却会导致很低;而当图像中出现窄而亮的水平拖影时,很高但主观感觉很差。如何改进PSNR使其在主观感觉上也有一定意义,一直是数据压缩领域研究的一个重要课题。第三章 数字图像的编码方式3.1 数字图像编码的分类目前常用的数字图像压缩编码可分为两类:一类压缩是可逆的,即从压缩后的数据可以完全恢复原来的图像,信息没有损失,即是冗余压缩法,也称为无损压缩编码;另一类压缩是不可逆的,即从压缩后的数据无法完全恢复原来的图像,信息有一定损失, 即熵压缩法,也称为有损压缩编码。如图3-1所示。图3-1数字图像编码分类3.2 无损数字图像编码方式无损图像是利用数据的统计特性,在无损压缩中,压缩后重建图像其数值等于原图像。虽然无损压缩没有信息丢失,达到理想要求,然而只能实现适量压缩。无损压缩的压缩率一般为2:15:1。典型的无损压缩技术有游程编码、LZW编码、霍夫曼编码和算术编码等。3.2.1 游程编码游程编码(RLC)是对传真图像的标准压缩方法。它的基本理论是对一组从左到右扫描得到的连续的 0或 1游程用它们的长度来编码。这里需要建立确定游程值的协定,常用的方法有:(1)指出每行第一个游程的值;(2)设每行都由白色游程开始。通过用变长码来对游程的长度编码有可能取得更高的压缩比。我们可将黑和白的游程长度分开,并根据它们的统计特性分别用变长码编码例如符号a,是由某个想象中的黑色游程信源产生出来的概率。用类似的方法就可得到白色游程信源熵的估计 Hw。这样图像的游程熵就近似为: (3-1)其中变量和,分别代表白色和黑色游程长度的平均值。3.2.2 LZW编码同RLE类似,它也是对字符编码从而实现压缩。然而与RLE不同的是,它在对文件进行编码的同时,生成了特定的字符序列的表以及它们对应的代码。例如,一个由8位字节组成的文件可以被编成 12位的代码。在这4096个可能的代码中,256个代码代表可能的单个字符 (8位),剩下的3840个代码分配给在压缩过程中数据里出现的字符串。每当表中没有的字符串头一次出现时,它就被原样存起来,同时将分配给它的代码一起保存。之后当这个其再次出现时,只将它的代码存起来。这样就去掉了文件冗余信息,不但字符表在压缩中动态生成的,而且字符串表也不必存在压缩文件中,因为解压缩算法由信息中文件重构它。3.2.3 霍夫曼编码霍夫曼 (Huffman )编码是消除编码冗余最常用的技术,其原理如下:设一个信源的符号是a,通过把两个概率最小的字符组合起来,就得到一个新的信源.它的符号个数为 a-1.假设这个新信源的编码字是己知的,那么可以证明:新信源中还没有组合起来的符号的编码字等于原来信源中对应符号的编码字;而两个组合符号的编码字,可以通过在新信源中组合符号编码后,为0或1得到,因而霍夫曼编码由只有两个符号0和“1”组成的编码。根据以上原理,可以得到如下构造霍夫曼编码的方法: 1.反复组合两个最小概率的符号,得到一个新的简化信源,直到被简化的信源中只有两个符号,分配这两个符号编码为0或“1” 2. 反复的求出最小概率编码字的两个组合符号编码,通过在上一步中求出编码右侧加上0或者1直到找到原来信源。一旦霍夫曼码获得后,编码或者简码都可以用简单的查表方式实现。这种码有三个特点:(1)它是一种块码,因为各个信源符号都被映射成一组固定次序的码符号;(2)它是一种即时码,因为一串码符号中的每个码字都可以不考虑其后的符号解出来;(3)它是一种唯一可解开的码,因为任何符号串都只能以一种方式解。根据这些特点,任何霍夫曼码都可通过从左到右检查各个符号进行解。然而,霍夫曼编码使用整数个二进制位对符号进行编码,实际上这种方法在许多情况下无法得到最优的压缩效果。假设某个字符的出现概率为80%,该字符事实上只需要0.322位编码,但霍夫曼编码一定会为其分配一位0或一位1的编码,整个信息的80%在压缩后都几乎相当于理想长度的3倍左右,压缩效果很不理想,而算术编码可克服这个问题。3.2.4 算术编码算术编码的思想最早由香农提出,当时香农将符号依概率排序,用累积概率的二进制表示作为对符号的编码。之后,经Rosanne. Pasco和Langdon等人的研究,算术编码日臻成熟。1987年,Witten等人发表了一个实用的算术编码器,即CACM87。自此以后,这一技术引来越来越多人的注意,被认为是基于统计的、无损数据压缩效率最高的方法,几乎总强于霍夫曼编码。算术编码是用0,1)间的一个实数间隔来表示符号序列。符号序列越长,间隔越小,表示它的数据位数就越多,每编码符号序列的一个符号,都依该符号出现的概率进一步缩小间隔,而且出现概率大的符号比出现概率小的符号缩小间隔得较少,因此需要在表示它的数据上加入较少的位数。在符号被编码前,间隔为整个区间0,1。每编码一个符号,以分配给该符号的比例将间隔缩小。算术编码的过程实际上就是依据信源符号的出现概率对区间进行分割的过程。下面以一个例子具体说明该过程。假定信源的符号集为: a, e,i,o,u,!,各符号的出现概率和分配的区间见表2.1.需要编码的符号序列为:eaii!。当编码第一个符号时,编码器将区间缩小为分配给符号。的区间0.2,0.5).当编码第二个符号a时,编码器以分配给a的比例(0,0.2),相对于整个区间0,1)将区间0.2,0.5)缩小,得到0.2,0.26).如此进行,直至最后一个符号被编码,我们可得到最终缩小的区间为:0.23354,0.2336),如图3.2所示。解码是编码的逆过程。如果解码器收到的区间为0.23354,0.2336),因为该区间完全落在信源模型分配给符号。的区间内(表5-3),解码器立即可以译出第一个符号为。然后,解码器将区间缩小为0.2,0.5),因为接受到的区间落在符号a的区间0.2,0.26)内,所以可译出第二个符号为a。以此类推可译出所有的码来。 图3-2算术编码流程图显然,无须传输编码区间的两个端点,因为该区间内的任何一个点都能够译出正确的码来。但是,解码时会碰到一个问题:如何判断消息的终点?例如,数据0.0可以表示a, aa, aaa中的任何一个。解决这个问题的办法是在消息的末尾加入一个特殊的表示消息结束的符号EOF,如在上例中的符号!,解码器一遇到该符号就立即停止解码。3.3 有损图像压缩编码方式有损压缩方案,容许图像的质量有所下降,但与无损压缩相比,它的编码比特率有较大的改善,而且重建图像的质量相对于人眼的视觉特性并没有明显的下降。有损图像压缩可以达到几十倍的压缩比。通常有损图像压缩编码方案有变换编码、预测编码和矢量量化编码(VQ)等。3.3.1 失真度理论和有损压缩信息源的编码率性能界限 (即信号源的熵)取决于无损编码的数据。在许多实际情况下,编码后重建图像存在一定程度的失真 (即图像降级)是允许的。在保持某一图像级水平时,对给定的图像信息源编码所需要最小比特率时多大?回答这一问题是信息论中一个分支要解决的问题,即失真度理论所讲的一个基本问题。失真度理论为达到某一高保真度标准的有损压缩建立了一个理论的性能界限。对于广播级的失真度,计量以及信息源的模型,这一理论提供了具有一下性质的失真度方程:1.对于任何级别的失真度D,可以找到一种编码方案,其比特率可以任意接近,其平均失真度可以任意接近D;不可能找到一种编码方案,使得编码比特率比低,而失真度是D或者更好,可以证明,是一个U型的,连续单调下降函数。2.对于具有有限个字符的离散信号源,由图2.2可以看出其典型的失真度特性: (1). 当 D=0时,无失真的值大于或等于信息源的熵。(2)一般来说,比较复杂的编码方案可以较好的刻画信息源的统计特性,因而其性能可以较好的接近R(D)的界限。·· 图3-3 失真度界限和典型编码特性3.2.2 变换编码变换编码的基本思想是把空间域的图像信号转换到变换域。若变换是正交变换,则变换域的能量与空域相等并且熵保持不变。但是变换前后信息能量得到了重新分布。空间域中的像素之间存在很强的相关性,而变换域中能量则主要集中在直流和少数低频的变换系数上,这部分占图像信息的90%。而高频部分的幅值很小或几乎为零。同时变换系数间基本上是统计独立的,相关性较小。因此,可以仅对低频的变换系数进行量化、编码和传输,而对高频部分则不予编码,从而达到图像压缩的目的。实际中一般采用阈值编码法:即事先设定一个闭值,只对大于此阈值的变换系数编码,这样可使图像的某些高频成分得到保留,重建图像时图像品质得到改善。有很多类型的正交变换,如K-L(离散信号的Hoteiling)变离散余弦变换 (DCT)、沃尔什-哈达玛变换和斜变换等。在这些正交变换中,采用均方误差最小准则的K-L变换是最佳变换,但其无快速算法且依赖于信源的统计特性,所以很难进行实时编码。基本变换编码的框图如图3-4所示:图3-4 变化编码流程图3.2.3 预测编码预测编码是数据压缩技术的一个重要分支,其理论基础主要是现代统计学和控制论。图像的相邻像素之间存在着高度的相关性,即原始数据中存在着大量的冗余。去除这些冗余,信号就可以有效的压缩编码。预测技木是最简单和有效的压缩方法。发送者(和接收者)以某个固定的顺序(如由左到右,逐行进行的光栅扫描方式),在己经被传送(接收)的像素的基础上预测当前像素值。假设以表示当前像素值,以闪滚表示其预测值,预测残差。-需要被传送。如果预测相当精确,那么预测残差的分布就集中在零值附近,其零阶熵比原始图像的零阶熵大大降低。图像的像元和邻近像元有很大的相关性,因此可以用某一点的相邻像元预测该点的值,预测误差将有较小的熵。预测编码有线性预测和非线性预测两类。它们可以在一幅图像内进行(帧内预测编码),也可以在多幅图像之间进行(帧间预测编码)。预测编码基于图像数据的空间和时间冗余特性,用相邻的已知像素(或图像块)来预测当前像素(或图像块)的取值,然后再对预测误差进行量化和编码。这些相邻像素(或图像块)可以是同行扫描的,也可以是前几行或前几帧的,相应的预测编码分别称为一维、二维和三维预测,其中一维和二维预测是帧内预测,三维预测是帧间预测。预测编码的关键是在于预测算法的选取,这与图像信号的概率分布有很大关系,实际中常根据大量的统计结果采用简化的概率分布形式来设计最佳的预测器,有时还使用自适应预测器以较好的刻画图像信号的局部特性,提高预测效率。线性预测编码又称为差分脉码调制,即DPCM(Differential Pulse Code Modulation)。帧内预测编码一般采用像素预测形式的DPCM。图3-5为DPCM的编码流程图。DPCM 是一种简单易行的预测编码方法,其优点是算法简单,易于硬件实现,缺点是对信道噪声及误码很敏感.会产生误码扩散,使图像质量大大下降。图3-5 线性预测(DPCM)编码流程图预测器用己经编码的邻近像素来计算的估计与估计值的差值=,用于存储和传输。预测器的预测精度越高,预测偏差越低,压缩比越高。3.2.4 矢量量化编码矢量量化的基本思想是根据Shannon的信息理论,对符号序列在多维空间内进行联合编码,以获得更高的压缩效率。其方法是:将输入图像数据序列分成多个组,每一组有个数据构成一个m维空间中的一个矢量。在m维空间中,将其划分成个区域,每个区域内所有矢量用此区域内的中心矢量代替。对x个量化矢量分别赋一个索引值,则某个索引区内的所有矢量都可以用索引值来表示。编码时只传输或存储该索引值,解码端采用与编码端相同的空间划分方法,则可由此索引值得到对应的量化矢量,因而能有效地对图像数据进行压缩。上述的空间划分称为矢量码书训练。矢量码书是通过大量样本的训练或学习或自组织特征映射神经网络方法,得到一系列的标准图像模式,每一个图像模式就称为码字或码矢,这些码字或码矢合在一起称为码书,码书实际上就是数据库。输入图像块按照一定的方式形成一个输入矢量。编码时用这个输入矢量与码书中的所有码字计算距离,找到距离最近的

    注意事项

    本文(毕业设计(论文)图像压缩方法研究.doc)为本站会员(文库蛋蛋多)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开