毕业设计(论文)离散余弦变换图象压缩设计.doc
《毕业设计(论文)离散余弦变换图象压缩设计.doc》由会员分享,可在线阅读,更多相关《毕业设计(论文)离散余弦变换图象压缩设计.doc(29页珍藏版)》请在三一办公上搜索。
1、 本科毕业论文院 系: 信息工程学院 专 业: 电子信息科学与技术 班 级: 08电信本(2) 作 者: 指导教师: 完成时间: 年 月 离散余弦变换图像压缩设计学 校:西藏民族学院学 号:专 业 班 级:08级电信本(2)学 生 姓 名: 指 导 教 师: 指导教师单位:西藏民族学院 指导教师职称:讲 师摘要图像压缩技术对于数字图像信息在网络上实现快速传输和实时处理具有重要的意义。本文介绍了当前几种最为重要的图像压缩算法: JPEG2000、分形图像压缩和小波变换图像压缩。其中主要研究了离散余弦变换压缩和小波变换压缩,并对两种压缩的前后数据进行了对比,同时还分析了离散余弦变换压缩和小波变换压
2、缩之间的差异。关键词:图像压缩; JPEG2000; 小波变换图像压缩; 前 言近二十年来,科学技术取得了飞速的发展。由计算机技术所带来的信息革命使人类由工业化的社会进入到了信息化的社会。多媒体技术和Internet互连网技术的广泛应用加速了全球高速公路的建设,基于网络的多媒体数据传输正改变着人类的生活方式。科学实验表明,人类从外界获取的知识之中,有80%以上都是通过视觉感知获取的。眼睛获取的是图象信息,一幅图胜过千言万语,图象信息是人类认识世界及人类自身的重要源泉。图象压缩就是在没有明显失真的前提下,将图象的位图信息转变成另外一种能将数据量缩减的表达形式。首先,尽管图象中数据量很大,但数据之
3、间不是完全独立的,图象中存在着各种各样的相关性或冗余信息。即一部分数据可以由另一部分数据完全推算出来。其次,大部分图象视频信号的最终接收者都是人眼,而人类的视觉系统是一种高度复杂的系统,它能从极为杂乱的图象中抽象出有意义的信息,并以非常精练的形式反映给大脑。人眼对图象中的不同部分的敏感程度是不同的,如果去除图象中对人眼不敏感或意义不大的部分,对图象的主观质量是不会有很大影响的。本文主要是利用离散余弦变换压缩和小波变换压缩对图像进行压缩,并对比了图像压缩前后的数据,同时也对比了离散余弦变换压缩和小波变换压缩之间的差异。并得出了自己对两种不同压缩的看法。目录第一章 绪论11图像压缩技术的发展现状基
4、于分形的方法是近几年来引起关注和争议的一种图像压缩方法。对图像压缩而言,分形主要是利用自相似的特点,通过迭代函数系统来实现压缩。利用分形特征对图像进行描述和处理是很自然的。分形能取得更好的图像质量,当然在较低压缩比的情况下,JPEG是更好的选择。分形压缩方法计算量比较大,时间开销长,因此加快分形压缩方法的速度是当前研究的热点之一。 小波变换(Wavelet Transform)在频率精度方面稍差一些,但在时间的分析能力上更好一些,而且可以对时间和频率同时进行分解,这是传统傅立叶变换所做不到的。小波变换已经开始应用到图像数据压缩等领域,主要是采用离散小波变换。在某些情况下,小波变换更优于DCT等
5、其他正交变换。 利用人工神经网络(Artificial Neural Network,ANN)进行图像压缩是这个领域近几年的又一研究热点,并且取得了积极的进展。这是一种与视觉系统知识紧密相关的压缩方法。ANN并分布的联结机制与人的视觉系统有某些相似之处,利用此原理及其改进的方法进行图像压缩可获得较好的效果。 视频压缩标准,从最初的H261发展到现在盛行的MPEG-4,一直在不断发展,而1997年7月诞生了MPEG7,其标题为“多媒体内容描述接口”,编号为ISOIECl5938。严格地说,MPEG7不是一个压缩标准,它的主要目标是对多媒体的信息内容采用各种标准化的描述,以便进行有效的查询和检索。
6、它可独立于其它MPEG标准使用,也可用来增强其它MPEG标准的功能。MPEG-7的应用范围很广泛,既可应用于存储(在线或离线),也可用于流式应用(如广播、将模型加入等)。它将在数字图书馆(如图像目录、音乐字典)、多媒体名录服务(如网页)、广播媒体选择(如无线电信道、TV信道)、多媒体编辑(个人电子新闻业务,媒体写作)等领域发挥重要作用。 MPEG-21于2000年5月开始,其标题为“多媒体框架”(Multimedia Framework),主要目标是提供多媒体所需的不同技术之综合。它将为网络环境下的多媒体资源提供以下功能:内容的创建、复制、分发、使用、表述,知识产权的管理与保护,内容的标识与描
7、述,金融管理,用户秘密,终端与网络资源提取,事件报告等。 由于视频压缩标准在多媒体技术和产业中的特殊地位,世界各地众多的公司、科研机构和院校都投入了大量的人力、物力进行标准的研究,试图占领技术和产业的制高点。目前,在各种视频压缩编码标准中,己注册的专利多以千计,而我国由于在数字图像压缩领域起步较晚,在标准的竞争中处于不利地位。所以我们现今研究的重点是标准的研究。12研究内容和目的本文通过DCT和小波变换为基础的压缩方法,最大限度地减小图像的冗余度,同时分析DCT和小波变换压缩的实验结果,最后比较DCT和小波变换之间的差异并总结对两种不同压缩方法的看法和浅谈一下图像压缩技术发展的趋势。13 论文
8、结构安排全文安排具体如下:第一章 介绍图像压缩技术的发展现状,第二章 图像压缩的理论分析,第三章 介绍离散余弦变换和小波变换压缩的算法和压缩前后数据的分析,第四章 介绍了本次论文的结果分析和比较,第五章 总结了整个毕业论文期间的感受和体会。第二章 图像压缩的理论分析由于图像数据存在着一定的冗余,所以使得数据的压缩成为可能。信息论的创始人香农提出把数据看作是信息和冗余度的组合。所谓冗余度,是由于一副图像的各像素之间存在着很大的相关性,可利用一些编码的方法删去它们,从而达到减少冗余、压缩数据的目的。为了去掉数据中的冗余,常常要考虑信号源的统计特性,或建立信号源的统计模型。21图像压缩的可能性图像可
9、以压缩,是因为图像中存在大量的冗余信息,图像的冗余包括以下几种【1】:(1)空间冗余:像素点之间的相关性。(2)时间冗余:活动图像的两个连续帧之间的冗余。(3)信息熵冗余:单位信息量大于其熵。(4)结构冗余;图像的区域上存在非常强的纹理结构。(5)知识冗余:有固定的结构,如人的头像。(6)视觉冗余:某些图像的失真是人眼不易觉察的。22图像压缩原理去除多余数据。以数学的观点来看,这一过程实际上就是将二维像素阵列变换为一个在统计上无关联的数据集合。图像压缩是指以较少的比特有损或无损地表示原来的像素矩阵的技术,也称图像编码。图像数据之所以能被压缩,就是因为数据中存在着冗余。图像数据的冗余主要表现为:
10、图像中相邻像素间的相关性引起的空间冗余;图像序列中不同帧之间存在相关性引起的时间冗余;不同彩色平面或频谱带的相关性引起的频谱冗余。数据压缩的目的就是通过去除这些数据冗余来减少表示数据所需的比特数。由于图像数据量的庞大,在存储、传输、处理时非常困难,因此图像数据的压缩就显得非常重要。信息时代带来了“信息爆炸”,使数据量大增,因此,无论传输或存储都需要对数据进行有效的压缩。在遥感技术中,各种航天探测器采用压缩编码技术,将获取的巨大信息送回地面。图像压缩是数据压缩技术在数字图像上的应用,它的目的是减少图像数据中的冗余信息从而用更加高效的格式存储和传输数据。23图像压缩的理论基础图像压缩的理论基础是信
11、息论。从信息论的角度来看,压缩就是去掉信息中的冗余,即保留不确定的信息,去掉确定的信息(可推知的),也就是用一种更接近信息本质的描述来代替原有冗余的描述。这个本质的东西就是信息量(即不确定因素)【2】。信息论之父CEShannon第一次用数学语言阐明了概率与信息冗余度的关系。在1948年发表的论文“通信的数学理论(A Mathematical Theory of Communication)”中,香农指出,任何信息都存在冗余,冗余大小与信息中每个符号(数字、字母或单词)的出现概率或者说不确定性有关。依据信息论,设有一个无记忆的信源A,它产生消息序列a1,i=l,2,N,的概率是已知的,记为P(
12、a1),i=l,2,N,则信息量为: (2.1)可见越是不可能出现的消息,它的出现对信息量的贡献越大。一个消息出现的可能性越小,其信息量就越多;而消息出现的可能性越大,其信息量就越少。信源的平均信息量称为“熵”(entropy),即:上式取以2为底的对数时,单位为比特(bit):熵达到最大的情况出现在信源各符号的出现概率相等时,而信源此时提供最大可能的信源符号平均信息量。 香农信息论可以证明:信源熵是进行无失真编码的理论极限。低于此极限的无失真编码方法是不存在的。而且可以证明,利用像素间的相关性,使用高阶熵一定可以获得更高的压缩比。设K为数字图像第k个码字CK的长度(二进制代码的位数)。其相应
13、出现的概率为PK,则该数字图像所赋于的码字平均长度R为:在一般情况下,编码效率往往用下列简单公式表示:式中H为信源熵,R为平均码字长度。根据信息论中的信源编码理论,可以证明在RH条件下,总可以设计出某种无失真编码方法。当然如果编码结果使R远大于H,表明这种编码方法效率很低,占用比特数太多。第三章 常见无损压缩方法基本原理图像编码与压缩从本质上来说是对要处理的图像源数据按一定的规则进行变换和组合,从而达到以尽可能少的代码(符号)来表示尽可能多的数据信息。压缩通过编码来实现,或者说编码带来压缩的效果。所以,一般把此项处理称之为压缩编码。31图像压缩编码的分类图像压缩编码的方法目前已有多种,其分类方
14、法视出发点不同而有差异。据统计,图像压缩编码方法已多达30一40种。其中常见的分类如:按压缩技术所依据和使用的数学理论和计算方法进行分类,可分为统计编码(Statistical Coding)、预测编码(Predictive Coding)和变换编码(Transform Coding)三大类;按压缩过程的可逆性分为有损压缩(熵压缩Entropy Compression)和无损压缩(冗余度压缩Redundancy Reduction)两类【6】。有损压缩过程是不可逆的,无法完全恢复出原图像,信息有一定的丢失;无损压缩过程是可逆的,也就是说,从压缩后的图像能够完全恢复出原来的图像,信息没有任何丢失
15、。选择哪一类压缩,要折衷考虑,尽管我们希望能够无损压缩,但是通常有损压缩的压缩比比无损压缩的高。32预测编码预测编码(predictive coding)主要是减少了数据在时间和空间上的相关性,因而对于时间序列据有着广泛的应用价值。在数字通信系统中,例如语音的分析与合成、图像的编码与解码,预测编码已经得到了广泛的实际应用。预测编码是一种简单而且十分有效的数据压缩方法,广泛应用于声音,图像等数据的压缩。所谓预测,就是根据已经出现的数据样本对将要出现的下一个数据的大小做出估计。由于声音、图像等数据具有严格平滑连续性,相邻采样点间数值变化往往不大,因此借助前面的若干个数据样本往往可以较准确地预测出当
16、前样本的数值,预测的误差一般都很小,如果我们不是直接对原始数据进行编码,而是先做预测,然后仅对较小的预测误差进行编码,这样就可以减少码长,达到压缩效果,这就是预测编码的基本思想7。3.2.1预测编码系统框图一个基本的预测编码系统示于图3-1【8】。原始数据送入编码单元,与预测器输出的估值相减,得到预测误差值,经编码器编码(如啥夫曼编码)后形成码流进行传输和存储。解码是首先恢复出预测误差值,再和用与编码器相同的预测器计算出的预测值相加,从而恢复出原始数据。 图3-1基本预测编码解码系统例如有一组数200,201,203,202,204,204,假设我们用前一个数据来预测后一个数据,预测编码的工作
17、过程示于图3-2。预测误差,即原始数据真值与预测值之差分别为l,2,1,2,O,。 图3-2预测编码原理示意图如果采用二进制对原始数据编码,每个数据都需要8比特。预测编码不是对原始数据编码,而是对预测误差编码。由于预测误差动态范围大大缩小,因此只用3比特就可以了,这就减少了码长,达到了压缩的目的。预测编码系统图像按行扫描进行编码。在扫到某一像素前,可以用此像素前面的一些像素值对其进行预测估计,然后与实际像素值进行比较。即用实际值减去预测估计值得到差值信号,再将此差值信号量化、编码和传输。在接收端则用量化的差值信号重建图像信号。预测编码最简单的形式是M调制系统。3.2.2增量调制增量调制也称调制
18、【9】(delta modulation,DM),它是一种预测编码技术,是PCM编码的一种变形。PCM是对每个采样信号的整个幅度进行量化编码,因此它具有对任意波形进行编码的能力。DM是对实际的采样信号与预测的采样信号之差的极性进行编码,将极性变成“O”和“1”这两种可能的取值之一。如果实际的采样信号与预测的采样信号之差的极性为“正”,则用“1”表示;相反则用“O”表示,或者相反。由于DM编码只需用l位码对信号进行编码,所以DM编码系统又称为“1位系统”。DM编码基本原理框图如图3-3所示,其中上图为编码原理框图,下图为译码原理框图。DM编码器包括比较器、本地译码器和脉冲形成器三个部分。接收端译
19、码器比较简单,它只有一个与编码器中的本地译码一样的译码器及一个视频带宽的低通滤波器。图3-3 DM编码、译码原理图DM编码器实际上就是1 bit编码的预测编码器。它用一位码字来表示e(t), (3.1)式中为输入信号,是的预测值。当差值为一个正的增量时用“1”码来表示,当差值为一个负的增量时用“0”码来表示。在收端,当译码器收到“1” 时,信号则产生一个正跳变,收到“O”时,则信号电压产生一个负的跳变,由此即可实现译码。DM波形编码的原理如图3.4所示。纵坐标表示“模拟信号输入幅度”,横坐标表示“编码输出”。用i表示采样点的位置,xi表示在i点的编码输出。输入信号的实际值用yi表示,输入信号的
20、预测值用yi+1=yi表示。假设采用均匀量化,量阶的大小为,在开始位置的输入信号y0=0,预测值y0=0,编码输出x0=l。现在让我们看几个采样点的输出。在采样点i=l处,预测值y1=,由于实际输入信号大于预测值,因此x1=l;在采样点i=4处,预测值y4=4,同样由于实际输入信号大于预测值,因此x4=1;其他情况依此类推。 从图3-4中可以看到,在开始阶段增量调制器的输出不能保持跟踪输入信号的快速变化,这种现象就称为增量调制器的“斜率过载”(slope overload)。一般来说,当输入信号的变化速度超过反馈回路输出信号的最大变化速度时,就会出现斜率过载。之所以会出现这种现象,主要是反馈回
21、路输出信号的最大变化速率受到量化阶大小的限制,因为量化阶的大小是固定的。从图3-4中还可以看到,在输入信号缓慢变化部分,即输入信号与预测信号的差值接近零的区域,增量调制器的输出出现随机交变的“0”和“l”。这种现象称为增量调制器的粒状噪声(granular noise),即一般量化噪声,这种噪声是不可能消除的。图3-4 DM波形编码示意图在输入信号变化快的区域,斜率过载是关心的焦点,而在输入信号变化慢的区域,关心的焦点是粒状噪声。为了尽可能避免出现斜率过载,就要加大量化阶,但这样做又会加大粒状噪声;相反,如果要减小粒状噪声,就要减小量化阶,这又会使斜率过载更加严重。DM最普通的译码器就是一个R
22、C积分电路。利用RC的充、放电即可实现译码。33常见压缩方法香农的率失真理论奠定了信源编码的理论基础。以此理论为依据可以得到数据压缩的两种基本途径:一是改变了信源的概率分布,使其尽可能地非均匀,再用最佳编码方法使平均码长逼近信源熵;二是信源的冗余度寓于信源符号间的相关性之中,去除它们之间的相关性,使之成为或近似成为不相干信源。图像压缩编码有几十种之多,并且涉及到很深的数学理论和推导,在此只介绍几种方法。3.3.1 JPEG2000与JPEG的区别JPEG是联合图像专家组(Joint Photographic Experts Group)的缩写。“jpg ” 、“ j p e g ” 是其最常用
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 毕业设计 论文 离散 余弦 变换 图象 压缩 设计
链接地址:https://www.31ppt.com/p-3984375.html