基于MATLAB的图像压缩处理技术的研究与实现毕业设计方案论文.doc
基于MATLAB的图像压缩处理技术的研究与实现毕业设计方案论文长沙学院 CHANGSHA UNIVERSITY毕业设计(论文)资料设计(论文)题目: 基于MATLAB的图像压缩处理技 术的研究与实现 系部: 电子与通信工程系 专 业: 通信工程 学 生 姓 名:班 级:指导教师姓名:最终评定成绩目 录第一部分 毕业论文一、毕业论文第二部分 外文资料翻译一、外文资料原文二、外文资料翻译第三部分 过程管理资料一、 毕业设计(论文)课题任务书二、 本科毕业设计(论文)开题报告三、 本科毕业设计(论文)中期报告四、 毕业设计(论文)指导教师评阅表五、 毕业设计(论文)评阅教师评阅表六、 毕业设计(论文)答辩评审表2009 届本科生毕业设计(论文)资料第一部分 毕业论文-(2009 届)本科生毕业论文基于MATLAB的图像压缩处理技术的研究与实现系部: 电子与通信工程系 专 业: 通信工程 学 生 姓 名: 马娟 班 级:05通信2 学号 指导教师姓名: 刘光灿 职称 教授 王路露 职称 助教 最终评定成绩 2009 年 6 月 长沙学院本科生毕业论文基于MATLAB的图像压缩处理技术的研究与实现系 部: 电子与通信工程系 专 业: 通信工程 学 号: 学生姓名: 马娟 指导教师: 刘光灿 教授 王路露 助教2009 年 6月摘 要图像是一种重要的二维信号,由于其数据量很大,在存储和传输的时候要对其进行压缩处理。离散余弦变换是一种新兴的数学工具,基于离散余弦变换的图像压缩技术正受到广泛的关注和研究。图像经过离散余弦变换以后,在时域和频域都具有良好的局部化特性,重建图像中可以克服采用离散余弦变换编码所固有的方块效应,而且与人类视觉特性相一致。论文主要研究了基于MATLAB的图像压缩算法,完成了以下一些工作:介绍了图像压缩的原理和方法,列举了常用的图像压缩的评价标准和技术标准,在理论分析的基础上深刻理解了图像压缩算法。重点研究了离散余弦算法的基本原理和实现步骤,对基于DCT变换的图像压缩技术的算法进行了研究,并用MATLAB进行了算法仿真,同时,利用MATLAB程序形象设计出图形用户界面,形象直观的看到了图像压缩前后的鲜明对比,取得了较为理想的效果。关键词:图像压缩,DCT变换,MATLAB仿真 ABSTRACTImage is important two-dimension signal.Because of the huge data it contains,image must be compressed when it is stored or transported.The discrete cosine transform (DCT) is rising mathematical tool. The technology of image compression based on discrete cosine transform has drawn much attention and has been researched broadly. When a image is transformed by the discrete cosine transform,it has favorable localize characteristic in both time-domain and frequence-region.And in the rebuild image the connatural diamonds affection of the discrete cosine transform can be overcame. Furthermore,the WT is identical to Human Visual System .This paper is mainly about the image compression algorithm based on MATLAB, and complete these work:Introduced the theory and technique of image compression,Enumerated the prevalent image compressional evaluation criteria and technical standards, based on the theoretical analysis I understanding the image compression algorithm profoundly. The paper discusses the basic principles and implementation steps of image DCT transform technique. carries research on the algorithm of image compression based on DCT. At the same time, Then the algorithm is simulated by MATLAB,using MATLAB program designed the graphical user interface vividly. Intuitive image to see the image in sharp contrast to before and after compression,and achieved better results.Keywords: Image compression ,DCT transform ,Simulation by MATLAB目 录摘 要IABSTRACTII第1章 绪论11.1 论文研究背景及意义11.2 图像压缩技术的历史与现状11.3 离散余弦变换及其在图象压缩中的应用21.4 论文研究的主要内容2第2章图像压缩的基本原理42.1 图象压缩评价标准42.1.1 客观标准42.1.2 主观标准52.2 图像压缩技术标准52.3 图像压缩的分类82.4 图像压缩处理技术基本理论92.4.1 图像压缩的基本原理92.4.2 图像压缩的基本模型10第3章 离散余弦变换的MATLAB实现123.1 MATLAB图像处理工具箱123.2 离散余弦变换的定义123.3 离散余弦变换的基本原理与算法133.3.1 离散余弦变换的基本原理133.3.2 离散余弦变换算法153.4 离散余弦算法的实现15第4章 离散余弦变换的界面实现174.1 图形用户界面简介174.2 界面设计的MATLAB实现174.2.1 界面设计总体概述174.2.2 界面设计具体实现18第5章 运行结果显示及分析205.1 离散余弦变换的算法实现205.1 离散余弦变换的界面实现205.5 设计过程中的疑难及改进22结 论23参考文献24附 录25致 谢27第1章 绪论1.1论文研究背景及意义人们在自然界中感受到的最重要的信息就是图像信息,随着多媒体技术和通讯技术的日益发展,图像也成为了信息技术所处理的重要对象。近些年来,图像技术发展十分迅速,这也推动了多媒体娱乐、多媒体通信、数码相机、数码摄像头和高清晰度电视等各类与图片和视频相关的产品的发展。图像信息的数据量非常的大,随着各种成像设备的分辨率的不断提高,单幅图像所包含的数据量也越来越大,大数据量的图像信息会给存储器的存储容量、通信信道的带宽以及计算机的处理速度增加极大的压力。为了解决这个问题,必须对图像进行压缩处理。数字图像压缩编码的目的就是要以尽可能少的比特数来表征图像,同时保持恢复图像的质量,对图像编码和解码算法的研究,己经受到人们越来越多的关注,成为近些年信息技术中的热点。1.2图像压缩技术的历史与现状图像压缩编码技术始于二十世纪四十年代末的电视信号数字化,至今己有将近六十年的历史。在这几十年的时间内,出现了大量的图像压缩方法和理论M.Kunt将图像压缩的编码理论及方法分为两代:传统的压缩编码方法和新型图像编码方法。传统编码技术包括脉码调制、量化法、熵编码、预测编码、变换编码、矢量编码等十余种编码方法。然而随着人们对这些传统编码方法的深入应用,也逐渐发现了这些方法的许多缺点:比如在传统的编码方法中由于正交变换时频局域性很差,变换后的系数失去了对原图像精细结构的描述,从变换图像得不到原图像边缘轮廓等局部信息,因此,在量化编码时无法采用特殊方法;高压缩比时它还导致图像的边缘轮廓模糊显现和出现严重的方块效应;而且人类视觉系统(Humna Visual Sysetm,即HVS)的特性也不易被引入到压缩算法中。这些缺点使得它们不适应于需要较高压缩比的应用场合。80年代中后期,人们结合模式识别、计算机图形学、计算机视觉、神经网络、小波分析和分形几何等理论,开始探索图像信号压缩编码的新途径。同时考虑到人类的视觉心理特性,新型图像压缩编码方法相继提出:M.Kuni于1985年提出基于人眼视觉特性的第二代图像编码技术,1988年M.Barnsley提出基于迭代函数系统的分形图像编码技术,以及90年代初发展起来的基于模型的图像编码方法。其中离散余弦变换不仅是现在研究的热点,而且这方面的编码也取得了一些引人注目的成功。如离散余弦变换技术己经作为联合图像专家组新的图像压缩标准JPEG2000的核心技术1。1.3离散余弦变换及其在图象压缩中的应用离散余弦变换(DCT for Discrete Cosine Transform)是与傅里叶变换相关的一种变换,它类似于离散傅里叶变换(DFT for Discrete Fourier Transform),但是只使用实数。离散余弦变换相当于一个长度大概是它两倍的离散傅里叶变换,这个离散傅里叶变换是对一个实偶函数进行的(因为一个实偶函数的傅里叶变换仍然是一个实偶函数),在有些变形里面需要将输入或者输出的位置移动半个单位。有两个相关的变换,一个是离散正弦变换(DST for Discrete Sine Transform),它相当于一个长度大概是它两倍的实奇函数的离散傅里叶变换;另一个是改进的离散余弦变换(MDCT for Modified Discrete Cosine Transform),它相当于对交叠的数据进行离散余弦变换。离散余弦变换,尤其是它的第二种类型,经常被信号处理和图像处理使用,用于对信号和图像(包括静止图像和运动图像)进行有损数据压缩。这是由于离散余弦变换具有很强的“能量集中”特性:大多数的自然信号(包括声音和图像)的能量都集中在离散余弦变换后的低频部分,而且当信号具有接近马尔科夫过程(Markov processes)的统计特性时,离散余弦变换的去相关性接近于K-L变换(Karhunen-Loève变换它具有最优的去相关性)的性能。例如,在静止图像编码标准JPEG中,在运动图像编码标准JPEG和MPEG的各个标准中都使用了离散余弦变换。在这些标准制中都使用了二维的第二种类型离散余弦变换,并将结果进行量化之后进行熵编码。这时对应第二种类型离散余弦变换中的n通常是8,并用该公式对每个8×8块的每行进行变换,然后每列进行变换,得到的是一个8×8的变换系数矩阵。其中(0,0)位置的元素就是直流分量,矩阵中的其他元素根据其位置表示不同频率的交流分类2。1.4论文研究的主要内容 本文主要研究如何利用MATLAB软件开发一个基于离散余弦算法的图像压缩处理界面,为初学者提供一个图像压缩处理技术的DCT算法演示及模拟开发的Graphical User Interface(图形用户界面)平台,供大家学习并研究图像压缩处理的技术方法。本文的主要内容如下:第一章是绪论部分,介绍了论文的研究背景和意义,并简要介绍了图象压缩技术的历史与现状以及离散余弦变换在图像压缩中的应用,概述了本论文的主要研究工作;第二章介绍了图象压缩技术的基本理论知识,包括图象压缩的评价标准、技术标准及分类,论述了图像压缩的基本原理和基本模型;第三章介绍了离散余弦变换的MATLAB实现,简单介绍了MATLAB的图像处理工具箱,然后介绍了离散余弦变换的基本原理和算法,最后实现了离散余弦变换的图像压缩实现;第四章介绍了离散余弦变换的界面实现,简单介绍了图形用户界面的功能,论述了本设计采用MATLAB程序进行图像压缩界面操作的实现过程;第五章显示了利用离散余弦变换的算法实现和界面实现的运行结果,并概述了在设计过程中的疑难及改进;最后是对全文的总结,提出了需要进一步解决的问题及改进方向。第2章 图像压缩的基本原理数字图像从表面上看可以表达丰富多彩的内容,但实质上可以看作在视觉空间灵敏度范围内对图像进行空间采样的一个个像素组成,每个象素点都可以用一组一维或多维的数字来表示,如nbit的灰度图像的每个象素由02nl之间的某个数值来表示,而真彩色图像的象素值则由红(R),绿(G),蓝(B)三种颜色的值来联合表示。由于图像采集设备的迅速发展,图像的尺寸和分辨率不断提高,导致了图像数据量变得非常大,例如,一幅单色数字卫星遥感图像由10,000×10,000个像素(pixel)组成,如果每个像素的灰度用12bit表示,那么这幅图像就要用1.2GB表示。直接存储和传输如此庞大的数据,不仅要消耗巨大的磁盘空间和网络带宽而且还会极大地增加处理器的负担,因此对图像进行大幅度的数据压缩就显得尤为重要3。2.1图象压缩评价标准对图像进行压缩,不可避免的要引入失真。我们要做的就是在图像信号的最终用户觉察不出或能够忍受这些失真的前提下,进一步提高压缩比,以换取更高的编码效率。这就需要引入一些失真的测度来评估重建图像的质量。重建图像的质量评价标准可分为客观标准和主观标准两种。通过这些标准可以比较各种方法的优劣1。2.1.1客观标准假设原始图像表示A=f(i,j),其中i=l,2,M;j=1,2,N,经压缩解压后的图像为A=f(i,j),i=1,2,M;j=1,2,N,可以用下列指标进行评价:(1)均方误差MSN (2.1)(2)规范化均方误差NMSN (2.2)其中 (3)对数信噪比SNR (2.3) (4)峰值信噪比PSNR (2.4)评价图像压缩效果的另外一个重要指标是压缩比C,它指的是表示原始图像每象素的比特数同压缩后平均每象素的比特数的比值,也常用每象素比特值(bpp)来表示压缩效果。2.1.2主观标准图像的主观质量就是以人作为图像的观察者,对图像的优劣做出主观评价。主观标准采用平均判分MOS(mean opinion score)或多维计分等方法进行测试,即组织一群足够多的实验人员(一般10人以上),通过观察来评定图像的质量,观察者给判定图像打上一定的质量等级比较损伤程度给予图像进行比较等方法,根据不同的质量打上5级、6级或7级的评分制,最后用平均的办法得到图像的分数,这样的评分虽然很花时间,但比较符合实际。表2.1列出了一个5级的主观评价的评分尺度。表2.1图像质量主观评价尺度图像质量评分评价尺度非常好的图像5分丝毫看不出图像质量变坏好的图像4分能看出质量变坏,但不妨碍观看中等的图像3分清楚看出图像质量变坏,稍妨碍观看差的图像2分对观看较有影响非常差的图像1分非常严重的质量变坏,基本不能观看主观评价和客观评价之间有一定联系,但不能完全等同,由于客观评价比较便,很有说服力,故在一般的图像压缩研究中被采用。主观评价很直观,符合人眼的视效果,比较实际,但是打分尺度很难把握,不可避免有人为因素。2.2图像压缩技术标准信息技术的突出特点是互操作性和全球联网。随着全球范围内的信息传输和交换越来越重要,统一的技术标准成为实现全球范围信息传输和交换的关键。统一的国际标准是不同国家地区和厂商的产品能够相互兼容和协调的基础。近些年来,图像编码技术得到了迅速的发展和广泛的应用,并且日臻成熟,其标志就是几个关于图像编码的国际标准的制定,有关图像压缩编码已有的国际标准(或建议)有H.261、H.263、JPEG、JPEG2000、MPEG-l、MPEG-2、MPEG-4等,涉及到二值图像传真、静态图像传输、可视电话、会议电视、VCD、DVD、常规数字电视、高清晰度电视、多媒体可视通信、多媒体视频点播与传输等广泛应用领域。这些标准图像编码算法融合了各种性能优良的传统图像编码方法,是对传统编码技术的总结,代表了目前图像编码的发展水平。各种图像编码的标准实际上都是博采各种方法之所长的优化组合的混合编码系统。有关图像编码的若干国际标准(建议)的名称、主要目标和内容以及应用范围如下4:(1) H.261建议H.261建议是CCITT于1990年7月通过的有关图像(视频)压缩编码的第一个国际标准化建议,其全称为“p×64kbit/s(p=130)视听业务的视频编解码器”。H.261的主要对象是m×64kbit/s和n×354kbit/s两类码率。其应用目标是可视电话和会议电视,其对图像质量的要求不很高。(2) JPEG标准JPEG是ISO和CCITT于1986年成立的联合图像专家组(Joint Photgoparhic Expert Group)的简称。1992年作为静止图像压缩算法的国际标准正式推出。它适用于不同类型不同分辨率要求的彩色和黑白静止图像,有多种编码模式和数据格式。主要应用于彩色产值、静止图像、可视通讯、印刷出版、新闻图片、医学和卫星图像的传输、检索和存储。(3) JPEG2000标准JPEG2000是21世纪的压缩标准,它把JPEG的四种模式(顺序模式、渐进模式、无损模式和分层模式)集成在一个标准中,在编码端以最大的压缩质量和最大的图像分辨率压缩图像,在解码端可以从码流中以任意的图像质量和分辨率解压图像。JPEG2000的主要特征如下:.高压缩率:由于采用离散小波变换,图像可以转换成一系列“小波”,压缩比可比JPEG提高10%30%,而且压缩后的图像显得更加细腻平滑。.JPEG2000提供无损和有损两种压缩方式。.渐进传输:采用JPEG2000格式的图像支持渐进传输。所谓渐进传输就是先传输图像轮廓数据,然后再逐步传输其他数据来不断提高图像质量。.感兴趣区域压缩:可以指定图片上感兴趣的区域(Region of Interest),然后在压缩时对这些区域指定压缩质量,或在恢复时指定某些区域的解压缩要求。.码流的随机访问和处理:这一特征允许用户随机定义感兴趣区域,使得这一区域的图像质量高于其它区域。.容错性。.开放的框架结构。.基于内容的描述。JPEG2000的应用领域包括互联网、彩色传真、打印、扫描、数字摄像、遥感、移动通信、医疗图像和电子商务等。(4) MPEG-1标准MPEG是活动图像专家组Moving Pictuer Experts Group的简称。MPEG-l的全称是ISO/IEC CDIl72,Coding of Moving Picture and Assoeiated Audio for digital storage media at up to 1.5Mbit/s,中文译为“用于数字存储媒体、码率约为1.5Mbit/s的活动图像及其伴音的编码”。它是MPEG专家组的第一阶段成果,1993年正式通过为国际标准。MPEG-1包括系统、视频、音频以及测试和软件实现等。MPEG-1主要面向数字存储媒体,应用于多媒体计算机、教育与训练、演示与咨询服务、创作与娱乐、电子出版物、数字视听系统VCD以及VOD、交互式电视ITV等领域。(5) MPEG-2标准MPEG-2标准的全称是ISO/IEC DIS13818,Generie Coding of Moving Pictures and Assoeiated Audio Information,中文名为“活动图像及其伴音信息的通用编码(标准)”,1993年11月正式推出。MPEG-2包括系统、视频、音频和测试,与MPEG-1后向兼容。MPEG-2的视频编码部分码率为410Mbit/s,图形质量接近演播室质量。MPEG-2在技术、功能、语法结构、选择项、可分级性和应用范围等方面比MPEG-1、H.261有重大改进和发展。因此成为一种从多媒体计算机到家用消费数字音像电子产品、从宽带数字通信到数字视频广播以及HDTV的“通用”共性关键技术。MPEG-2从技术上促进了计算机、广播电视、数字通信三大领域的交汇融合,并发挥出了巨大的作用。(6) H.263建议全称是ITU-T Recommendation H.263,Video Coding of Low Bitrate Communation。它是ITU-TH.324“Terminal for Low Bitrate Multimedia Communation”的主要组成部分。其面向低码率多媒体通信,原来的目标为在PSTN上运行低于64Kbit/s以下码率的新的视频压缩标准。由于低码率下实现多媒体通信在技术上更为困难和复杂,因此H.263采用了多种先进技术以降低码率,提供各种业务,后来又推出了H.263+和H.263+。(7) MPEG-4和MPEG-7MPEG-4的目标是交互式的多媒体应用。其特点有:.基于内容的交互性:基于内容的多媒体数据访问、基于内容的码流操作和编辑。.高效的压缩算法。.自然的与合成的图像编码及其混合编码。.通用的可接入性:包括恶劣环境下强大的抗差错能力,基于内容的可分级。2.3图像压缩的分类图像压缩的效果好与不好,关键要看三样指标:一是压缩比要大,二是压缩算法简单、速度快,三是恢复效果好。数字图像数据量的压缩按照应用不同可分为两大类:无损压缩和有损压缩。无损、冗余压缩:可逆,压缩比较高,信息保持型数据压缩。有损、熵压缩:不可逆,压缩比较低,又分为保真度型数据压缩和特征保持型数据压缩。图像编码也可以按照编码所在数据域主要分为空间域编码和变换域编码两大类,此外还有模型编码、矢量量化编码和神经网络编码等众多方法。下面简要介绍几种压缩编码方法5:(1) 预测编码:根据离散信号之间存在着一定并联性的特点,利用前面的一个或多个信号对下一个信号进行预测,然后对实际值和预测值的差值(预测误差)进行编码。对预测的要求是必须较为准确。预测编码消除的是空间冗余和时间冗余。属于这类编码的主要有DPCM、ADPCM等。(2) 变换编码:先对信号进行某种函数变换,从一种信号(空间)变换到另一种信号(空间),然后再对变换后的信号进行采样编码。变换编码可以消除空间冗余和时间冗余。属于变换编码的有K-L变换、DFT变换、DCT变换、WHT变换等。(3) 统计编码:主要用于对相互独立、无相关性的消息序列构成的无记忆信源进行压缩。它根据消息出现概率的分布特性而进行的压缩编码,宗旨是在消息和码字之间找到明确的一一对应关系,以便在恢复时再现出来。统计编码消除的是信息熵冗余。属于这类编码的有Huffman编码、Shannon-Fano编码、算术编码等。(4) 模型编码:利用模型的方法,对需传输的图像进行参数估测。它消除的是结构冗余和知识冗余。属于这类编码方法的如分形编码等。(5) 其他编码:如行程编码,计算信源符号出现的行程长度,然后将行程长度转换成代码;Lempel-Zel和Welsh编码,查找冗余字符串和将此字符串用较短的符号标记替代的技术,从而达到数据压缩的目的,其压缩率很高。图2.1给出了按数据域划分归类的主要压缩方法6。图像压缩方法空域编码K-L编码编码PCM、DPCM编码矢量量化编码Delta编码子带编码块截断编码行程编码自适应变换域编码基于模型编码其他编码变换域编码帧间编码小波变换编码神经网络编码等值线编码其他变换域编码分形编码图2.1 图像压缩方法的分类2.4图像压缩处理技术基本理论2.4.1图像压缩的基本原理图像数据压缩的目的是在满足一定图像质量的条件下,用尽可能少的比特数来表示原始图像,以提高图像传输的效率和减少图像存储的容量,在信息论中称为信源编码。大类,前者在解码时可以精确地恢复原图像,没有任何损失;后者在解码时只能近似原图像压缩是通过删除图像数据中冗余的或者不必要的部分来减小图像数据量的技术,压缩过程就是编码过程,解压缩过程就是解码过程。压缩技术分为无损压缩和有损压缩两图像,不能无失真地恢复原图像。假设有一个无记忆的信源,它产生的消息为ai,1iN,其出现的概率是已知的,记为P(ai)。则其信息量定义为: (2.5) 由此可见一个消息出现的可能性越小,其信息量就越多,其出现对信息的贡献量越大,反之亦然7。信源的平均信息量称为“熵”(entropy),可以表示为: (2.6)对上式取以2为底的对数时,单位为比特(bits): (2.7)根据香农(Shannon)无噪声编码定理,对于熵为H的信号源,对其进行无失真编码所可能达到的最低比特数为,这里为一任意小的正数,因此可能达到的最大压缩比为: (2.8)其中B是原始图像的平均比特率7。在图像压缩中,压缩比是一个重要的衡量指标。可以定义压缩比为: (2.9)2.4.2图像压缩的基本模型 图像编码包括两个阶段,前一个阶段就是利用预测模型或正交模型对图像信号进行变换;后一个阶段是利用已变换信号的统计特性,对其分配适当的代码来进行编码传输。编码器与解码器的结构分别如图2.2,图2.3所示。原始图像数据DCT变换量化器Huffman编码编码压缩图像数据图2.2 编码器结构压缩图像数据Huffman译码量化器(逆)逆DCT变换重建图像数据图2.3 解码器结构在发送端,输入的原始图像首先经过DCT变换后,其低频分量都集中在左上角,高频分量分布在右下角(DCT变换实际上是空间域的低通滤波器)。由于该低频分量包含了图像的主要信息,而高频分量与之相比就不那么重要了,所以可以忽略高频分量,从而达到压缩的目的。将高频分量去掉就要用到量化,这是产生信息损失的根源。“量化”的主要任务是用有限个离散电平来近似表达已抽取出的信息。在此采用均匀量化,通过改变程序中的量化因子Q的值以得到不同压缩比的图像。Huffman编码时,首先对经DCT变换及量化后的图像收据扫描一遍,计算出各种像素出现的概率;然后按概率的大小指定不同长度的唯一码字,由此得到一张Huffman表。编码后的图像记录的是每个像素的码字,而码字与量化后像素值的对应关系记录在码表中。生成的一维字符矩阵即为实际中要传输的序列,压缩后的图像数据在信道中进行传输。在接收端,接收到的压缩图像数据首先经过Huffman译码,通过搜索已生成的Huffman表,根据码字与量化后像素值的对应关系,搜索出与码字对应的像素值,并转换为二维矩阵。反量化时将以上二维矩阵中的每一个像素值乘以量化因子Q。最后通过DCT反变换得到重建图像8。第3章 离散余弦变换的MATLAB实现3.1 MATLAB图像处理工具箱MATLAB中的基本数据结构是由一组有序的实数或复数元素构成的数组,图像对象的表达采用的是一组有序的灰度或彩色数据元素构成的实值数组。MATLAB中通常用二维数组来存储图像,数组的每一个元素对应于图像的一个像素值。例如,由200行和300列的不同颜色点组成的一幅图像在MATLAB中采用200×300的矩阵存储。MATLAB支持多种类型的图像,而不同类型的图像其存储结构通常是不同的。如RGB图像则需要一个三维数组,3个数据维分别对应于某像素点的红色、绿色和蓝色强度值。由于对图像采用了通用的数据矩阵的表达方式,MATLAB中原有的所有基本矩阵操作都可应用于图像矩阵,例如,我们要查看图像I中某像素点的强度值,可以采用类似的表达方式:I(x,y),它代表了图像I的第x行和第y列的像素值9。MATLAB的图像处理工具箱功能十分强大,支持的图像文件格式丰富,如*.BMP、*.JPEG、*.6IF、*.TIFF、*.PCX、*.HDF、*.XWD、*.PNG等。图像处理工具箱支持四种图像类型,分别为真彩色图像、索引色图像、灰度图像、二值图像,由于有的函数对图像类型有限制,这四种类型可以用工具箱的类型转换函数相互转换。MATLAB提供了15类图像处理函数,涵盖了包括近期研究成果在内的几乎所有的图像处理方法。这些函数按其功能可分为:图像显示;图像文件I/O;几何操作;像素和统计处理;图像分析;图像增强;线性滤波;线性二元滤波设计;图像变换;邻域和块处理;二进制图像操作;区域处理;颜色映像处理;颜色空间变换;图像类型和类型转换10。利用这些图像处理工具箱,并结合其强大的数据处理能力,我们可不必关心图像文件的格式、读写、显示等细节,而把精力集中在算法研究上,大大提高了工作效率。而且,在测试这些算法时既可方便地得到统计数据,同时又可得到直观图。3.2离散余弦变换的定义 DCT变换利用傅立叶变换的性质,采用图像边界褶翻将图像变换为偶函数形式,然后对图像进行二维傅立叶变换,变换后仅包含余弦项,所以称之为离散余弦变换。二维离散余弦变换DCT(Discrete Cosine Transform)的定义为,假设矩阵A的大小为M×N5, 0pM-1,0qN-1其中 (3.1)其中,Bpq称为矩阵A的DCT系数。在MATLAB中,矩阵的下标从1开始而不是从0开始的,所以MATLAB中的矩阵元素A(1,1)和B(1,1)分别对应于上面定义中的值A00和B00,依此类推。DCT是一种可逆变换,离散反余弦变换定义如下: (3.2)上式的含义是任何M×N的矩阵A都可以表示为一系列具有下面形式的函数的和: (3.3) 这些函数称为DCT变换的基函数,这样,Bpq就可以看成是应用于每个基函数的加权11。3.3离散余弦变换的基本原理与算法3.3.1离散余弦变换的基本原理图像的二维离散余弦变换(Discrete Cosine Transform)简称DCT变换是最小均方误差条件下得出的次最佳正交变换,且已获得广泛应用,大多数情况下,DCT用于压缩图像,并成为许多图像编码国际标准的核心,JPEG图像格式的压缩算法采用的就是DCT变换算法。DCT变换的变换核为余弦函数,计算速度较快,有利于图像压缩和其他处理12。JPEG算法被确定为JPEG国际标准,它是国际上彩色、灰度、静止图像的第一个国际标准。在编码过程中,JPEG算法首先将RGB分量转化为亮度分量和色差分量,然后将图像分解为8×8的像素块,对这个8×8输入矩阵全部值的平均数,其余63个系数为交流(AC)系数,