数字图像处理其中的第4部分学习使用.ppt
《数字图像处理其中的第4部分学习使用.ppt》由会员分享,可在线阅读,更多相关《数字图像处理其中的第4部分学习使用.ppt(79页珍藏版)》请在三一办公上搜索。
1、第4章 数字图像处理,本PPT来源网络,给我学习帮助很大。,学习目标,了解图象的表示掌握图像数据压缩编码常用算法的基本原理了解常用图形、图像文件的基本格式及特点理解静态图像压缩标准JPEG的工作原理和实现技术了解图像信息获取的基本原理和方法掌握用Photoshop处理图像的基本方法,学习内容,第1节 图像处理概述第2节 数字图象第3节 静态图象压缩标准与图像文件格式 第4节 图像的获取技术第5节 图像处理软件,第3节 静态图象压缩标准与图像文件格式,JPEG简介静止图像编码国际标准JPEGJPEG2000图像压缩标准图形和图像文件格式,JPEG简介,JPEG(Joint Photographi
2、c Experts Group)是联合图像专家小组的英文缩写,这个专家组开发的算法称为JPEG算法,并且成为国际上的彩色、灰度、静止图像的第一个国际标准,因此又称为JPEG标准。JPEG是一个适用范围很广的静态图象数据压缩标准,既可用于灰度图象又可用于彩色图象。目前JPEG专家组开发了两种基本的压缩算法:采用以离散余弦变换DCT为基础的有损压缩算法;采用以预测技术为基础的无损压缩算法。使用有损压缩算法时,在压缩比为25:1的情况下,压缩后还原得到的图象与原始图象相比较,非图象专家难于找出它们之间的区别,因此得到了广泛的应用。JPEG算法与彩色空间无关。JPEG算法处理的彩色图像是单独的彩色分量
3、图像,因此它可以压缩来自不同彩色空间的数据,如RGB、YCbCr和CMYK。,JPEG压缩是有损压缩,它利用了人的视角系统的特性,使用量化和无损压缩编码相结合来去掉视角的冗余信息和数据本身的冗余信息。,(1)使用正向离散余弦变换(FDCT)。(2)使用加权函数对DCT系数进行量化。(3)使用哈夫曼可变字长编码器对量化系数进行编码。,静止图像编码国际标准JPEG,1)JPEG基本系统2)FDCT和IDCT3)量化与反量化4)对量化系数的处理和组织5)编码6)应用举例,1)JPEG基本系统以8*8的图像块为基本单位进行编码;将RGB转换为亮度-色调-饱和度系统,并重新采样;,压缩编码过程,解压缩编
4、码过程,YIQ(NTSC制)与YUV(PAL制)Y:指颜色的明视度、亮度、灰度值;I或U:指色调;Q或V:指饱和度。Y=0.299R+0.587G+0.114BQ=0.211R-0.523G+0.312BU=0.148R-0.289G+0.473B,JPEG编码思想,思想:人对亮度比对色彩敏感,在光线不足的情况下,所观察物体都是黑白的。因此可以对色调和饱和度做粗略处理。方法:对8*8图像块矩阵,Y成分数据不变,U每2*2个数据求平均,V每2*1个数据求平均。称为YUV421系统。除此,还有YUV422,411,420等系统.,2)FDCT与IDCT思想:人眼对低频数据比对高频数据敏感。FDCT
5、 为前向离散余弦变换,JPEG标准不规定FDCT和IDCT的算法。方法:,(1)首先把一幅图像划分成一系列的图像块,每个图像块包含88个像素。如果原始图像有640480个像素,则图片将包含80列60行的方块。如果图像只包含灰度,那么每个像素用一个8比特的数字表示。因此可以把每个图像块表示成一个8行8列的二维数组。数组的元素是0255的8比特整数。离散余弦变换就是作用在这个数组上。,(2)如果图像是彩色的,那么每个像素可以用24比特、相当于三个8位比特的组合来表示。因此,可以用三个8行8列的二维数组表示这个88的像素方块。每一个数组表示其中一个八位比特组合的像素值。离散余弦变换作用于每个数组。,
6、DCT变换是做什么的?,简单的说,是用一个8行8列的二维数组产生另一个同样包含8行8列二维数组的函数,也就是说,把一个数组通过一个变换,变成另一个数组。如图下图所示,对每个图像块做离散余弦变换。通过DCT变换可以把能量集中在矩阵左上角少数几个系数上。,f(i,j)经DCT变换之后得到F(i,j),其中F(0,0)是直流系数,称为DC系数,其他为交流系数,称为AC系数。,2023/10/14,13,假设离散余弦变换的数组如下:,3)量化与反量化思想:将每个DCT系数除以各自量化步长并四舍五入后取整,得到量化系数。JPEG系统分别规定了亮度分量和色度分量的量化表,显然色度分量相应的量化步长比亮度分
7、量大。,为了达到压缩数据的目的,DCT系数需做量化。量化是对经过FDCT变换后的频率系数进行量化,这是一个多到一映射的过程。量化的目的是减小非0系数的幅度以及增加0值系数的数目,在一定的主观保真的前提下,丢掉那些对视觉效果影响不大的信息,量化是图像质量下降的最主要原因。,4)对量化系数的处理和组织思想:JPEG采用定长和变长相结合的编码方法。直流系数:通常相邻8*8图像块的DC分量很接近,因此JPEG对量化后的直流分量采用无失真DPCM编码。通常JPEG要保存所需比特数和实际差值。交流系数:经过量化后,AC分量出现较多的0。JPEG采用对0系数的行程长度编码。而对非0值,则要保存所需数和实际值
8、。,2023/10/14,16,用色度量化表进行量化,也就是用数组F中的各元素分别除以量化数组中的相应元素。,2023/10/14,17,以上是编码时对图像块的正向离散余弦变换和量化过程,解码的时候要进行逆量化和逆向离散余弦变换,并且在逆向离散余弦变换之后,对重构图像中的每个样本数据加了128,最后得到重构图像样本:,5)编码对于直流系数的差值,采用Huffman编码。JPEG标准为亮度和色度分量分别拟定了Huffman码表。对于交流系数的行长,采用Huffamn编码。同样JPEG标准为亮度和色度分量分别拟定了Huffman码表。计算每像素的平均比特称为码率。0.250.50图像质量中等,满足
9、某些应用0.500.75质量好,满足多数应用0.751.50极好,满足大多数应用1.502.0与原始图像质量一样,编码过程,Z字形排序。对于量化后的二维数组,我们还要对其进行线性化,然后再进行压缩加以传输。一个合理的线性化方法可能是一次传输Q的一行。由于出现这么多的0,可以使用行程编码。这是可行的,但还有更好的方法。直流系数的编码。88图像块经过DCT变换之后得到的DC直流系数有两个特点,一是系数的数值比较大,二是相邻88图像块的DC系数值变化不大。根据这个特点,JPEG算法使用了差分脉冲调制编码(DPCM)技术,对相邻图像块之间量化DC系数的差值进行编码,(3)交流系数的编码。量化AC系数的
10、特点是164矢量中包含有许多0系数,并且许多0是连续的,因此可以使用非常简单和直观的游程长度编码(RLE)对它们进行编码。JPEG使用了1个字节的高4位来表示连续0的个数,而使用它的低4位来表示编码下一个非0系数所需要的位数,跟在它后面的是量化AC系数的数值。(4)熵编码。使用熵编码还可以对DPCM编码后的直流DC系数和RLE编码后的交流AC系数作进一步的压缩。在JPEG有损压缩算法中,使用哈夫曼编码器来减少熵。,JPEG编码的最后一个步骤是把各种标记代码和编码后的图像数据组成一帧一帧的数据,这样做的目的是为了便于传输、存储和译码器进行译码,这样组织的数据通常称为JPEG位数据流。,编码比特率
11、与质量因子通常在图像传输时要求固定比特率,JPEG通过设定一个质量控制因子Q,在量化时用该因子与量化表中的量化步长相乘作为实际的量化步长。要求较高比特率时,Q取较小值如0.1;否则取大值。Q与比特流一起传送给解码端。,6)静止图像编码国际标准JPEG应用举例,Lenna图像的一个8*8方块,只举亮度块为例.,每个图像块包含88个像素。原始图像有640480个像素,则图片将包含80列60行的方块。,经过FDCT后的变换系数矩阵,根据亮度量化表量化后得到的量化系数矩阵,假设上一编码块的直流量化系数为77,则直流差值为2。则该图像块编码为,反量化,2023/10/14,27,反变换,压缩率9.2,压
12、缩率18.4,压缩率51.6,JPEG 2000,JPEG静止图像压缩标准,具有中端和高端比特速率上的良好的速率畸变特性,但在低比特率范围内,将会出现很明显的方块效应,其质量变得不可接受。JPEG不能在单一码流中提供有损和无损压缩,并且不能支持大于6464 K的图像压缩。同时,尽管当前的JPEG标准具有重新启动间隔的规定,但当碰到比特差错时图像质量将受到严重的损坏。JPEG 2000是JPEG工作组制定的并于2000年底陆续公布的基于JPEG标准的最新的静止图像压缩编码的国际标准,它之所以比JPEG标准优越,主要是不再采用离散傅立叶变换DCT算法为主的编码方法,改用以DWT(Discrete
13、Wavelet Transformation,离散小波变换算法)为主的多解析编码方法。,它与JPEG的基本系统相比有以下的优点:(1)既支持有损压缩,也支持无损压缩方式。(2)在压缩时,可指定图片感兴趣的区域,并指定压缩质量;在解压缩时,对这些区域指定解压缩顺序及解压缩质量。因为子波在时域及频域上具有局域性,有可能完全恢复或以高分辨率恢复图像的某个局部。(3)在高压缩比下,仍能保持较高的图像质量。在类似质量的前提下,JPEG 2000的压缩比比JPEG高10%30%。,JPEG 2000主要由6个部分组成:第一部分,图像编码系统,它是标准的核心系统。第二部分,扩展系统,在核心系统上添加一些功能
14、。第三部分,运动JPEG 2000,针对运动图像提出的解决方案。第四部分,兼容性。第五部分,参考软件。第六部分,复合图像格式,主要是针对印刷和传真应用。,(4)支持渐进式传输,即开始时显示一个模糊、不清晰且质量低的图像,随着数据进一步被接收,图像清晰度和质量逐步提高,最后显示出一个高清晰度且高质量的图像。JPEG 2000在节约和充分利用有限带宽方面显得更加优越。(5)在有限带宽上进行文件传输时,有很强的纠错能力,在用户指定文件尺寸时,能保证较高的再现图像质量,以致在无线领域得到广泛应用。(6)可对编码流进行随机访问和处理,因为它的块编码是独立的,且编码流具有包裹式结构。(7)使用Alpha通
15、道,以满足图形艺术和Internet的发展和需求;(8)在彩色图像处理方面,JPEG 2000可处理256个通道的信息。,2023/10/14,32,JPEG与JPEG 2000的性能比较,常用图形、图像文件的格式,计算机包含两种类型的图形格式:矢量图(Vector Based Image)和位图(Bit Mapped Image)。矢量图(图形)主要用于工程图、白描图、图例、卡通漫画和三维建模等。位图是直接量化的原始图像信号形式,图像的最小单位是像点,用于表现自然影像。通过软件,矢量图很容易转化为位图,而位图转化为矢量图则需要复杂而庞大的数据处理。,位图与矢量图的不同点:,1)位图的容量一般
16、较大,与图的尺寸和颜色有关;矢量图一般较小,与图的复杂程度有关。2)位图的文件内容是点阵数据;矢量图的文件内容是图形指令。3)位图的显示速度与土的容量有关;矢量图的显示速度与图的复杂程度有关。4)从应用特点看,位图适于“获取”和“复制”,表现力丰富,但编辑较复杂;矢量图易于编辑,适于“绘制”和“创建”,但表现力受限。,2023/10/14,35,文件头的主要内容包括产生或编辑该图像文件的软件信息以及图像本身的参数。文件体主要包括图像数据以及色彩变换查找表或调色板数据。这部分是文件的主体,对文件容量的大小起决定作用。文件尾可包含一些用户信息。,位图文件结构示意,位图的文件结构,BMP图像文件格式
17、,是微软公司为其Windows环境设置的标准图像格式。Windows系统软件中内含了一系列支持BMP图像处理的API函数。非压缩格式是BMP图像文件所采用的一种通用格式。两种压缩方式:如果图像为16色模式,则采用RLE4压缩方式;若图像为256色模式,则采用RLE8压缩方式。可以存储单色、16色、256色以及真彩色4种图像数据。,GIF图像文件格式,是最早由CompuServe公司于1987年制定的标准,主要用于网络图形数据的在线传输和存储。GIF提供了足够的信息并很好地组织了这些信息,使得许多不同的输入输出设备能够方便的交换图像。它最多支持8位(256种颜色),图像的大小最多是64K64K个
18、像点。GIF的特点是LZW压缩、多图像和交错屏幕绘图。,JPEG图像文件格式,JPEG(Joint Photographic Experts Group)图像格式是一种比较复杂的文件结构和编码方式的文件格式。它是用有损压缩方式去除冗余的图像和彩色数据,在获得极高压缩率的同时能展现十分丰富和生动的图像,适用于在Internet上作图像传输。JPEG文件格式具有以下特点:适用性广,大多数图像类型都可以进行JPEG编码;对于数字化照片和表达自然景物的图片,JPEG编码方式具有非常好的处理效果;对于使用计算机绘制的具有明显边界的图形,JPEG编码方式的处理效果不佳。,TIFF图像文件格式,是一种通用的
19、位映射图像文件格式。TIFF文件格式具有以下特点:支持从单色到32位真彩色的所有图像;适用于多种操作平台和多种机器,如PC机和Macintosh机;具有多种数据压缩存储方式等。,PNG图像文件格式,是20世纪90年代中期开发的图像文件格式,其目的是企图替代GIF和TIFF文件格式,同时增加一些GIF文件格式所不具备的特性。PNG用来存储彩色图像时其颜色深度可达48位,存储灰度图像时可达16位,并且还可存储多达16位的Alpha通道数据。PNG文件格式具有以下特点:流式读写性能、加快图像显示的逐次逼近显示方式、使用从LZ77派生的无损压缩算法以及独立于计算机软硬件环境等。,PSD图像文件格式,是
20、Adobe公司的图像处理软件Photoshop的专用格式。PSD其实是Photoshop进行平面设计的一张“草稿图”,它里面包含有各种图层、通道、蒙板等多种设计的样稿,以便于下次打开文件时可以修改上一次的设计。,2023/10/14,42,ZSOFT公司在开发图像处理软件Paint Brush时开发的一种格式,存储格式从1位到24位,它是经过压缩的格式,占用磁盘空间较少。它主要与商业性PC-Paint Brush图像软件一起使用。PCX文件可以分成三类:各种单色PCX文件、不超过16种颜色的PCX文件、具有256颜色的PCX图像文件。由于该格式出现的时间较长,并且具有压缩及全彩色的能力,所以P
21、CX格式现在仍十分流行。,PCX图像文件格式,2023/10/14,43,常见的位图文件格式,常见的矢量图格式,(1)WMF文件格式:是常见的一种图元文件格式,是它具有文件短小、图案造型化的特点,整个图形常由各个独立的组成部分拼接而成,但其图形往往较粗糙。WMF文件的扩展名为.wmf。(2)EMF文件格式:是微软公司开发的一种Windows 32位扩展图元文件格式。其总体目标是要弥补使用WMF的不足,使得图元文件更加易于接受。EMF文件的扩展名为.emf。,2023/10/14,45,(3)EPS文件格式:是用PostScript语言描述的一种ASCII码文件格式,即可以存储矢量图,也可以存储
22、位图,最高能表示32位颜色深度,特别适合PostScript打印机。(4)DXF文件格式:是AutoCAD中的矢量文件格式,它以ASCII码方式存储文件,在表现图形的大小方面十分精确。DXF文件可以被许多软件调用或输出。DXF文件的扩展名为.dxf。,(5)SWF(Shockwave Format)文件格式:是二维动画软件Flash中的矢量动画格式,主要用于Web页面上的动画发布。目前,已成为网上动画的事实标准。SWF文件的扩展名为.swf。,2023/10/14,46,把自然的影像转换成数字化图像的过程叫做“图像获取过程”,图像获取过程的实质是进行模/数(A/D)转换,即通过相应的设备和软件
23、,把作为模拟量的自然影像转换成数字量。图像获取的一个重要途径是使用专用计算机扩展设备,如扫描仪、数码照相机等对图像进行获取。除硬件设备外,还需要设备驱动程序、图像处理工具等软件。图像的处理须通过图像处理软件完成,目前使用最广泛的是专业图像处理软件Photoshop 7.0。,第4节 图像的获取与处理,2023/10/14,47,图像的获取途径主要有两个:(1)利用彩色扫描仪和数码照相机等设备进行模/数转换。对于收集的图像素材,如印刷品、照片以及实物等,使用彩色扫描仪对照片和印刷品进行扫描,经过少许的加工后,即可得到数字图像。使用数码照相机可直接拍摄景物,再传送到计算机中进行处理。(2)从数字图
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字图像 处理 其中 部分 学习 使用
链接地址:https://www.31ppt.com/p-6294524.html