《图像处理技术》课件.ppt
落霞与孤鹜齐飞,秋水共长天一色,落霞与孤鹜齐飞秋水共长天一色,讨论题目,图像处理技术给我们学习、工作和生活带来了哪些好的和不好的变化?,讨论题目 图像处理技术给我们学习、工作和生活,几张搞笑图片,几张搞笑图片,几张搞笑图片,几张搞笑图片,几张搞笑图片,几张搞笑图片,几张搞笑图片,几张搞笑图片,几张搞笑图片,几张搞笑图片,几张搞笑图片,几张搞笑图片,夫妻相,夫妻相,官员悬浮照,官员悬浮照,凤姐+范冰冰,+,=,凤姐+范冰冰+=,华南虎事件,华南虎事件,图像处理技术,第 3 章,3.1 图像原理 3.1.1 图像与图形 3.1.2 图像分辨率 3.1.3 图像颜色与颜色深度3.2 图像文件 3.2.1 图像文件格式 3.2.2 图像文件的体积与保存3.3 图像的获取 3.3.1 获取途径 3.3.2 图像扫描技术,3.3.3 数码拍摄技术3.4 图像处理技术 3.4.1 图像的点处理 3.4.2 图像的组处理 3.4.3 图像的几何处理 3.4.4 图像的帧处理3.5 图像的浏览 3.5.1 图像浏览软件简介 3.5.2 图片浏览界面基本功能 3.5.3 图像文件格式 3.5.4 建立或取消文件关联3.6 图像数据的压缩,图像处理技术第 3 章3.1 图像原理 3.3.3,3.1.1 图像与图形,3.1,图像原理, 图像:直接量化的原始信号形式, 图像的最小单位是像点 用于表现自然影像,3.1.1 图像与图形3.1图像原理 图像:直接量化的原,位图图像,位图图像 图像由基本显示单元“像点”构成图像像点8bit,位图的放大,位图的放大,矢量图的放大,矢量图的放大,矢量图和位图的比较(1),矢量图和位图的比较(1)矢量图位图表达对象的复杂程度适合表,矢量图和位图的比较(2),注意: 随着计算机科学的发展,图形和图像之间的区别越来越模糊,图形与图像的内涵日益接近,以致于在某些情况下,图形和图像两者已融合在一起,无法区分。利用真实感图形绘制技术可以将图形数据变成图像,利用模式识别技术可以从图像数据中提取几何数据,把图像转换成图形。,矢量图和位图的比较(2)矢量图位图应用侧重于“绘制”和“创,图像处理的内容, 图像的数字化,图像的数字化是指将一幅图像通过采样、量化、编码转变成计算机能够接受的数字图像。, 图像编码压缩,数字化后的图像数据量大,需采用编码技术来压缩信息,以便节省图像传输和处理的时间,减少存储容量。常见的压缩编码包括预测编码、变换编码、分形编码、小波变换等。, 图像变换,图像的变换是将空间域的处理转换为变换域的处理,不仅可以减少计算量,而且可获得更有效的处理。图像还变换包括传统的几何变换,例如图像的缩放、旋转、平移、投影等。, 图像恢复技术,图像处理是研究如何通过有关技术修改和解释现有图像。图像处理的研究对象是数字图像,其研究的主要内容包括以下方面。,图像恢复是采用某种滤波方法,如去除噪声、干扰和模糊等,恢复或重建原来的图像。, 图像识别,图像处理的内容 图像的数字化 图像编码压缩 图像,图形处理的内容, 图形的输入,图形的输入研究的是如何开发利用图形输入设备及软件将图形输入到计算机中,以便进行各种处理。, 图形的变换处理,图形的变换处理包括对图形进行变换(如几何变换、投影变换、建模、造型)和运算(如图形的并、交、差运算)处理。, 图形的生成与输出,图形的生成与输出研究的是如何将图形特定的表示形式转换成图形输出系统便于接受的表示形式,并将图形在显示屏或打印机等输出设备上显示输出。,图形处理研究的是如何通过计算机生成、处理和显示图形,其广泛用于计算机辅助设计与制造、计算机艺术、计算机模拟、计算机动画和虚拟现实等领域。,图形处理的内容 图形的输入 图形的变换处理 图, Resolution (分辨率)单位,图像分辨率, dpi的数值越大,图像越清晰,dpi (display pixels / inch)每英寸显示的像点数,300 dpi 96 dpi 21 dpi,3.1.2, Resolution (分辨率)单位图像分辨率 dpi,图像分辨率,3.1.2,A:200dpi,B:50dpi,图像B放大四倍,图像分辨率3.1.2A:200dpi B:50dpi图像B放,分辨率,3.1.2,分辨率是影响图像质量的重要因素,分为屏幕分辨率、图像分辨率、显示器分辨率和像素分辨率。,1屏幕分辨率,屏幕分辨率是指某一种显示方式下,计算机屏幕上最大的显示区域,以水平和垂直的像素表示。,2图像分辨率,图像分辨率指数字化图像的大小,以水平和垂直的像素点表示 。,3显示器分辨率,显示器分辨率指显示器本身所能支持各种显示方式下最大的屏幕分辨率,通常它用像素之间的距离来表示,即点距。,4像素分辨率,像素分辨率指一个像素的宽和长的比例(也称为像素的长宽比),在像素分辨率不同的机器间传输图像时会产生意想不到的畸变。,分辨率3.1.2 分辨率是影响图像质量的重要因素,分为,常见分辨率,常见分辨率 显示器:96 dpi 平板扫描仪:1200,图像颜色与颜色深度,3.1.3,色彩的亮度、色调和饱和度,1亮度,亮度也称为明度,是指彩色所引起的人眼对明暗程度的感觉。它与被观察物体的发光强度有关。对于色调、饱和度固定的光而言,当其全部能量增强时,亮度增加,因此亮度与光功率有关。,2色调,色调也称为色相,指颜色的基本面貌,即人们称呼某种颜色的名称,如红、绿、蓝等。色调与光波的波长有关,不同的波长反映不同的颜色感。色调是人们看到一种或多种波长的光时所产生的综合效果。它反映颜色的种类,是决定颜色的基本特性。,3饱和度,饱和度也称为纯度,指颜色的深浅程度。对于同一色调的彩色光,饱和度越高则颜色越纯。凡是经过混合后所产生的颜色,它的色彩饱和度比未混合的原来的颜色低。饱和度的增减还会影响到颜色的亮度。,图像颜色与颜色深度3.1.3色彩的亮度、色调和饱和度1亮度,图像颜色与颜色深度,3.1.3,色彩模型,色彩模型是指已经建立好的用于描述和重现色彩的各种模型。各个应用领域一般使用不同的色彩模型。常用的色彩模型有HSB、RGB、CMYK以及Lab色彩模型。,windows系统调色板,图像颜色与颜色深度3.1.3色彩模型 色彩模型是指已经,图像颜色与颜色深度,3.1.3,色彩模型,色彩模型是指已经建立好的用于描述和重现色彩的各种模型。各个应用领域一般使用不同的色彩模型。常用的色彩模型有HSB、RGB、CMYK以及Lab色彩模型。,加色法混合方式 减色法混合方式,图像颜色与颜色深度3.1.3色彩模型 色彩模型是指已经,图像颜色与颜色深度,3.1.3,色彩模型,色彩模型是指已经建立好的用于描述和重现色彩的各种模型。各个应用领域一般使用不同的色彩模型。常用的色彩模型有HSB、RGB、CMYK以及Lab色彩模型。,图像颜色与颜色深度3.1.3色彩模型 色彩模型是指已经,图像颜色与颜色深度,3.1.3,色彩模型的相互转换,在一个典型的多媒体计算机系统中,常常涉及到用几种不同的颜色空间表示图形和图像的颜色,以对应于不同的场合和应用,各种颜色空间可以方便地进行转换。,RGB颜色空间可与HSI空间相互转换,HSI颜色空间与RGB颜色空间的转换关系如下:,图像颜色与颜色深度3.1.3色彩模型的相互转换,图像颜色与颜色深度,3.1.3, 与自然界中的影像不同,数字化图像的颜色数量具有准确的数量级, 这是采用一定长度的二进制数描述颜色的缘故。,图像的颜色二值图像 黑白双色(0或1)灰度图像2的8次方=255种黑白变化色彩色图像采用RGB彩色空间(R,G,B)一般写成(0255,0255,0255),图像颜色与颜色深度3.1.3 与自然界中的影像不同,数字化,图像颜色与颜色深度,3.1.3, 与自然界中的影像不同,数字化图像的颜色数量具有准确的数量级, 这是采用一定长度的二进制数描述颜色的缘故。,图像颜色与颜色深度3.1.3 与自然界中的影像不同,数字化,图像文件, 数字化图像以文件的形式存在,其文件名有严格的约定。,3.2,3.2.1 图像文件格式,文件颜色与分辨率用途.GIF256 / 96dpi用于动画、,A4幅面(横)24 bit彩色300 dpi分辨率,图像文件的体积与保存,数据对比,3.2.2,A4幅面(横)图像文件的体积与保存. JPG 88,图像文件的体积与保存,3.2.2,1. PCX格式,2. DIB和BMP格式,3.GIF格式, PCX格式最初由Z-Soft公司为其图像处理软件PC Paintbrush设计的文件格式 。该格式使用游程长编码(RLE)方法进行压缩,压缩比适中,适合于一般软件的使用,压缩和解压缩的速度都比较快。另外,各种扫描仪扫描得到的图像一般都能存成PCX格式。, DIB是Windows 所使用的与设备无关的点位图文件存储格式。 BMP是标准的Windows和OS/2的图像格式的基本位图格式。BMP文件格式存储的图像数据都不能压缩,因此图像文件的大小较大。, GIF(Graphics Interchange Format)格式,译为图形交换格式,用于在不同的平台上进行图像交流和传输。GIF是使用LZW压缩方法的主要图形文件格式,因此,文件压缩比较高,文件较小。,图像文件的体积与保存3.2.21. PCX格式 2. DIB,图像文件的体积与保存,3.2.2,4.TIFF格式,5. JPEG格式,6. PCD格式, TIFF(Tag Image File Format)格式称为标记图像文件格式,支持所有的图形类型,同时被许多图形应用软件(如CorelDraw,PhotoShop等)所支持。TIFF格式文件分为压缩和非压缩两类,非压缩的TIF文件独立于软硬件,但压缩文件要复杂多了,图形文件压缩后,格式改为TIEF格式。, JPEG格式采用的是有损压缩编码格式,文件非常小,而且可以调整压缩比。JPEG文件的显示比较慢,仔细观察图像的边缘可以看出不太明显的失真。适用于要处理大量图像的场合,一般不适合用来存储原始图像。, PCD格式是Kodak公司开发的电子照片文件存储格式,是Photo-CD的专用格式,一般都存储在CD-ROM上,读取PCD文件要用Kodak公司出的专门软件。,图像文件的体积与保存3.2.24.TIFF格式5. JPEG,图像的获取,3.3, 图像获取 把自然影像转换成数字化图像的过程。,图像的获取3.3 图像获取 把自然影像转换成数字化图,图像扫描技术,3.3.2,扫描仪,TWAIN扫描驱动程序,图像扫描技术3.3.2扫描仪TWAIN扫描驱动程序 保证扫,数码拍摄技术,3.3.3, 传统构图, 个性构图,强调个人意愿,画面比例独特,布局大胆且有新意。,讲求均衡,画面比例规则,具有平衡感。, 个性构图(宽), 个性构图(高), 传统构图(黄金分割),数码拍摄技术3.3.3 传统构图 个性构图强调个人意愿,,构图规则,1)画面中的海面、水面、 地平面要水平,不可 倾斜。,构图规则1)画面中的海面、水面、2)画面要简洁,主体要3),构图规则,4)人物与景物的关系要把握好,要人、景兼顾。,人物过小,人物和景物的比例较合适,构图规则4)人物与景物的关系要把握好,要人、景兼顾。人物过,光圈与快门控制, 光圈 2.8 4 5.6 8 11 16 22, 光圈与速度的关系 (1) 速度 曝光量 (2) 光圈 曝光量, 感光度 60 感光速度慢,颗粒小,影像清晰,适于光照条件非常好的场合 100 感光速度中等,颗粒中,影像较清晰,适于白天 400 感光速度快,颗粒较粗,影像一般,适于傍晚、黎明、室内1000 感光速度极快,颗粒粗,影像一般,适于高速运动物体的摄影,光圈与快门控制 若CCD获得的光线不足,将产生“躁点”,,景深控制, 景深是衡量照片纵深清晰度的指标,光圈可控制景深。,景深 深,景深 浅, 光圈越大,景深越浅。 光圈越小,景深越深。,景深控制 景深是衡量照片纵深清晰度的指标,光圈可控制景深,光线运用,为了获得锐度好、光线明亮的数码照片,应在光线比较充足的时候拍摄。在光线不足时拍摄风光,不要打开闪光灯,否则效果不理想。,光线运用为了获得锐度好、光线明亮的数码照片,傍晚和早晨的色,光线运用,自然光 + 辅助光,光线运用自然光 + 辅助光反射光反射光反光伞反光伞反光伞反,图像处理技术,3.4,3.4.1 图像的点处理, 点处理算法 图像基本算法,处理对象是像点。,1亮度调整 对图像的所有像点加上一个常数或减少一个常数,可改变亮度值。2对比度调整 把像点亮度阀值以上的像点增加亮度,阀值以下的像点降低亮度。3亮度反置处理 用最大允许亮度值减去当前亮度值,用其差值作为该像点的新值。,图像处理技术3.43.4.1 图像的点处理 点处理算法,图像的组处理,3.4.2, 组处理算法 处理对象是一组像点,又叫“区处理或块处理”。,图像的组处理3.4.2 组处理算法 处理对象是一组像,图像的几何处理,3.4.3,1图像的放大与缩小 图像放大 把原图像的一个像点演变成若干个像点,使像点数量大 于原图像,像点密度不变,体积增加。 缩小图像 把原图像的多个像点演变成一个像点,细节丢失,像点 数量减少,体积缩小。, 图像整倍数缩放时,不产生畸变失真。非整倍数缩放时, 则用线性差值取代产生的小数,会产生畸变失真。,图像的几何处理3.4.31图像的放大与缩小 图像整倍数缩,图像的帧处理,3.4.4, 图像的帧处理 将一幅以上的图像以某种特定的形式合成在一起, 形成新的图像。,亮度叠加效果,图像的帧处理3.4.4 图像的帧处理 将一幅以上的图,鼠标双击某图像文件名,即可立即启动ACDSee软件的图片显示界面,并显示该图像。,图像的浏览,3.5,3.5.1 图像浏览软件简介, ACDSee 图像浏览软件,鼠标双击某图像文件名,图像的浏览3.53.5.1 图像浏览,基本功能,1) 浏览图片 左侧路径显示栏中选择路经,右侧浏览图像文件。2) 显示图片内容 在浏览界面中双击小图片,即可显示大幅图片。 再次双击大图片,返回小图片浏览状态。3) 转移图片 直接拖曳。4) 复制图片 按下Ctrl健拖曳。5) 文件更名 两次单击图片,更名。6) 删除图片 选中,按Delete键。7) 文件格式转换 鼠标右键单击图片, 选择“工具/转换文件格式”。,基本功能1) 浏览图片 左侧路径显示栏中选择路经,右,图像文件格式,3.5.3,BMP DIB RLEEMFGIFJPG JPEG JPE JIF JFIKDCPCDPCX DCXPICPNGPSDTGATIF TIFFWMF,Windows及OS/2使用的位图增强图元文件256色的压缩文件JPEG压缩文件以及JFIF文件Kodak公司开发的文件保存在CD上的Kodak图片文件Zsoft Publisher软件制作的文件Soft Images的文件Portable网络用图形文件Photoshop制作的带有图层的文件主要用于动画制作的Targa文件主要用于印刷的图像文件Windows系统使用的剪贴画文件,ACDSee支持的常见格式 说 明,图像文件格式3.5.3BMP DIB RLEWindows及,建立或取消文件关联,3.5.4,(2) 选择“图像”等卡片,(4) 单击“确定”按钮, 关联的作用 鼠标双击被关联的对象,自动启动ACDSee软件,并显示对象。,建立或取消文件关联3.5.4(2) 选择“图像”等卡片(3),图像数据的压缩,3.6,3.6.1 图像数据的压缩算法,数字图像压缩的两个基本原理, 数字图像的相关性。, 人的视觉心理特征。,在图像的同一行相邻像素之间、活动图像的相邻帧的对应像素之间往往存在很强的相关性,去除或减少这些相关性,也就去除或减少图像信息中的冗余度,即实现了对数字图像的压缩。,人的视觉对于边缘急剧变化不敏感(视觉掩盖效应),对颜色分辨力弱,利用这些特征可以在相应部分适当降低编码精度,而使人从视觉上并不感觉到图像质量的下降,从而达到对数字图像压缩的目的。,从信息论观点来看,图像作为一个信源,描述信源的数据 是信息量(信源熵)和信息冗余量之和。信息冗余有许多种,如空间冗余、时间冗余、结构冗余、知识冗余、视觉冗余等,数据压缩实质上是减少这些冗余量。从数学上讲,图像可以看作一个多维函数,压缩描述这个函数的数据量实质是减少其相关性。另外在一些情况下,允许图像有一定的失真,而并不妨碍图像的实际应用。,图像数据的压缩3.63.6.1 图像数据的压缩算法 数字图像,图像数据的压缩,3.6,3.6.1 图像数据的压缩算法,1图像数据压缩的可能性,空间冗余,时间冗余,信息熵冗余,结构冗余,知识冗余,视觉冗余,其它冗余,图像数据的压缩3.63.6.1 图像数据的压缩算法 1图像,图像数据的压缩,3.6,3.6.1 图像数据的压缩算法,2图像压缩方法,衡量一个压缩编码方法优劣的重要指标是:压缩比要高,有几倍、几十倍,也有几百乃至几千倍;压缩与解压缩要快,算法要简单,硬件实现容易;解压缩的图像质量要好。,图像数据的压缩3.63.6.1 图像数据的压缩算法 2图像,图像数据的压缩,3.6,3.6.1 图像数据的压缩算法,3无损压缩编码,经常使用的无损压缩方法有 香农-范诺编码 霍夫曼编码 算术编码 RLE编码,所谓无损压缩格式,是利用数据的统计冗余进行压缩,可完全回复原始数据而不引起任何失真,但压缩率是受到数据统计冗余度的理论限制,一般为2:1到5:1.这类方法广泛用于文本数据,程序和特殊应用场合的图像数据(如指纹图像,医学图像等)的压缩。由于压缩比的限制,仅使用无损压缩方法是不可能解决图像和数字视频的存储和传输的所有问题.,图像数据的压缩3.63.6.1 图像数据的压缩算法 3无损,图像数据的压缩,3.6,3.6.1 图像数据的压缩算法,3无损压缩编码,香农 - 范诺( Shannon-Fano )编码的目的是产生具有最小冗余的码词( code word )。其基本思想是产生编码长度可变的码词。码词长度可变指的是,被编码的一些消息的符号可以用比较短的码词来表示。估计码词长度的准则是符号出现的概率。符号出现的概率越大,其码词的长度越短。,香农 - 范诺编码算法步骤: 按照符号出现的概率减少的顺序将待编码的符号排成序列。 将符号分成两组,使这两组符号概率和相等或几乎相等。 将第一组赋值为 0 ,第二组赋值为 1 。 对每一组,重复步骤的操作。,图像数据的压缩3.63.6.1 图像数据的压缩算法 3无损,图像数据的压缩,3.6,3.6.1 图像数据的压缩算法,3无损压缩编码,霍夫曼编码的基本方法是先对图像数据扫描一遍,计算出各种像素出现的概率,按概率的大小指定不同长度的唯一码字,由此得到一张该图像的霍夫曼码表。编码后的图像数据记录的是每个像素的码字,而码字与实际像素值的对应关系记录在码表中。,算法步骤如下: 初始化,根据符号概率的大小按由大到小顺序对符号进行排序。 把概率最小的两个符号组成一个新符号(节点),即新符号的概率等于这两个符号概率之和。 重复第2步,直到形成一个符号为止(树),其概率最后等于1。 从编码树的根开始回溯到原始的符号,并将每一下分枝赋值为1,上分枝赋值为0。,图像数据的压缩3.63.6.1 图像数据的压缩算法 3无损,图像数据的压缩,3.6,3.6.1 图像数据的压缩算法,算术编码在图像数据压缩标准(如JPEG,JBIG)中扮演了重要的角色。在算术编码中,消息用0到1之间的实数进行编码,算术编码用到两个基本的参数:符号的概率和它的编码间隔。信源符号的概率决定压缩编码的效率,也决定编码过程中信源符号的间隔,而这些间隔包含在0到1之间。编码过程中的间隔决定了符号压缩后的输出。,算术编码特点: 不必预先定义概率模型,自适应模式具有独特的优点; 信源符号概率接近时,建议使用算术编码,这种情况下其效率高于Huffman编码。 算术编码实现方法复杂一些,但JPEG成员对多幅图像的测试结果表明,算术编码比Huffman编码提高了5%左右的效率。,图像数据的压缩3.63.6.1 图像数据的压缩算法,图像数据的压缩,3.6,3.6.1 图像数据的压缩算法,行程编码RLE。现实中有许多这样的图像,在一幅图像中具有许多颜色相同的图块。在这些图块中,许多行上都具有相同的颜色,或者在一行上有许多连续的象素都具有相同的颜色值。在这种情况下就不需要存储每一个象素的颜色值,而仅仅存储一个象素的颜色值,以及具有相同颜色的象素数目就可以,或者存储一个象素的颜色值,以及具有相同颜色值的行数。这种压缩编码称为行程编码,常用(run length encoding,RLE)表示,具有相同颜色并且是连续的象素数目称为行程长度。,行程编码的基本原理是:用一个符号值或串长代替具有相同值的连续符号(连续符号构成了一段连续的“行程”。行程编码因此而得名),使符号长度少于原始数据的长度。 例如 :5555557777733322221llllll 行程编码为:(5,6)(7,5)(3,3)(2,4)(l,7 ) 。,图像数据的压缩3.63.6.1 图像数据的压缩算法 行程编码,图像数据的压缩,3.6,3.6.1 图像数据的压缩算法,4预测编码,从相邻数据之间由强的相关性特点考虑,可以利用前面已经出现的数值,进行预测(估计),得到一个预测值,将实际值与预测值求差,对这个差值信号进行编码、传送,这种编码方法即为预测编码方法。, 差分脉冲编码调制(DPCM), 帧间预测编码,图像数据的压缩3.63.6.1 图像数据的压缩算法 4预测,图像数据的压缩,3.6,3.6.1 图像数据的压缩算法,4预测编码,差分脉冲编码调制DPCM(differential pulse code modulation)是利用样本与样本之间存在的信息冗余度来进行编码的一种数据压缩技术。,差分脉冲编码调制的思想是,根据过去的样本去估算(estimate)下一个样本信号的幅度大小,这个值称为预测值,然后对实际信号值与预测值之差进行量化编码,从而就减少了表示每个样本信号的位数。,图5.13 DPCM,图像数据的压缩3.63.6.1 图像数据的压缩算法 4预测,图像数据的压缩,3.6,3.6.1 图像数据的压缩算法,4预测编码,活动图像是由连续图像帧组成的时间图像序列,它在时间上比在空间上具有更大的相关性。大多数电视图像相邻帧间细节变化是很小的,即视频图像帧间具有很强的相关性,利用帧所具有的相关性的特点进行帧间编码,可获得比帧内编码高得多的压缩比。,帧间预测编码是利用视频图像帧间的相关性,即时间相关性,来达到图像压缩的目的,即不直接传送当前帧的像素值,而是传送x和其前一帧或后一帧的对应像素x 之间的差值,这称为帧间预测。广泛用于普通电视、会议电视、视频电话、高清晰度电视的压缩编码。,图5.14帧间预测,图像数据的压缩3.63.6.1 图像数据的压缩算法 4预测,图像数据的压缩,3.6,3.6.1 图像数据的压缩算法,5. 变换编码,变换编码是指先对信号进行某种函数变换,从一种信号(空间)变换到另一种(空间),然后再对信号进行编码。,常用的变换编码有: 离散余弦变换(DCT) 沃尔什哈达玛变换(WHT) 离散傅里叶变换(DFT) 卡亨南洛维变换(KLT) 小波变换,1974年,NAhmed等人提出了离散余弦变换(DCT),最大特点是对于一般的图像都能够将像块的能量集中于少数低频DCT系数上,这样就可能只编码和传输少数系数而不严重影响图像质量。DCT不能直接对图像产生压缩作用,但对图像的能量具有很好的集中效果,为压缩打下了基础。一维离散余弦变换二维离散余弦变换,图像数据的压缩3.63.6.1 图像数据的压缩算法 5.,图像数据的压缩,3.6,3.6.2 图像数据的压缩标准,1. JPEG,JPEG是一个适用范围很广的静态图像数据压缩标准,具有连续色调、多级灰度和静态图像特点的数字图像压缩编码方法,被确定为JPEG国际标准。,JPEG专家组开发了两种基本的压缩算法,一种是采用以离散余弦变换(Discrete Cosine Transform,DCT)为基础的有损压缩算法,另一种是采用以预测技术为基础的无损压缩算法。,图像数据的压缩3.63.6.2 图像数据的压缩标准1. J,图像数据的压缩,3.6,3.6.2 图像数据的压缩标准,1. JPEG,JPEG算法框图,压缩编码大致分成三个步骤:使用正向离散余弦变换(FDCT)把空间域表示的图变换成频率域表示的图。使用加权函数对DCT系数进行量化,这个加权函数对于人的视觉系统是最佳的。使用霍夫曼可变字长编码器对量化系数进行编码。,图像数据的压缩3.63.6.2 图像数据的压缩标准1. J,图像数据的压缩,3.6,3.6.2 图像数据的压缩标准,1. JPEG,离散余弦变换。对每个单独的彩色图像分量,把整个分量图像分成88的图像块,并作为两维离散余弦变换DCT的输入。通过DCT变换,把能量集中在少数几个系数上。,图5-16 DCT系数,图像数据的压缩3.63.6.2 图像数据的压缩标准1. J,图像数据的压缩,3.6,3.6.2 图像数据的压缩标准,1. JPEG,量化是对经过FDCT变换后的频率系数进行量化。量化的目的是减小非“0”系数的幅度以及增加“0”值系数的数目,量化是图像质量下降的最主要原因。 量化阶段需要两个8*8矩阵数据,一个是专门处理亮度的频率系数,另一个则是针对色度的频率系数,将频率系数除以量化矩阵的值,取得与商数最近的整数,即完成量化。,亮度量化值,色度量化值,图像数据的压缩3.63.6.2 图像数据的压缩标准1. J,图像数据的压缩,3.6,3.6.2 图像数据的压缩标准,1. JPEG,量化后得到的仍是64个系数,量化并没有改变系数的性质。经过DCT变换后,低频分量集中在左上角,其中F(0,0)(即第一行第一列元素)代表了直流(DC)系数,即8*8子块的平均值,要对它单独编码。由于两个相邻的8*8子块的DC系数相差很小,所以对它们采用差分编码DPCM,可以提高压缩比,也就是说对相邻的子块DC系数的差值进行编码。8*8的其它63个元素是交流(AC)系数,采用行程编码。,DCT变换之后得到的DC直流系数有两个特点,一是系数的数值比较大,二是相邻88图像块的DC系数值变化不大。根据这个特点,JPEG算法使用了差分脉冲调制编码(DPCM)技术,对相邻图像块之间量化DC系数的差值(Delta)进行编码,DeltaDC(0, 0)k-DC(0, 0)k-1量化后AC系数的特点是1 64矢量中包含有许多“0”系数,并且许多“0”是连续的,因此使用非常简单和直观的游程长度编码(RLE)对它们进行编码。,图像数据的压缩3.63.6.2 图像数据的压缩标准1. J,图像数据的压缩,3.6,3.6.2 图像数据的压缩标准,1. JPEG,为了进一步达到压缩数据的目的,需对量化后的DC系数,和行程编码后的AC系数进行基于统计特性的熵编码。JPEG建议使用两种熵编码方法:哈夫曼(Huffman)编码和自适应二进制算术编码(Adaptive Binary Arithmetic Coding)。DC、AC系数行程编码的码字用两个字节表示:,第一个字节的前4位对于DC系数而言,总为0;对于AC系数而言,表示非零系数前所包含的连续0的个数。低4为对于DC系数而言,表示差值的幅值编码所需的比特数;对于AC系数而言,表示下一个非零系数幅值编码所需的比特数。,第二个字节表示DC差值的幅值或下一个非零系数幅值。,图像数据的压缩3.63.6.2 图像数据的压缩标准1. J,图像数据的压缩,3.6,3.6.2 图像数据的压缩标准,2. MPEG,MPEG的全称是运动图像专家组(Moving Picture Experts Group),是专门制定多媒体领域内的国际标准的一个组织,该组织成立于1988年,由全世界大约300名多媒体技术专家组成。MPEG标准是一系列视频、音频、数据的压缩标准。分成MPEG视频、MPEG音频和MPEG系统三大部分。目前,MPEG的标准主要有: MPEG-1、 MPEG-2、 MPEG-4、 MPEG-7、 MPEG-21。,MPEG系统的组成MPEG系统:定义音频、视频及有关数据的同步;MPEG视频:定义视频数据的编码和重建图像所需的解码过程,亮度信号分辨率为360240,色度信号分辨率为180120;MPEG音频:定义音频数据的编码和解码;一致性测试。,图像数据的压缩3.63.6.2 图像数据的压缩标准2. M,图像数据的压缩,3.6,3.6.2 图像数据的压缩标准,2. MPEG,MPEG的视频数据流结构, 序列层, 图像组层, 图像层, 片层, 宏块层, 块层,图像数据的压缩3.63.6.2 图像数据的压缩标准2. M,图像数据的压缩,3.6,3.6.2 图像数据的压缩标准,2. MPEG,MPEG运动图像类型,I帧,P帧,B帧,D帧,图像数据的压缩3.63.6.2 图像数据的压缩标准2. M,图像数据的压缩,3.6,3.6.2 图像数据的压缩标准,2. MPEG,视频流的组成,允许编码端自行选择I帧的使用频率和在视频流中的位置。, 允许编码端自行选择任何两帧参考图像之间的B帧数。,编码端的视频流记录格式并不要求与典型图像显示顺序一致。,MPEG实现视频编码采用两种基本技术: 基于块的运动补偿技术,目的是减少时间上冗余性; 基于DCT变换的ADCT技术,以减少空间上冗余性。,运动补偿技术运动补偿预测是以子块(1616)为预测单元,把当前子块认为是先前某一时刻图像子块的位移,位移的内容包括运动方向和运动幅度。,图像数据的压缩3.63.6.2 图像数据的压缩标准2. M,第3章 图像处理技术,小结,3.1 图像原理 3.1.1 图像与图形 3.1.2 图像分辨率 3.1.3 图像颜色与颜色深度3.2 图像文件 3.2.1 图像文件格式 3.2.2 图像文件的体积与保存3.3 图像的获取 3.3.1 获取途径 3.3.2 图像扫描技术,3.3.3 数码拍摄技术3.4 图像处理技术 3.4.1 图像的点处理 3.4.2 图像的组处理 3.4.3 图像的几何处理 3.4.4 图像的帧处理3.5 图像的浏览 3.5.1 图像浏览软件简介 3.5.2 图片浏览界面基本功能 3.5.3 图像文件格式 3.5.4 建立或取消文件关联3.6 图像数据的压缩,第3章 图像处理技术小结3.1 图像原理 3.3.,