数字图像表示及其处理.ppt
第章数字图像表示及其处理,主要内容人眼成像过程简单的图像形成模型图像的数字化数字图像的基本类型图像的灰度直方图数字图像的基本文件格式编程处理图像,2023/10/1,2,2.1 人眼成像过程,人眼是一个平均半径为20mm的球状器官。它由三层薄膜包围着,如图所示。,最外层是坚硬的蛋白质膜,其中,位于前方的大约16部分为有弹性的透明组织,称为角膜,光线从这里进入眼内。其余56为白色不透明组织,称为巩膜,它的作用是巩固和保护整个眼球。中间一层由虹膜和脉络膜组成。虹膜的中间有一个圆孔,称为瞳孔。它的大小可以由连接虹膜的环状肌肉组织来调节,以控制进入眼睛内部的光通量大小,其作用和照相机中的光圈一样。最内一层为视网膜,它的表面分布有大量光敏细胞。,2023/10/1,3,2.1人眼成像过程,除了三层薄膜,在瞳孔后面有一个扁球形的透明体(水晶体)。水晶体的作用如同可变焦距的一个透镜,它的曲率可以由睫状肌的收缩进行调节,从而使景象始终能刚好地聚焦于黄斑区。眼睛的晶状体和普通光学透镜之间的主要差别在于前者的适应性强。,用眼睛看建筑物侧面的图解,C点是晶状体的光心,2023/10/1,4,2.1人眼成像过程,可计算物体在视网膜上的成像尺寸。例如,上图中,观察者看1个相距100m高15m的柱状物体。如果用x代表以mm为单位的视网膜上的成像尺寸,根据图中的几何关系,15/100=x/17,X=2.55mm。,2023/10/1,5,人眼的机理与照相机类似,1.瞳孔:透明的角膜后是不透明的虹膜,虹膜中间的圆孔称为瞳孔,其直径可调节,从而控制进入人眼内的光通量 照相机光圈作用 2.晶状体:瞳孔后是一扁球形弹性透明体,其曲率可调节,以改变焦距,使不同距离的图在视网膜上成像 照相机透镜作用,2023/10/1,6,人眼的机理与照相机类似,3.视细胞:视网膜上集中了大量视细胞,分为两类:1)锥状细胞:明视细胞,在强光下检测亮度和颜色;每个眼内约有6,000,0007,000,000个锥细胞。它们对颜色很敏感。其中,每个锥状视细胞连接着一个视神经末梢,故分辨率高,分辨细节、颜色;2)杆(柱)状细胞:暗视细胞,在弱光下检测亮度,无色彩感觉。柱细胞的数量要比锥细胞大得多,在视网膜表面上大约有75,000,000 150,000,000 个柱细胞。多个杆状视细胞连接着一个视神经末梢,故分辨率低,仅分辨图的轮廓。4.人眼成像过程 视细胞受到光刺激产生电脉冲视神经中枢大脑成像,2023/10/1,7,人眼的亮度感觉,1.人眼亮度感觉范围 1)总范围很宽(10-2106,c=108)2)人眼适应某一环境亮度后,范围限制 适当平均亮度下:c=103 很低亮度下:c=102.人眼对亮暗程度所形成的“黑”“白”感觉具有相对性,在不同的环境下对同样亮度的主观感受并不相同。3.图像“黑”“白”(“亮”、“暗”)对比参数(1)对比度c=Bmax/Bmin(图像中最大和最小亮度或灰度之比)(2)相对对比度 cr=100%*(B-B0)/B0(B物体亮度;B0背景亮度),2023/10/1,8,人眼的亮度感觉,4.主观亮度S与实际亮度B之间的关系(对数关系)S=K lnB+k0 5.人眼亮度感觉的应用(1)由以上可知,若原图像处理恢复重现图像,只要和的对比度及亮度差别级数(灰度级/层次)相同,就能给人以真实的感觉,这就为图像处理奠定了灵活的基础。(2)大部分图像的 c 100故一幅图像数字化时,灰度级取256左右。6.人眼适应性(1)暗适应:亮暗:慢(10分钟左右)(2)亮适应:暗亮:快(3分钟左右),2023/10/1,9,人眼的亮度感觉,7.人眼的亮度对比效应(1)两物体亮度相同,但人感到背景暗的物体亮,背景亮的物体暗;(2)两不同亮度物体处在不同亮度背景下,人按对比度c感觉物体亮度对比;(3)亮度恒定:人眼观察c1=c2的物体,会认为两物体亮度相同(近)。,图中间方块的亮度相同,当背景变亮时,它们变暗,2023/10/1,10,人眼的视觉错觉,人类感知现象存在视觉错觉。在错觉中,眼睛填充上了不存在的信息或者错误感知物体的几何特点。,(a)一个正方形的轮廓看得很清楚,尽管在图像中这些部分并没有线,2023/10/1,11,人眼的视觉错觉,(b)仅仅几条直线就可以给出一个圆的错觉。(c)两条水平线长度相同,但是感觉一个比另一个短。,2023/10/1,12,人眼的视觉错觉,(d)所有旋转450的线都是等距离的平行线,然而画有交叉影线就产生错觉,感觉这些线不再平行。视觉错觉是人类视觉系统的一个特性,这一特性尚未完全了解。,能看到很多黑点在闪动吗?,2023/10/1,13,色彩的迷惑,2023/10/1,14,运动的齿轮,2023/10/1,15,2023/10/1,16,2.1人眼成像过程,物体反射或透射了照射光谱的一部分而吸收了其余部分呈现颜色。人从一个物体感受的颜色由物体反射光的性质决定。一个物体若所有反射的可见光波长是相对平衡的,则物体对观察者来说是显示白色。然而,一个物体在可见光谱的有限范围内反射时会呈现各种颜色色调。如,绿色物体反射波长主要在500570范围的光,而吸收其他波长的大部分能量。没有颜色的光叫消色光或单色光。属性是它的强度或大小。用灰度级表示,范围从黑到灰,最后到白。,2023/10/1,17,2.1人眼成像过程,人眼对彩色的感知由3个量来度量:亮度:光作用于人眼的明亮程度色调:人眼的彩色感觉,反映颜色的种类饱和度:彩色的深浅或纯洁程度色调和饱和度合称色度,说明彩色光的颜色类别和颜色的深浅程度。,2023/10/1,18,2.1人眼成像过程,大多数颜色光可分解为红(R)、绿(G)、蓝(B)3种光,称为三基色。按不同比例混合称相加混色:红+绿=黄红+蓝=品红绿+蓝=青红+绿+蓝=白,2023/10/1,19,2.2 简单的图像形成模型,一幅图像实际上记录的是物体辐射能量的空间分布,这个分布是空间坐标、时间和波长的函数,即:I=(x,y,z,t)。当一幅图像为平面单色静止图像时,空间坐标变量z,波长和时间变量t可以从函数中去除,一幅图像可以用二维函数f(x,y)来表示(0f(x,y):f(x,y)=i(x,y)r(x,y)这里 0i(x,y)/入射分量 0r(x,y)1/反射分量 反射分量限制在0和1之间。i(x,y)的性质取决于照射源,而r(x,y)取决于成像物体的特性。例如:i(x,y)在晴朗的白天,太阳在地球表面产生的照度超过90 000lm/m2,在有云的情况下为10 000lm/m2,在晴朗的夜晚,满月的情况下大约为.1lm/m2;r(x,y)黑天鹅绒0.01,不锈钢0.65,白色墙0.80,镀银金属0.90,雪0.93.,2023/10/1,20,图像的获取,如图显示了把照射量变为数字图像的三种主要传感器装置。原理是通过将输入电功率和对特殊类型检测能源敏感的传感器材料组合,把输入能源转变为电压。输出电压波形是传感器的响应,同时,一个数字量可从数字化该响应的每个传感器得到。,(a)单个成像传感器,2023/10/1,21,图像的获取,(b)线性传感器;(c)传感器阵列。,2023/10/1,22,图像的获取,(1)用单个传感器获取图像-通过运动获取二维图像,2023/10/1,23,图像的获取,(2)(a)用带状传感器获取图像;(b)用环形传感器带获取图像。,2023/10/1,24,图像的获取,(3)用传感器阵列获取图像(a)照射源;(b)场景元素;(c)成像系统;(d)场景投影到图像平面;(e)数字化图像。,2023/10/1,25,2.3 图像的数字化,数字图像可以理解为对二维函数f(x,y)进行采样和量化(即离散处理)后得到的图像,因此,通常用二维矩阵来表示一幅数字图像。数字化坐标值称为采样(取样),数字化幅度值称为量化。采样和量化统称为数字化。将一幅图像进行数字化的过程就是在计算机内生成一个二维矩阵的过程。数字化过程包括三个大步骤:扫描、采样和量化。扫描:按顺序对图像进行遍历,如矩形扫描网格;采样:用光电传感器件对像素位置上的像素取值;量化:对采样得到的值模数转换。,2023/10/1,26,图像数字化设备的组成及性能,数字图像处理的一个先决条件就是将图像转化为数字形式。一个简易的图像处理系统就是一台计算机配备图像数字化器和输出设备。1、数字化器的组成与类型一台图像数字化器必须能够把图像划分为若干图像像素并给出它们的地址,能够度量每一像素的灰度,并把连续的度量结果量化为整数,以及能够将这些整数结果写入存储设备。,2023/10/1,27,图像数字化设备的组成及性能,包括:采样孔、图像扫描机构、光传感器、量化器和输出存储体5部分。采样孔:使数字化设备能够单独观测特定的图像像素而不受图像其他部分的影响。图像扫描机构:使采样孔按照预先规定的方式在图像上移动,从而按顺序观测每一个像素。光传感器:通过采样孔测量图像的每一个像素的亮度,它通常是一个将光强转换为电压或电流的变换器。,2023/10/1,28,图像数字化设备的组成及性能,量化器:将传感器输出的连续量转化为整数值。典型的量化器是一种被称为“模数转换器”的电路,它产生一个与输入电压或电流成比例的数值。输出存储体:将量化器产生的灰度值按适当格式存储起来,以用于后续的计算机处理。数字化器的类型很多,目前:扫描仪、数码相机、电视摄像机等。,2023/10/1,29,图像数字化设备的组成及性能,2、图像数字化器的性能性能评价:空间分辨率:单位尺寸能够采样的像素数。由采样孔径与间距的大小和可变范围决定。灰(色)度分辨率:量化为多少等级(位深度),颜色数(色深度)。图像大小:仪器允许扫描的最大幅度。量测特征:数字化器所测量和量化的实际物理参数及精度。扫描速度:采样数据的传输速度。噪声:数字化器的噪声水平(应当使噪声小于图像内的反差)。其他:黑白/彩色,价格,操作性能等。,2023/10/1,30,采样和量化的依据,阵列中传感器的数量决定了在两个方向上的取样限制。Nyquist_Shannon采样定理:当对一个最高频率fmax的带限信号进行采样时,采样频率SF必须大于fmax的两倍以上才能确保从采样值完全重构原来的信号。2fmax称为Nyquist采样率。二维采样定理(Nyquist 准则)1/x,1/y2倍的图像函数上限频带。,2023/10/1,31,2.3.1 采样,采样(Sampling):是对图像空间坐标的离散化,它决定了图像的空间分辨率。用一个网格把待处理的图像覆盖,然后把每一小格上模拟图像的各个亮度取平均值,作为该小方格中点的值。,图像的采样,2023/10/1,32,采样和量化,2023/10/1,33,采样和量化,2023/10/1,34,2.3.1 采样,对一幅图像采样时,若每行(即横向)像素为M个,每列(即纵向)像素为N个,则图像大小为MN个像素,从而f(x,y)构成一个MN实数矩阵:,每个元素为图像f(x,y)的离散采样值,称之为像元或像素。,2023/10/1,35,数字图像所用的坐标约定,2023/10/1,36,2.3.2 量化,把采样后所得的各像素灰度值从模拟量到离散量的转换称为图像灰度的量化。量化是对图像灰度坐标的离散化,它决定了图像的灰度分辨率。量化的方法包括:分层量化、均匀量化和非均匀量化。分层量化是把每一个离散样本的连续灰度值只分成有限多的层次。均匀量化是把原图像灰度层次从最暗至最亮均匀分为有限个层次,如果采用不均匀分层就称为非均匀量化。用有限个离散的灰度值表示无穷多个连续灰度必然会引起误差,称量化误差或量化噪声.,2023/10/1,37,2.3.2 量化整数化过程,量化示意图,(a)量化(b)量化为8 bit,2023/10/1,38,2.3.2 量化,图像量化实例,(a)256级灰度图像(b)子图(16*16)(c)子图对应的量化数据,2023/10/1,39,2.3.2 量化,采样点数和量化级数的关系:对一幅图像,当量化级数一定时,采样点数对图像质量有着显著的影响。采样点数越多,图像质量越好;当采样点数减少时,图上的块状效应就逐渐明显。同理,当图像的采样点数一定时,采用不同量化级数的图像质量也不一样。量化级数越多,图像质量越好,当量化级数越少时,图像质量越差,量化级数最小的极端情况就是二值图像,图像出现假轮廓。,2023/10/1,40,2.3.2 量化-采样点数和量化级数的关系,(a)采样点256256(b)采样点6464(c)采样点3232(d)采样点1616,(a)量化为2级的Lena图像(b)量化为16级的Lena图像(c)量化为256级的Lena图像,2023/10/1,41,分辨率变化对图像影响,(一)概念 1.图像分辨率:区分细节的程度;2.影响因素:采样点数(M,N)和灰度(数)G。(二)空间分辨率 1.采样点数MN(采样间隔x y)空间分辨率;2.G(灰度)不变,MN 图像中各细节区域边缘出现“棋盘-马赛克”效应,即像素粒子变粗。(三)幅度分辨率 1.G 图像幅度分辨率;2.M、N不变,G 灰度渐变变成突变,出现虚假轮廓(有木刻画效果),2023/10/1,42,分辨率变化对图像影响,(四)M、N及G的实际取值 1.M=2m,N=2n,G=2k(m,n,k 1)2.实际中:M=N=2n=256,512,1024,G=2 k=32,64,128,256,3.人头像:M=N=128,256;K=6,7,2023/10/1,43,实际处理的像素数,汉字:32*3264*64像素。如果不仅要区别作为文字的图形,还要处理细小部分的形状,则需要更多的像素数。显微镜像:256*256512*512像素。TV图像:500700*280像素。卫星图像:LANDSAT(单波段)3240*2340像素。SAR(合成孔径雷达):8000*8000像素左右。CRT显示器:作为显示画面,经常采用512*5121024*1024像素的显示器,亦可以采取更高像素的显示器。,2023/10/1,44,像素间的一些基本关系,像素的邻域(仅仅考虑像素的位置而不考虑像素的灰度值)对1个像素p,它可以有4个水平和垂直的近邻像素。如图。这些像素(r)组成p的4邻域,记作N4(p)。像素p与它的4邻域像素的距离是1个单位距离。如果p在图像的边缘,它的若干个邻域像素会落在图像外。,2023/10/1,45,像素间关系,像素p的4个对角近邻像素如图,记作ND(p).这些像素再加上p的4邻域像素合称为p的8邻域,记作N8(p)。如果p在图像的边缘,ND(p)和N8(p)中的若干个像素会落在图像外。,像素的邻域,位于坐标(x,y)的一个像素p的4邻域像素的坐标表示为:(x+1,y),(x-1,y),(x,y+1),(x,y-1)位于坐标(x,y)的一个像素p的4对角的相邻像素的坐标表示为:(x+1,y+1),(x+1,y-1),(x-1,y+1),(x-1,y-1),2023/10/1,46,邻接性,连通性,区域和边界,不仅考虑像素的位置还要考虑像素的灰度值。像素间的连通性是一个基本概念,它简化了许多数字图像概念的定义,如区域和边界.为了确定两个像素是否连通,必须确定它们是否相邻以及其灰度值是否满足特定的相似性准则(或者说,它们的灰度值是否相等).例如,在具有0,1值的二值图像中,两个像素可能是4邻接的,但是仅仅当它们具有同一灰度值时,才能说是连通的.,2023/10/1,47,邻接性,令V是用于定义邻接性的灰度值集合.在二值图像中,如果把具有1值的像素归入邻接的,则V=1.在灰度图像中,概念是一样的,但是集合V一般包含更多的元素.例如,对于具有可能的灰度值且在0到255范围内的像素邻接性,集合V可能是这256个值的任何一个子集.考虑三种类型的邻接性:,2023/10/1,48,邻接性,(1)4邻接:如果q在N4(p)集中,则具有V中数值的两个像素p和q是4邻接的.(2)8邻接:如果q在N8(p)集中,则具有V中数值的两个像素p和q是8邻接的.(3)m邻接(混合邻接):如果(I)q在N4(p)集中,或者(II)q在ND(p)集中且集合N4(p)N4(q)没有V值的像素,则具有V中数值的两个像素p和q是m邻接的.,2023/10/1,49,邻接性,2023/10/1,50,混合邻接是8邻接的改进,是为了消除采用8邻接常常发生的二义性.考虑下图(a)的对于V=1的像素安排.下图(b)上部的3个像素显示了多重(二义性)8邻接,如虚线所示.这种二义性可以通过m邻接消除,如下图(c)所示.两个图像子集S1,S2,如果 S1中的某些像素与S2中某些像素邻接,则两个图像子集S1,S2是相邻接的.这里的邻接是指4,8或者m邻接.,连通性,从具有坐标(x,y)的像素p到具有坐标(s,t)的像素q 的通路(或曲线)是特定的像素序列,其坐标为:(x0,y0),(x1,y1),(xn,yn)其中(x0,y0)=(x,y),(xn,yn)=(s,t),并且像素(xi,yi)和(xi-1,yi-1)(对于1i n)是邻接的.在这种情况下,n是通路的长度.如果(x0,y0)=(xn,yn)则通路是闭合通路.可以依据特定的邻接类型定义4,8或m邻接.,2023/10/1,51,连通性,例如,下图(b)中,东北角和东南角点之间的通路是8通路,下图(c)中的通路是m通路.注意,在m通路中不存在二义性.,2023/10/1,52,区域与边界,令S代表一幅图像中像素的子集。如果在S中全部像素之间存在一个通路,则可以说两个像素p和q在S中是连通的。对于S中的任何像素p,S中连通到该像素的像素集称为S的连通分量.如果S中仅有一个连通分量,则集合S称为连通集.令R为图像中的像素子集.如果R是连通集,则称R为一个区域.一个区域R的边界(也称边缘或轮廓)是区域中像素的集合,该集合有一个或多个不在R中的邻点.如果R是整幅图像(设为方形),则边界由图像的第一行,第一列和最后一行最后一列定义.(因为图像除了边缘没有邻点),2023/10/1,53,边界与边缘,正常情况下,提到一个区域时,指的是一幅图像的子集,并且区域边界中的任何像素(与图像边缘吻合)都作为区域边界部分全部包含其中.边缘的概念和边界的区别:一个有限区域的边界形成一条闭合通路,并且是整体的概念.边缘由具有某些导数值(超过预先设定的阈值)的像素形成.边缘的概念是基于在进行灰度级测量时不连续点的局部概念.,2023/10/1,54,边界与边缘,把边缘点连接成边缘线段是可能的,并且有时以与边界对应的方法连接线段,点并不总是这样.边缘和边界吻合的一个例外就是二值图像的情况.根据连通类型和所用的边缘算子(以后讨论),从二值区域提取边缘与提取区域边界是一样的,这很直观.在概念上,把边缘考虑为强度不连续的点和封闭通路的边界是有帮助的。,2023/10/1,55,距离度量,对于像素p,q,z其坐标分别为(x,y),(s,t)和(v,w),D是距离函数,如果(a)D(p,q)0 D(p,q)=0,当且仅当p=q(b)D(p,q)=D(q,p)(c)D(p,z)D(p,q)+D(q,z),2023/10/1,56,距离度量,p,q间的欧氏距离定义如下:De(p,q)=(x-s)2+(y-t)21/2 这种情况下,距离点(x,y)的距离小于或等于某一值r的像素是中心在(x,y)半径为r的圆平面.p,q间的D4距离(又称城市街区距离)定义如下:D4(p,q)=|x-s|+|y-t|这种情况下,距离点(x,y)的距离小于或等于某一值r的像素形成一个中心在(x,y)的菱形.例如,距离小于等于2的像素排列:具有D4=1的像素是(x,y)的4邻域.,2023/10/1,57,距离度量,2023/10/1,58,p,q间的D8(又称棋盘距离)距离定义如下:D8(p,q)=max(|x-s|,|y-t|)这种情况下,距离点(x,y)的距离小于或等于某一值r的像素形成一个中心在(x,y)的方形.例如,距离小于等于2的像素排列:具有D8=1的像素是关于(x,y的8邻域).,距离度量,注意,p和q之间的D4,D8距离与通路无关,通路可能存在于各点之间,因为这些距离仅与点的坐标有关.然而,如果选择考虑m邻接,则两点间的Dm距离用点间最短的通路定义.在这种情况下,两像素间的距离将依赖于沿通路的像素值及其邻点值.,2023/10/1,59,考虑m邻接的-距离度量,考虑如图所示的像素排列,并考虑值为1的像素邻接(p,p2,p4的值为1,p1,p3的值为1或0),假设考虑值为1的像素邻接,即V=1:如果p1=p3=0,则Dm(p,p4)=2;如果p1=1,p3=0则p2和p将不再是m邻接,则Dm(p,p4)=3,即通路通过点p,p1,p2,p4;如果p1=0,p3=1,则Dm(p,p4)=3,即通路通过点p,p2,p3,p4;如果p1=1,p3=1,则Dm(p,p4)=4,即通路通过点p,p1,p2,p3,p4;,2023/10/1,60,放大和收缩数字图像,这可以比作对数字图像的采样和量化。放大是过采样收缩是欠采样。放大图像(2个步骤):创立新的像素位置和对这些新位置赋予新的像素灰度值。收缩图像:删除部分行和列的像素。,2023/10/1,61,放大图像举例,有一幅大小500500像素的图像,把它扩大1.5倍,即750750像素.一种形象化放大方法是在原始图像上放一个虚构的750750的栅格。很显然,栅格的间隔应小于1个像素,因为要在一个较小的图像上去拟合。为了对覆盖层上的任何点进行灰度赋值,要在原图像上寻找最靠近的像素并把它的灰度值赋给栅格上的新像素。当对覆盖栅格的全部点都赋值完后,简单地把栅格扩展到原来的大小,以得到放大的图像。这种灰度赋值法叫做最近邻域内插法,还有其他的插值方法(如采用4个最邻近点的值的双线性插值方法)。要以整数倍放大时,可采用像素复制的方法。例如把图像增大一倍,可以复制每一列,再复制每一行。虽然最近邻域插值较快,但它的缺点是会产生棋盘格效应,在高放大倍数时更明显。,2023/10/1,62,2023/10/1,63,收缩图像的举例,例如,把图像缩小【整数倍】,可以每隔一行(或一列)删除一行或(或一列)。可以用放大栅格模拟用非整数参数收缩图像,设想用扩大的栅格在原图像上拟合,做灰度级最近邻域或双线性插值,然后把栅格收缩到原来规定的大小。,2023/10/1,64,2023/10/1,65,2.4 数字图像的基本类型,计算机一般采用两种方式存储静态图像:位映射(Bitmap),即位图存储模式;向量处理(Vector),也称矢量存储模式。位图也称为栅格图像,是通过许多像素点表示一幅图像,每个像素具有颜色属性和位置属性。矢量图只存储图像内容的轮廓部分,而不是图像数据的每一点。,2023/10/1,66,2.4 数字图像的基本类型,2.4.1 二值图像二值图像也叫黑白图像,就是图像像素只存在0,1两个值。2.4.2 灰度图像灰度图像是包含灰度级的图像,如64级,256级等。如当像素灰度级用8 bit表示时,每个像素的取值就是256种灰度中的一种,即每个像素的灰度值为0到255中的一个。通常,用0表示黑,255表示白,从0到255亮度逐渐增加。,2023/10/1,67,2.4 数字图像的基本类型,2.4.3 索引图像索引图像把像素值直接作为索引颜色的序号。根据索引颜色的序号就可以找到该像素的实际颜色。当把索引图像读入计算机时,索引颜色将被存储到调色板中。调色板是包含不同颜色的颜色表,每种颜色以红,绿,蓝三种颜色的组合来表示。调色板的单元个数是与图像的颜色数一致的。256色图像有256个索引颜色,相应的调色板就有256个单元。,2023/10/1,68,2.4 数字图像的基本类型,2.4.4 RGB图像RGB图像是一类图像的总称。这类图像不使用单独的调色板,每一个像素的颜色由存储在相应位置的红,绿,蓝颜色分量共同决定。RGB图像是24位图像,红绿蓝分量分别占用8位,理论上可以包含16M种不同的颜色。,2023/10/1,69,2.5 数字图像的基本文件格式,每一种图像文件均有一个文件头,在文件头之后才是图像数据。文件头的内容一般包括文件类型、文件制作者、制作时间、版本号、文件大小等内容。图像文件还涉及图像文件的压缩方式和存储效率等。常用的图像文件存储格式主要有BMP文件、JPG文件、PCX文件、TIFF文件以及GIF文件等。,2023/10/1,70,2.5.1 BMP图像文件格式,2023/10/1,71,2.5.1 BMP图像文件格式,第一部分为位图文件头BITMAPFILEHEADER,它是一个结构体,其定义如下:typedef struct tagBITMAPFILEHEADER WORD bfType;DWORDbfSize;WORDbfReserved1;WORDbfReserved2;DWORDbfOffBits;BITMAPFILEHEADER;这个结构的长度是固定的,为14个字节(WORD为无符号16位二进制整数,DWORD为无符号32位二进制整数)。,2023/10/1,72,2.5.1 BMP图像文件格式,第二部分为位图信息头BITMAPINFOHEADER,也是一个结构,其定义如下:typedef struct tagBITMAPINFOHEADER DWORD biSize;LONGbiWidth;LONGbiHeight;WORDbiPlanes;WORDbiBitCount;DWORDbiCompression;DWORDbiSizeImage;LONGbiXPelsPerMeter;LONGbiYPelsPerMeter;DWORDbiClrUsed;DWORDbiClrImportant;BITMAPINFOHEADER;这个结构的长度是固定的,为40个字节(LONG为32位二进制整数)。其中,biCompression的有效值为BI_RGB、BI_RLE8、BI_RLE4、BI_BITFIELDS。,2023/10/1,73,2.5.1 BMP图像文件格式,第三部分为调色板(Palette)。真彩色图像不需要调色板。调色板实际上是一个数组,共有biClrUsed个元素。数组中每个元素的类型是RGBQUAD结构,占4个字节,其定义如下:typedef struct tagRGBQUAD BYTE rgbBlue;/该颜色的蓝色分量 BYTE rgbGreen;/该颜色的绿色分量 BYTE rgbRed;/该颜色的红色分量 BYTE rgbReserved;/保留值 RGBQUAD;,2023/10/1,74,2.5.1 BMP图像文件格式,第四部分就是实际的图像数据。对于用到调色板的位图,图像数据就是该像素颜色在调色板中的索引值,对于真彩色图像,图像数据就是实际的R、G、B值。对于2色位图,用1位就可以表示该像素的颜色(一般0表示黑,1表示白),所以一个字节可以表示8个像素。对于16色位图,用4位可以表示一个像素的颜色,所以一个字节可以表示2个像素。对于256色位图,一个字节刚好可以表示1个像素。,2023/10/1,75,2.5.2 TIFF图像文件格式,标记图像文件格式TIFF(Tag Image File Format)是现存图像文件格式中最复杂的一种,是目前流行的图像文件交换标准之一。TIFF格式文件的设计考虑了扩展性、方便性和可修改性,因此非常复杂,要求用更多的代码来控制它,结果导致文件读写速度慢,TIFF代码也很长。TIFF文件由文件头、参数指针表与参数域、参数数据表和图像数据4部分组成。,2023/10/1,76,2.5.2 TIFF图像文件格式,由一个2字节的整数和其后的一系列12字节参数域构成,最后以一个长整型数结束。若最后的长整型数为0,表示文件的参数指针表到此为止,否则该长整数为指向下一个参数指针表的偏移。,2023/10/1,77,2.5.3 GIF图像文件格式,GIF(Graphics Interchange Format)文件的全称是图形交换文件格式。该形式存储的文件主要为不同的系统平台交流和传输图像提供方便,是Web及其他联机服务上常用的一种文件格式,用于 HTML文档中的索引颜色图像。图像最大不能超过64 M,颜色最多为256色。GIF图像文件采取LZW压缩算法,存储效率高,支持多幅图像定序或覆盖,交错多屏幕绘图以及文本覆盖。GIF主要是为数据流而设计的一种传输格式,而不是作为文件的存储格式。GIF有五个主要部分以固定顺序出现,所有部分均由一个或多个块(block)组成。每个块第一个字节中存放标识码或特征码标识。这些部分的顺序为:文件标志块、逻辑屏幕描述块、可选的“全局”色彩表块(调色板)、各图像数据块(或专用的块)以及尾块(结束码)。,2023/10/1,78,2.5.3 GIF图像文件格式,2023/10/1,79,2.5.4 PCX图像文件格式,PCX文件格式由ZSoft公司设计,是最早使用的图像文件格式之一。PCX支持256种颜色,结构较简单,存取速度快,压缩比适中,适合于一般软件的使用。PCX 格式支持RGB、索引颜色、灰度和位图颜色模式,支持 RLE 压缩方法,图像颜色的位数可以是 1、4、8 或 24。PCX图像文件由三个部分组成:文件头、图像数据和256色调色板。,2023/10/1,80,2.5.5 JPEG图像文件格式,JPEG(Joint Photographers Experts Group)即联合图像专家组,是由ISO和CCITT为静态图像所建立的第一个国际数字图像压缩标准,主要是为了解决专业摄影师所遇到的图像信息过于庞大的问题。JPEG 格式支持 24 位颜色,并能保留照片和其他连续色调图像中存在的亮度和色相的显著和细微的变化。,2023/10/1,81,2.6 图像的灰度直方图,灰度直方图是数字图像处理中一个最简单、最有用的工具,它描述了一幅图像的灰度级内容。任何一幅图像的直方图都包括了可观的信息,某些类型的图像还可由其直方图完全描述。,2023/10/1,82,灰度直方图的定义,灰度直方图是灰度值的函数,描述的是图像中具有该灰度值的像素的个数,其横坐标表示像素的灰度级别,纵坐标是该灰度出现的频率(像素的个数)。,2023/10/1,83,灰度直方图,a,b是两幅不同的图像;c,d分别是它们的直方图,图像不同,但直方图一样.,2023/10/1,84,灰度直方图,灰度直方图也有另一种方式的定义:假设有一幅由函数D(x,y)所定义的连续图像,它平滑地从中心的高灰度级变化到边沿的低灰度级。我们可以选择某一灰度级D1,然后定义一条轮廓线,该轮廓线连接了图像上所具有灰度级D1的点。所得到的轮廓线形成了包围灰度级大于等于D1的区域的封闭曲线。,2023/10/1,85,灰度直方图,在图像中有一条灰度级为D1的轮廓线,在更高的灰度级D2处还有第二条轮廓线。设A1是第一条轮廓线所包围区域的面积,A2是第二条轮廓线所包围区域的面积。将一幅连续图像中被具有灰度级D的所有轮廓线所包围的面积称为该图像的阀值面积函数A(D)。,2023/10/1,86,灰度直方图,直方图定义:,一幅连续图像的直方图是其面积函数的导数的负值!对离散图像而言,D=1,H(D)=A(D)-A(D+1)对于数字图像,任一灰度级 D 的面积函数A(D)就是大于或等于灰度级 D 的像素的个数。,2023/10/1,87,灰度直方图的性质,灰度直方图的性质灰度直方图只能反映图像的灰度分布情况,而不能反映图像像素的位置。一幅图像对应惟一的灰度直方图,反之不成立。不同的图像可对应相同的灰度直方图。一幅图像分成多个区域,多个区域的直方图之和即为原图像的直方图。图像 特定的唯一的直方图直方图 并不对应唯一的图像具有特定函数形式的图像直方图可以通过面积函数来求得。,2023/10/1,88,例题,已知一幅绘画的图像,长为20mm宽为50mm,其直方图如下图所示,问该图的像素间距是多少?0 34 64 450 680 2030 490 78 99 32 43,解:(1)由直方图可知像素总个数 为 4000(2)该图像面积为:1000平方毫米(3)像素间距为:mm,2023/10/1,89,灰度直方图的应用,用于判断图像量化是否恰当。直方图给出了一个直观的指标,用来判断一幅数字化图像量化是否合理地利用了全部允许的灰度范围。一般来说,数字化获取的图像应该利用全部可能的灰度级,但有时并不理想。用于确定图像二值化的阀值(灰度二值)。0 f(x,y)T T 为阀值,2023/10/1,90,灰度直方图的应用,求物体面积。当物体部分的灰度值比其他部分灰度值大时,可利用直方图统计图像中物体的面积。A=n vi i=T上式n是图像像素总数,vi图像灰度级为i 的像素出现的频率。计算图像信息量H(熵)。L-1 H=Pilog2Pi i=0 上式Pi 是图像灰度级为i 的像素出现的频率,图像的灰度范围在0,L-1。,2023/10/1,91,2.7 用VC+实现BMP图像文件的显示,本节介绍如何在VC+6.0中编程实现BMP图像的显示。下面介绍具体步骤:步骤一、打开VC+6.0,选择File|New进入界面在Projects中选择MFC AppWinzard(exe),在Project name中输入项目名称,本例为ReadBMP,在Location中输入项目要保存的文件夹。点击“OK”进入下一步。,2023/10/1,92,2.7 用VC+实现BMP图像文件的显示,步骤二、选择文档类型在本例中使用的是单文档视图结构,所以这里选择Single document。其余部分设置使用VC+6.0的默认设置,点击“Finish”完成项目创建。,2023/10/1,93,2.7 用VC+实现BMP图像文件的显示,步骤三、为了将BMP中的数据读入到内存中,在项目中建立专门处理BMP文件头和数据的文件:DIBAPI.H和DIBAPI.CPP,在其中实现对BMP文件的大部分处理。选择File|New从弹出界面Files选项中选择C/C+Header File,建立一个新的头文件。在右边的File输入框中输入文件名,这里命名为DIBAPI,默认后缀为.H。同上类似,选择C+Source File建立DIBAPI.CPP文件。几个函数的详细代码解释见教材31-40页,2023/10/1,94,2.7 用VC+实现BMP图像文件的显示,步骤四、在CReadBMPDoc类中添加变量CPalette*m_palDIB 和HDIB m_hDIB。m_hDIB用于保存当前BMP图像句柄,m_palDIB用于指向BMP图像对应的调色板。在CReadBMPDoc的构造函数中初始化:m_hDIB=NULL;m_palDIB=NULL。步骤五、为了取得保存在当前文档中的HDIB和Palette数据,在CReadBMPDoc类中添加方法:GetHDIB和GetDocPalette,具体 见教材40-41页,2023/10/1,95,2.7 用VC+实现BMP图像文件的显示,步骤六、响应类CReadBMPDoc OnOpenDocument事件,以实现打开文件的操作。从View|ClassWizard进入MFC ClassWizard界面,在Message Maps选项中完成消息映射。具体代码见教材42-44,2023/10/1,96,2.7 用VC+实现BMP图像文件的显示,步骤七、完成图片的打开操作之后,图片的数据就已经被保存在程序中,为了将图片显示出来还需要响应类CReadBMPView的OnDraw事件,在其中完成图像显示。具体代码见教材44页。步骤八、编译并运行程序,自此一个用于打开BMP图像的单文档视图结构的程序就完成了。通过修改当前位图句柄m_hDIB中存放像素的数据就可以对图像进行改变了。,2023/10/1,97,2.8 小结,一幅图像实际上记录的是物体辐射能量的空间分布,这个分布是空间坐标、时间和波长的函数。当一幅图像为平面单色静止图像