【教学课件】第3章数字图象处理技术.ppt
《【教学课件】第3章数字图象处理技术.ppt》由会员分享,可在线阅读,更多相关《【教学课件】第3章数字图象处理技术.ppt(107页珍藏版)》请在三一办公上搜索。
1、第3章 数字图象处理技术,3.1 信号处理的基本术语3.2 图象数据压缩基础3.3 图象数据压缩算法3.4 常用图形、图像文件3.5 静态图像压缩标准3.6 动态图像压缩标准3.7 H.26x标准,3.1 信号处理的基本术语,3.1.1 采样和量化采样:信号在时间上的离散化,即按照固定的时间间隔 t在模拟信号x(t)上逐点采取其瞬时值。量化:对信号的幅值进行离散化,即用二进制量化电平来表示幅值。频率混叠:时域波形的信号混叠在频谱上的反映,是因为在时域上选择采样时间间隔不当而导致频域上高低频之间彼此混淆。采样定理:不产生频率混叠的最低采样频率fs 应为信号中最高频率fm的倍。实际采样频率:一般取
2、fs(.)fm,3.1 信号处理的基本术语,3.1.2 采样长度的选择与频率分辨率采样长度:采样时间的长短应该保证能反映信号的全貌,对瞬态信号应该包括整个瞬态过程,对周期信号应包括一个完整周期。频率分辨率:f=fc/nfc被分析信号的频率;n谱线数或者表示为:f=fs/2.56n=1/(2.56nt)=1/(N t)=1/TN=2.56n 为采样点数,一般取值为2的m次方,如1024,2048等。,3.1 信号处理的基本术语,3.1.3 DFT 和IDFT傅立叶分析是将原始信号分解成不同频率成份的正弦波的组合,从而把时域信号转化为频域信号。对于数字化的信号,采用离散傅立叶变换DFT和其逆变换I
3、DFT进行处理。,3.1 信号处理的基本术语,3.1.4 小波变换小波变换用于图象编码的基本思想是,把图象进行多分辨率分解,得到不同空间、不同频率的子图象,然后再对子图象进行系数编码,即对系数进行量化压缩。优点:对信号的低频长时特性和高频短时特性同时处理,能有效克服傅立叶变换在处理非平稳复杂信号时存在的局限性,具有极强的自适应性;能有效解决方块效应和蚊式噪声;能揭示派生信息里的趋势、断开点、非连续性以及自相似等。,3.1 信号处理的基本术语,3.1.4 小波变换小波:在有限周期内的不规则且不对称的波形,其平均值为0。小波分析:将原始信号分解为滑动的与母系小波成比例的各种子波。与傅立叶变换的区别
4、:傅立叶分析得到的是各种频率的正弦波的组合,其正弦波没有限定的周期,是平滑且可以预知的。小波变换也分为连续小波变换和离散小波变换。,3.2 图象数据压缩基础,3.2.1 色彩的基本概念从人的视觉系统来看,色彩可以用色调、饱和度和亮度来描述。色调:由物体表面反射的光线中什么波长的光波占优势决定。可见光谱上不同颜色光波长如下(单位为纳米):红:760610橙:610590黄:590570绿:570500青:500460蓝:460440紫:440400,3.2 图象数据压缩基础,3.2.1 色彩的基本概念亮度:物体表面的光线反射系数。在照射到物体表面的光线强度相等情况下,物体表面反射系数越大,其亮度
5、越大。某种颜色越接近白色,亮度越大。其由大到小顺次为:黄、橙、绿、红、蓝、紫。饱和度:颜色色调的表现程度。某种色调离开白色或灰色越远,其饱和度越大,色彩越艳丽,越鲜明突出,越能发挥其色彩的固有特性。,3.2 图象数据压缩基础,3.2.1 色彩的基本概念图象深度:数字化位图中记录每个象素点所占的二进制位数,它决定彩色图象中可出现的最多颜色数,或者灰度图象中最大灰度等级数。在RGB色彩空间里,图象深度与色彩的映射关系主要有真彩色、伪彩色和调配色。,3.2 图象数据压缩基础,3.2.1 色彩的基本概念真彩色(true color):图象中的每个像素值都分成R、G、B三基色分量,每个基色分量直接决定其
6、基色的强度。计算机表示颜色也是用二进制。16位色的发色总数是65536色,也就是2的16次方;24位色被称为真彩色,它可以达到人眼分辨的极限,发色数是1677万多色,也就是2的24次方。,3.2 图象数据压缩基础,3.2.1 色彩的基本概念但32位色就并非是2的32次方的发色数,它其实也是1677万多色,不过它增加了256阶颜色的灰度,为了方便称呼,就规定它为32位色。少量显卡能达到36位色,它是24位发色数再加512阶颜色灰度。,3.2 图象数据压缩基础,3.2.1 色彩的基本概念至于对于32位色和16位色,肉眼能否分辨出来?其实如果你用两台品牌型号都一样的显示器,分别调不同的色,就能看出区
7、别,而如果只是一台机的反复转换就比较难分辨出来。WINDOWS XP启动时有个“欢迎使用”字样的界面,那里的兰色颜色过度就很容易看出区别,16位色的颜色过度很容易看出被分层了,不自然;而用32位色就相当柔和,过度很自然。,3.2 图象数据压缩基础,3.2.1 色彩的基本概念真彩色图像是一种用三个或更多字节描述像素的计算机图像存储方式。图像每一色光以8位元表示,每个通道各有256(28)种阶调,三色光交互增减,RGB三色光能在一个像素上最高显示24位1677万色(256*256*256=16,777,216),这个数值就是电脑所能表示的最高色彩。普遍认为人眼对色彩的分辨能力大致是一千万色,因此由
8、RGB形成的图像均称做真彩色。,3.2 图象数据压缩基础,3.2.1 色彩的基本概念真彩色图像还包含一个阿尔法通道(透明度通道)。因为有了Alpha通道,在屏幕上描绘半透明图像变得简单了,(这往往是对绘图硬件加速设备的要求)在电脑桌面上能更为轻而易举地实现半透明窗口、菜单渐隐和阴影等效果。虽然阿尔法通道对于显示缓冲来说没有意义,但是在现实系统中仍然使用着 32 位真彩色,这是因为在 32 位的位图中对于像素的寻址更加容易。对 24 位像素寻址需要乘以 3,这样比通过移位就可以实现的乘以 4 的计算量更大。,3.2 图象数据压缩基础,3.2.1 色彩的基本概念伪彩色(pseudo color):
9、每个像素的颜色不是由每个基色分量的数值直接决定,而是把像素值当作彩色查找表(color look-up table,CLUT)的表项入口地址,去查找一个显示图像时使用的R,G,B强度值,用查找出的R,G,B强度值产生的彩色称为伪彩色。,3.2 图象数据压缩基础,3.2.1 色彩的基本概念 彩色查找表CLUT是一个事先做好的表,表项入口地址也称为索引号。例如16种颜色的查找表,0号索引对应黑色,.,15号索引对应白色。彩色图像本身的像素数值和彩色查找表的索引号有一个变换关系,这个关系可以使用Windows 95/98定义的变换关系,也可以使用你自己定义的变换关系。使用查找得到的数值显示的彩色是真
10、的,但不是图像本身真正的颜色,它没有完全反映原图的彩色。,3.2 图象数据压缩基础,3.2.1 色彩的基本概念调配色(direct-color):每个像素值分成R,G,B分量,每个分量作为单独的索引值对它做变换。也就是通过相应的彩色变换表找出基色强度,用变换后得到的R,G,B强度值产生的彩色称为直接色。它的特点是对每个基色进行变换。,3.2 图象数据压缩基础,3.2.1 色彩的基本概念 用这种系统产生颜色与真彩色系统相比,相同之处是都采用R,G,B分量决定基色强度,不同之处是前者的基色强度直接用R,G,B决定,而后者的基色强度由R,G,B经变换后决定。因而这两种系统产生的颜色就有差别。试验结果
11、表明,使用直接色在显示器上显示的彩色图像看起来真实、很自然。这种系统与伪彩色系统相比,相同之处是都采用查找表,不同之处是前者对R,G,B分量分别进行变换,后者是把整个像素当作查找表的索引值进行彩色变换。,3.2 图象数据压缩基础,3.2.1 色彩的基本概念真彩色 好于 调配色 好于 伪彩色图象深度与显示深度关系:A 显示深度大于图象深度,屏幕色彩能真实反映图象色彩;B 显示深度等于图象深度,屏幕色彩基本真实反映图象色彩;B 显示深度小于图象深度,屏幕色彩不能真实反映图象色彩;,3.2 图象数据压缩基础,3.2.2 彩色空间及其变换RGB颜色模式RGB颜色模式是工业界的一种颜色标准,通过对红(R
12、),绿(G),蓝(B)3个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色。RGB即代表红,绿,蓝3个通道的颜色,这个标准几乎包括了人类视力所能感知的所有颜色,是目前运用最为广泛的颜色系统之一。电视机和计算机的监视器都是基于这种颜色模式。,3.2 图象数据压缩基础,3.2.2 彩色空间及其变换2 Lab颜色模式Lab模式是由国际照明委员会(CIE)于1976年公布的一种色彩模式。是CIE组织确定的一个理论上包括了人眼可见的所有色彩的色彩模式。Photoshop处理图像的内部色彩转换就是采用模式。,3.2 图象数据压缩基础,3.2.2 彩色空间及其变换2 Lab颜色模式Lab模式由三个通
13、道组成:第一个通道是明度,即“L”。a通道的颜色是从红色到深绿;b通道则是从蓝色到黄色。明度的变化是0到100,两个分量(a、b)的变化都是从-128到+127。当a=0、b=0时显示灰色,同时L=100时为白色,L=0时为黑色。,3.2 图象数据压缩基础,3.2.2 彩色空间及其变换2 Lab颜色模式,3.2 图象数据压缩基础,3.2.2 彩色空间及其变换2 Lab颜色模式Lab模式所定义的色彩最多,且与光线及设备无关并且处理速度与RGB模式同样快,比CMYK模式快很多。Lab模式弥补了RGB和CMYK两种色彩模式的不足。,3.2 图象数据压缩基础,3.2.2 彩色空间及其变换3 CMYK颜
14、色模式CMYK色彩模式是一种专门针对印刷业设定的颜色标准,是通过对青(Cyan)、洋红(Mageata)、黄(Yellow)、黑(blacK)四个颜色变化以及它们相互之间的叠加来得到各种颜色的,CMYK即是代表青、洋红、黄、黑四种印刷专用的油墨颜色,具体到印刷上,是通过控制青、洋红、黄、黑四色油墨在纸张上的相叠印刷来产生色彩的,它的颜色种数少于RGB色。,3.2 图象数据压缩基础,3.2.2 彩色空间及其变换3 CMYK颜色模式理想状态下,由100%的青,100%的品和100%的黄混合可以形成全黑色,但由于油墨有杂质等原因,实际应用效果不太理想,黑色不黑,而是深棕色,所以又增加了一个黑色通道K
15、来代替三种颜色,当K=100%时,其它三色就不起作用了,这样效果又好又能省油墨。RGB是通过自身发光来呈现色彩,而CMYK则是通过墨点反射光来呈现色彩。,3.2 图象数据压缩基础,3.2.2 彩色空间及其变换3 CMYK颜色模式大致上说:在表达色彩范围上,最全的是Lab模式,其次是RGB模式,最窄的是CMYK模式。也就是说Lab模式所定义的色彩最多,且与光线及设备无关。,3.2 图象数据压缩基础,3.2.2 彩色空间及其变换3 CMYK颜色模式以色彩为起点,通过从色彩丰富模式到简单模式的转换:,左:模式左:LAB到模式左3:到模式 右:到CMYK模式,3.2 图象数据压缩基础,3.2.2 彩色
16、空间及其变换4 HSB颜色模式HSB模式是基于人类感觉颜色的方式建立起来的,对于人的眼睛来说,能分辨出来的是颜色种类、饱和度和强度,而不是RGB模式中各基色所占的比例。HSB颜色就是根据人类对颜色分辨的直观方法,将自然界的颜色看作由色相(Hue)、饱和度(Saturation)、明亮度(Brightness)组成。色相指的是由不同波长给出的不同颜色区别特征,如红色和绿色具有不同的色相值;饱和度指颜色的深浅,即单个色素的相对纯度,如红色可以分为深红、洋红、浅红等;明亮度用来表示颜色的强度,它描述的是物体反射光线的数量与吸收光线数量的比值。,3.2 图象数据压缩基础,3.2.2 彩色空间及其变换5
17、 YUV颜色模式在现代彩色电视系统中,通常采用三管彩色摄像机或彩色CCD(点耦合器件)摄像机,它把摄得的彩色图像 信号,经分色、分别放大校正得到RGB,再经过矩阵变换电路得到亮度信号Y和两个色差信号RY、BY,最后发送端将亮度和色差三个信号分别进行编码,用同一信道发送出去。这就是我们常用的YUV色彩空间。,3.2 图象数据压缩基础,3.2.2 彩色空间及其变换5 YUV颜色模式采用YUV色彩空间的重要性是它的亮度信号Y和色度信号U、V是分离的。如果只有Y信号分量而没有U、V分量,那么这样表示的图就是黑白灰度图。彩色电视采用YUV空间正是为了用亮度信号Y解决彩色电视机与黑白电视机 的兼容问题,使
18、黑白电视机也能接收彩色信号。,3.2 图象数据压缩基础,3.2.2 彩色空间及其变换5 YUV颜色模式根据美国国家电视制式委员会(NTSC)制式的标准,当白光的 亮度用Y来表示时,它和红、绿、蓝三色光的关系可用如下式的方程描述:Y=0.3R+0.59G+0.11B 这就是常用 的亮度公式。色差U、V是由BY、RY按不同比例压缩而成的。如果要由YUV空间转化成RGB空间,只要进行 相反的逆运算即可。,3.2 图象数据压缩基础,3.2.2 彩色空间及其变换各颜色模式应用领域CMYK-印刷业 RGB-crt类监视器 HSB-传统技术工作的画家或设计者YUV Dvd、电视类输入分量,3.2 图象数据压
19、缩基础,3.2.3 图象数据压缩的可能性多媒体数据能被压缩的前提是数据存在冗余,冗余有如下类型:1 统计冗余:对于一串由许多数值构成的数据来说,如果其中某些值经常出现,而另外一些值很少出现,则这种由取值上的统计不均匀性就构成了统计冗余度,可以对之进行压缩。,3.2 图象数据压缩基础,3.2.3 图象数据压缩的可能性冗余有如下类型:2 空间和时间冗余:一幅视频图像相邻各点的取值往往相近或相同,具有空间相关性,这就是空间冗余度。图像的空间相关性表示相邻象素点取值变化缓慢。从频域的观点看,意味着图像信号的能量主要集中在低频附近,高频信号的能量随频率的增加而迅速衰减。时间冗余度表现在电视画面中相继各帧
20、对应象素点的值往往相近或相同,具有时间相关性。在知道了一个象素点的值后,利用此象素点的值及其与后一象素点的值的差值就可求出后一象素点的值。,3.2 图象数据压缩基础,3.2.3 图象数据压缩的可能性冗余有如下类型:3 信息熵冗余:也称编码冗余,如果图像中平均每个像素使用的比特数大于该图像的信息熵,则图像中存在冗余(来源于等长度编码)。4 结构冗余:是指图像中存在很强的纹理结构或自相似性。5 知识冗余:是指在有些图像中还包含与某些先验知识有关的信息。,3.2 图象数据压缩基础,3.2.3 图象数据压缩的可能性冗余有如下类型:6 视觉冗余:视觉冗余度是相对于人眼的视觉特性而言的。人眼对于图像的视觉
21、特性包括:对亮度信号比对色度信号敏感,对低频信号比对高频信号敏感,对静止图像比对运动图像敏感,以及对图像水平线条和垂直线条比对斜线敏感等。因此,包含在色度信号,图像高频信号和运动图像中的一些数据并不能对增加图像相对于人眼的清晰度作出贡献,而被认为是多余的,这就是视觉冗余度。,3.3 图象数据压缩算法,评价压缩算法的指标:1 压缩比:压缩编码后的数据量与原始数据大小的比值2 算法的复杂性和运算速度3 失真度数据编码类型:1 无损编码:解码后的数据与编码前的数据完全一致。2 有损编码:解码后的数据与编码前的数据有一定程度的偏差,但不影响其效果。,3.3 图象数据压缩算法,3.3.1 信息熵编码信息
22、熵编码是纯粹基于信号统计特性的编码技术,是一种无损压缩。熵编码的基本原理是给概率较大的符号赋予一个短码字,而给概率较小的赋予一个长码字,从而使得最终的平均码长很小。信息熵编码具体形式包括以下几种:,3.3 图象数据压缩算法,3.3.1 信息熵编码1 行程长度编码(Run Length Encoding):是Windows 系统中使用的一种图像文件压缩方法,其基本思想是:将一扫描行中颜色值相同的相邻像素用两个字节来表示,第一个字节是一个计数值,用于指定像素重复的次数;第二个字节是具体像素的值。主要通过压缩除掉数据中的冗余字节或字节中的冗余位,从而达到减少文件所占空间的目的。例如,有一表示颜色像素
23、值的字符串RRRRRGGBBBBBB,用 RLE 压缩方法压缩后可用 5R2G6B 来代替,显然后者的串长度比前者的串长度小得多。译码时按照与编码时采用的相同规则进行,还原后得到的数据与压缩前的数据完全相同。因此,RLE 是无损压缩技术。,3.3 图象数据压缩算法,3.3.1 信息熵编码行程长度编码特点:RLE所能获得的压缩比有多大,这主要是取决于图像本身的特点。如果图像中具有相同颜色的图像块越大,图像块数目越少,获得的压缩比就越高。反之,RLE对颜色丰富的自然图像就显得力不从心,在同一行上具有相同颜色的连续像素往往很少,而连续几行都具有相同颜色值的连续行数就更少。如果仍然使用RLE编码方法,
24、不仅不能压缩图像数据,反而可能使原来的图像数据变得更大。因此,具体实现时,需要和其它的压缩编码技术联合应用。,3.3 图象数据压缩算法,3.3.1 信息熵编码2 哈夫曼编码(Huffman Ecoding):是一种一致性编码法(又称熵编码法),用于数据的无损耗压缩。这一术语是指使用一张特殊的编码表将源字符(例如某文件中的一个符号)进行编码。这张编码表的特殊之处在于,它是根据每一个源字符出现的估算概率而建立起来的(出现概率高的字符使用较短的编码,反之出现概率低的则使用较长的编码,这便使编码之后的字符串的平均期望长度降低,从而达到无损压缩数据的目的)。这种方法是由发展起来的。,3.3 图象数据压缩
25、算法,3.3.1 信息熵编码2 哈夫曼编码(Huffman Ecoding)例如,在英文中,e的出现概率很高,而z的出现概率则最低。当利用哈夫曼编码对一篇英文进行压缩时,e极有可能用一个位(bit)来表示,而z则可能花去25个位(不是26)。用普通的表示方法时,每个英文字母均占用一个字节(byte),即8个位。二者相比,e使用了一般编码的1/8的长度,z则使用了3倍多。倘若我们能实现对于英文中各个字母出现概率的较准确的估算,就可以大幅度提高无损压缩的比例。,3.3 图象数据压缩算法,3.3.1 信息熵编码2 哈夫曼编码(Huffman Ecoding)哈夫曼编码的具体步骤归纳如下:概率统计(如
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教学课件 教学 课件 数字图象处理 技术
链接地址:https://www.31ppt.com/p-5658576.html