人眼视觉原理课件.ppt
《人眼视觉原理课件.ppt》由会员分享,可在线阅读,更多相关《人眼视觉原理课件.ppt(134页珍藏版)》请在三一办公上搜索。
1、精品课件,2022/12/31,第一章 数字视频基础,1.0. 视频应用1.1. 人类视觉系统与模型1.2. 彩色模型1.3. 数字视频基础1.4. 多维随机信号分析,精品课件,视频应用,精品课件,视频应用,图像与视频信号处理无所不在,精品课件,视频应用,精品课件,目标的检测与识别,精品课件,图像与视频拼接,普通相机视场:50350,人眼视场:2001350,全景拼接(Panoramic Mosaic):3601800,精品课件,运动视频分析系统,精品课件,运动视频分析系统,精品课件,运动视频分析系统,精品课件,1.1. 人眼的视觉特性与模型,精品课件,2022/12/31,1.1. 人眼的视
2、觉特性与模型,人眼的构造视网膜的结构(杆状细胞,锥状细胞)视细胞的分布人眼的视觉特性视觉的适应绝对视觉阈阈值对比度光谱灵敏度分辨力视觉系统的调制传递函数,精品课件,2022/12/31,视网膜,视网膜的结构杆状细胞锥状细胞视细胞的分布,精品课件,2022/12/31,视觉的适应,明视觉暗视觉中介视觉颜色适应,精品课件,2022/12/31,人眼的视觉特性,绝对视觉阈:全黑视场下,人眼感觉到的最小光刺激值,约109 lx量级。阈值对比度:时间不限,使用双眼探测一个亮度大于背景亮度的圆盘,察觉概率为50%时,不同背景亮度下的对比度。对比度C:当Lt和Lb分别为目标与背景的亮度时,对比度表示为:,由
3、于背景亮度、对比度和人眼所能探测的目标张角三者之间存在制约关系(Wald定律),特别是在目标张角7,时,存在Rose定律:,精品课件,2022/12/31,人眼的视觉特性,光谱灵敏度(光谱光视效率):人眼对各种不同波长的辐射光有不同的灵敏度(响应),对大量正常视力观察者的实验表明:在较明亮环境中,人眼视觉对波长0.555m左右的绿光最敏感;在较暗条件下,人眼视觉对波长0.512m左右的黄绿光最敏感;右图给出不同视场亮度下,人眼的光谱光视效率曲线:,人眼的分辨力:人眼能区分两发光点的最小角距离称为极限分辨角,其倒数为人眼分辨力。从内因分析,影响分辨力的因素为眼睛的构造。从外因分析,是目标的亮度与
4、对比度。人眼会根据外界条件自动进行适应,从而可以得到不同的极限分辨角。,精品课件,人眼观察物体的要求,灵敏度:以量子阈值表示时,最小可探测的视觉刺激是58145个蓝绿光(波长为0.51m)的光子轰击角膜引起的,据估算,这一刺激只有514个光子实际到达并作用于视网膜上。 分辨力:对比度:图案不同,对对比度的要求也不同(如点与点:26;方波条纹之间:3)信噪比:人眼观察物体需要排出干扰,如果干扰太大将影响到人眼的观察效果。图案不同,人眼对信噪比的要求不同(如方波图案:11.5左右;余弦图案:33.5左右),10-6lx,10-5lx,10-4lx,10-3lx,精品课件,光波与颜色,波长与颜色关系
5、,次声波,声波,无线电波,微波,红外线,红色光,紫色光,紫外线,X射线,可见光,可见光频率范围:红 橙 黄 绿 兰 紫 4.3X1014Hz-7.5X1014,精品课件,光波与颜色,由红绿蓝三色组成的颜色,精品课件,光的特征,色调:主频率 决定颜色亮度 单位时间、单位角度、单位投射面上光源幅射能量饱和度:纯度 该频率的颜色表现 能量分布,能量E,频率,红,紫,白色光,某主频光,纯度 依赖于Ed与Ew差别Ew=0 纯度100%Ed=Ew 纯度0,Ew,Ed,红,紫,精品课件,RGB三基色,RGB三基色基本颜色 可用来生成其他颜色的两种或三种颜色Blue=435.8nmGreen=546.1nmR
6、ed=700nm二次色品红(magenta):红+蓝青(cyan):蓝+绿黄(yellow):红+绿补色,精品课件,标准基色和色度图,原色:如果将X,Y,Z三种颜色适当混合即可产生 白色效果,而其中两种颜色组合不能产生第三种颜色,这三种颜色称为原色。即红、绿、兰为原色。,实验发现,很多颜色的光无法用RGB三种原色组合获得。例如,500nm颜色=G+B-RRGB彩色监视器无法获得,精品课件,标准基色和色度图,XYZ颜色模型CIE(国际照度委员会)X,Y,Z表示产生一种颜色所需要的三基色的量,X=0.4902R+0.3099G+0.1999B Y=0.1770R+0.8123G+0.0107B Z
7、=0.0000R+0.0101G+0.9899B x, y, z:色系数,精品课件,2. 标准基色和色度图,CIE色度图作用:为不同基色组比较整个颜色范围 标识互补颜色 确定颜色主波长和纯度,精品课件,2. 标准基色和色度图,精品课件,2. 标准基色和色度图(续),精品课件,3. RGB颜色模型,R(红)G(绿)B(蓝)(0,0,0)代表黑色,(1,1,1)代表白色一种颜色,精品课件,3. RGB颜色模型,R(红)G(绿)B(蓝)(0,0,0)代表黑色,(1,1,1)代表白色一种颜色,精品课件,3. RGB颜色模型,R(红)G(绿)B(蓝),0.8,0.7,0.1,0.2,0.7,精品课件,C
8、MY(青、品红、黄)、CMYK (青、品红、黄、黑)运用在大多数在纸上沉积彩色颜料的设备,如彩色打印机和复印机 CMYK 打印中的主要颜色是黑色 等量的CMY原色产生黑色,但不纯 在CMY基础上,加入黑色,形成CMYK彩色空间,精品课件,4. CMY颜色模型,RGB是加色模型,CMY是减色模型,精品课件,5. HSI颜色模型,面向视觉感知的颜色模型 HSI(色调hue、饱和度saturation、亮度intensity) 两个特点: I分量与图像的彩色信息无关 H和S分量与人感受颜色的方式是紧密相连的 将亮度(I)与色调(H)和饱和度(S)分开,避 免颜色受到光照明暗(I)等条件的干扰, 仅仅
9、分 析反映色彩本质的色调和饱和度 广泛用于计算机视觉、图像检索和视频检索,精品课件,5. HSI颜色模型,H(色调): 为角度,从0到360;S(色饱和度) : 从0到1,S0时只有灰度; I(明度): I从0到1, I0是黑色, I=1是白色,精品课件,RGB ,精品课件,RGB图像同与之对应的HIS图像,精品课件,HIS RGB,精品课件,彩色图象的R,G,B和H,S,I各分量的图示,下图给出1组用灰度图形式表示彩色图象的例子,其中图(a),图(b),图(c)分别为1幅彩色图象的R,G,B分量(每个分量用8 bit表示),图(d),图(e),图(f )分别为这幅彩色图象的H,S,I分量(每
10、个分量也各用8 bit表示)。,精品课件,1.3. 数字视频基础,模拟视频与数字视频视频(Video)最初是在电视系统中提出的;20世纪20年代后期,光电管及阴极射线管为核心技术的全电子电视系统问世后,才有真正意义上的视频,即黑白视频;在不考虑电视调制发射和接收等诸多环节,仅考虑和研究电视基带信号的摄取、改善、传输、记录、编辑、显示的技术就叫做“视频技术”;主要应用于广播电视的摄录编系统、安全及监控、视频通信和视频会议、远程教育及视听教学、影像医学、影音娱乐和电子广告等行业和领域。,精品课件,1.3. 数字视频基础,视频:动态图像,是一组图像按时间顺序的连续展示,按信号组成和存储方式的不同:,
11、模拟视频:是由连续的模拟信号组成的图像序列,像电影、电视和录像的画面;,数字视频:是一系列连续的数字图像序列;,精品课件,帧:一段视频中的每一幅图像称为一帧;,根据视觉暂留原理,要使人的视觉产生连续的动态感觉,每秒钟图像的播放帧数要在2430(帧频);,帧频:每秒播放的帧数,精品课件,图像序列构成视频,精品课件,数字视频,广义的数字视频是指依据人的视觉暂留特性,借助计算机或微处理器芯片的高速运算,加上Codec技术、传输存储技术等来实现的以比特流为特征的,能按照某种规律和标准在显示终端上再现活动影音的信息媒介;狭义的数字视频是指与具体媒体格式所对应的数字视频,如DV格式数字视频、DVD光盘格式
12、数字视频、AVI桌面格式数字视频、RM流媒体格式数字视频、MP4固体存储数字视频等。,精品课件,精品课件,低通滤波器容许低频信号通过, 减弱(或减少)频率高于截止频率的信号的通过。,精品课件,取样(采样)将时间和幅度上连续的模拟信号转变为时间离散的信号,即时间离散化。,取样频率至少是模拟信号最高频率的两倍。一般选在2.5倍左右。,精品课件,量化将幅度连续信号转换为幅度离散的信号,即幅度离散化。度量每一个取样值,归类于设定的量化电平中的一个电平。量化电平越细,失真程度越低,数字化后的比特率越高。反之,相反。一般来说,二进制方式,其量化比特为8的话,其量化电平数为28,即256个量化电平。ITU-
13、601标准规定,演播室用量化位数为10bit,用于传输的量化位数为8bit,精品课件,编码按照一定的规律,将时间和幅度上离散信号用对应的二进制或多进制代码表示。,2比特码 8比特码(4个) (256个) 11 10001011 10 10001010 01 10001001 00 10001000,以上是分别用2和8比特码量化的电平。根据取样的量化电平数,确定量化比特码数。,精品课件,视频数字化将视频信号经过视频采集卡转换成数字视频文件存储在数字载体中。 下面以计算机广泛采用的数字化技术,即flashA/D变换器来具体看一下数字化工作情况:,将图像分成栅状,每个小格子代表像素,且位置确定。Fl
14、ash变换器对每个像素取样,量化、编码后,将这些数据存储到存储器中。计算机技术中,一个字节可以表示0255范围内的值,但作为视频信号幅度,只能在0100 IRE单位之间。,注:IRE是视频测量中的单位,广播级视频电平规定了任何视频信号在播放时的亮度电平都不能超过100 IRE。,精品课件,视频分辨率,视频质量通常用线分辨率来度量; 本质上是表示在显示器上可以显示多少不同的黑白垂直线;,精品课件,标准清晰度,标准清晰度视频通常定义为480或576的隔行有效扫描线的视频,分别称为“480i”和“576i”; 固定像素(非CRT)、具有4:3宽高比的消费类显示器通过转换后,对应于720480i或72
15、0576i的有效分辨率; 对于16:9的宽高比,转换后的有效分辨率对应于960480i或960576i。,精品课件,增强清晰度,增强清晰度视频通常定义为480或576的逐行有效扫描线的视频,分别称为“480p”和“576p”; 固定像素(非CRT)、具有4:3宽高比的消费类显示器通过转换后,对应于720480p或720576p的有效分辨率; 对于16:9的宽高比,转换后的有效分辨率对应于960480p或960576p。,精品课件,高清晰度,高清晰度视频通常定义为具有720逐行(720p)或1080隔行(1080i)有效扫描线的视频; 固定像素(非CRT)、具有16:9宽高比的消费类显示器通过转
16、换后的有效分辨率对应于1280720p或1280 1080i;,精品课件,视频质量评估与方法,数字视频的质量直接反映了用户使用视频通信业务时的主观感受,因而要求采用合理的标准对视频质量进行快速、准确的评价;图像质量评价标准视频传输质量评估,精品课件,图像质量评价标准,主观评价观察者打分统计计算平均值作为评价结果(平均评价分值,MOS);双刺激连续质量分级法交替播放待评估序列和基准序列进行直接质量比较,观察者打分,平均值作为评价结果(最大程度降低图像场景情节对评测影响);单刺激连续质量评价方法只播放待评价序列,观察者观看同时根据评分表打分。,精品课件,图像质量评价标准,客观测量相对评估和绝对评估
17、 相对评估:将压缩或经传输的视频与原始视频比较以获得相对评估指标值,由此评估图像质量;一般用于视频制作时的质量评估,准确性高;均方根误差(MSE)峰值信噪比(PSNR) 绝对评估:直接对压缩或经传输的视频进行评估获得指标值,由此评估图像质量;一般在线观看测试,准确性稍低。,精品课件,视频传输质量评估,在通信和互联网应用中信源端和接收端对图像质量主要影响因素:可用带宽:衡量用户从网络取得互联网视频应用数据的能力;延时:延迟超出缓存能力时,会发生丢包,影响图像质量;丢包:导致图像质量劣化的最根本原因;码率波动:播放视频时接收端要求稳定码流,码率波动过大会导致解码器主动丢包以保证前后视频质量一致,引
18、起质量下降。,精品课件,视频传输质量评估,评估主观视觉效果:图像跳跃:由于网络拥塞造成丢包使图像帧间运动不平滑,有类似快进现象;块效应:由于传输误码造成的,是所有基于DCT技术压缩都可能出现的现象;模糊度:由于编码器为了适应固定码率而产生的,图像高频细节部分丢失造成图像边缘模糊;噪声:由于采集和存储图像过程中,高频细节劣化产生的附加像素点。,精品课件,彩色电视制式,NTSC彩色电视制式是1952年美国国家电视标准委员会定义的彩色电视广播标准,称为正交平衡调幅制。美国、加拿大等大部分西半球国家,以及日本、韩国、菲律宾等国和中国的台湾采用这种制式。,精品课件,彩色电视制式,德国在1962年制定了P
19、AL彩色电视广播标准,称为逐行倒相正交平衡调幅制。德国、英国等一些西欧国家,以及中国、朝鲜等国家采用这种制式。法国制定了SECAM彩色电视广播标准,称为顺序传送彩色与存储制。法国、前苏联及东欧国家采用这种制式。世界上约有65个地区和国家试验这种制式。,精品课件,彩色电视制式,NTSC制、PAL制和SECAM制都是互不兼容的电视制。NTSC制、PAL制和SECAM制都是彩色和黑白兼容的制式,这里的“兼容”有两层意思:一是指黑白电视机能接收彩色电视广播,显示的是黑白图像,另一层意思是彩色电视机能接收黑白电视广播,显示的也是黑白图像,这叫逆兼容性。,精品课件,兼容性实现,必需采用与黑白电视相同的一些
20、基本参数,如扫描方式、扫描行频、场频、帧频、同步信号、图像载频、伴音载频等等。需要将摄像机输出的三基色信号转换成一个亮度信号,以及代表色度的两个色差信号,并将它们组合成一个彩色全电视信号进行传送。在接收端,彩色电视机将彩色全电视信号重新转换成三个基色信号,在显象管上重现发送端的彩色图像。,精品课件,电视扫描,扫描方式有隔行扫描和逐行扫描之分。黑白电视和彩色电视都有隔行扫描,而计算机显示图像时一般都采用逐行扫描。在隔行扫描方式中,隔行扫描要求第一场结束于最后一行的中间,不管电子束如何折回,它必须回到显示屏顶部的中央,这样就可以保证相邻的第二场扫描恰好嵌在第一场各扫描线的中间。,精品课件,在隔行扫
21、描方式中,电子束扫完第1行后从第3行开始扫,接着扫第5行,7行、,一直扫到最后一行的中间。奇数行扫完后以同样的方式扫描偶数行,这样就完成了一帧的扫描。由此可见,隔行扫描的一帧图像是由两部分组成:一部分是由奇数行组成,称奇数场,另一部分是由偶数行组成,称为偶数场,两场合起来组成一帧。因此在隔行扫描中,无论是摄像机还是显示器,获取或显示一幅图像都要扫描两遍才得到一幅完整的图像。,逐行扫描,隔行扫描,在逐行扫描方式中,电子束从显示屏的左上角一行接一行地扫到右下角,在显示屏上扫一遍就显示一幅完整的图像。,精品课件,1.逐行扫描,精品课件,2.隔行扫描,精品课件,精品课件,精品课件,电视扫描术语,每秒钟
22、扫描多少行称为行频fH;每秒钟扫描多少场称为场频ff;每秒扫描多少帧称帧频fF。ff和fF是两个不同的概念。,精品课件,PAL电视制式的扫描特性,625行(扫描线)/帧,25帧/秒(40 ms/帧) 高宽比(aspect ratio):4:3 隔行扫描,2场/帧,312.5行/场颜色模型:YUV,精品课件,制式的含义,一帧图像的总行数为625,分两场扫描。行扫描频率是15 625 Hz,周期为64s;场扫描频率是50 Hz,周期为20 ms;帧频是25 Hz,是场频的一半,周期为40 ms。在发送电视信号时,每一行中传送图像的时间是52.2s,其余的11.8s不传送图像,是行扫描的逆程时间,同
23、时用作行同步及消隐用。每一场的扫描行数为625/2=312.5行,其中25行作场回扫,不传送图像,传送图像的行数每场只有287.5行,因此每帧只有575行有图像显示。,精品课件,精品课件,NTSC制的扫描特性,525行/帧, 30帧/秒(29.97 fps, 33.37 ms/frame) 高宽比:电视画面的长宽比(电视为4:3;电影为3:2;高清晰度电视为16:9) 隔行扫描,一帧分成2场(field),262.5线/场 在每场的开始部分保留20扫描线作为控制信息,因此只有485条线的可视数据。每行63.5s,水平回扫时间10s (包含5s的水平同步脉冲),所以显示时间是53.5s颜色模型:
24、YIQ,精品课件,彩色电视信号特点,彩色电视中,用Y、C1, C2彩色表示法分别表示亮度信号和两个色差信号,C1,C2的含义与具体的应用有关:在NTSC彩色电视制中,C1,C2分别表示I、Q两个色差信号;在PAL彩色电视制中,C1,C2分别表示U、V两个色差信号;在CCIR 601数字电视标准中,C1,C2分别表示Cr,Cb两个色差信号。色差是指基色信号中的三个分量信号(即R、G、B)与亮度信号之差。如:R-Y和B-Y .,精品课件,彩色电视信号的类型,复合电视信号分量电视信号S-video信号,精品课件,复合视频信号,定义为包括亮度和色度的单路模拟信号,也即从全电视信号中分离出伴音后的视频信
25、号,这时的色度信号还是间插在亮度信号的高端。由于复合视频接口的传输仍然是一种亮度色度混合的视频信号,仍然需要显示设备对其进行亮/色分离和色度解码才能成像,这种先混合再分离的过程必然会造成色彩信号的损失,色度信号和亮度信号也会有很大的机会相互干扰从而影响最终输出的图像质量。,复合电视信号,精品课件,复合电视信号,精品课件,复合视频信号接口又称为AV端子或Video端子,莲花线,精品课件,S-Video信号,分离电视信号S-Video(Separated video-VHS)是亮度和色差分离的一种电视信号,是分量模拟电视信号和复合模拟电视信号的一种折中方案。使用S-Video有两个优点:减少亮度信
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 视觉 原理 课件
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-2008015.html