DVIP01数字图像基础.ppt
《DVIP01数字图像基础.ppt》由会员分享,可在线阅读,更多相关《DVIP01数字图像基础.ppt(115页珍藏版)》请在三一办公上搜索。
1、第01章 数字图像基础Foundation of DIP,门爱东教授,第1章 数字图像基础,人眼的构造视觉心理学视觉感知特性黑白视觉的数学模型二维空间频率与视频时间信号谱线性移不变滤波器傅里叶变换矩阵表示随机过程及其分类随机场的相关模型随机场的线性系统模型一阶因果模型图像的逼真度,2,1.1人眼的构造,眼睛的主要结构如图1.1所示。外面是一层较硬的膜,其前面一部分是透明的,称为角膜。后面大部分称为巩膜,起外壳作用。膜内是一个空室,称为前室。前室后面是虹膜,虹膜中间有一小孔,称为瞳孔,其直径可在2到8mm间变化,以调节进入眼睛的光通量。瞳孔后面是一个透镜式的水晶体,起透镜作用,把景象的光聚焦到视
2、网膜上去成像。水晶体的后面是眼睛的内腔,称为后室,内有粘液,也起滤光作用,以保护眼睛。后壁则为视网膜,由大量的光敏细胞组成。,人眼的构造,光敏细胞可分为两类,一类是锥状细胞,另一类是杆状细胞。锥状细胞大约有一亿个以上。它们在视网膜上的分布是很不均匀的,在视网膜中央正对着瞳孔的一个不大的区域里,锥状细胞最多最密,没有杆状细胞,这一区域叫做黄斑。向外离开黄斑越远,视网膜上杆状细胞的数目越多,在接近边缘的地方,几乎都是杆状细胞了。锥状细胞除了能够区别明暗以外,还能辨别光的颜色,即不但能感光,也能感色。但是,杆状细胞却只能感光,不能感色。在亮光时,锥状细胞起作用,能看清彩色景象。,人眼的构造,在黄斑的
3、中心部分,每个锥状细胞连接着一个神经末梢,因此分辨景象细节的能力强。在远离黄斑的网膜上,神经末梢分布较稀疏,锥状和杆状细胞群接合在一条神经上,所以这些视神经所传递的是这二种细胞群受光刺激后发出的平均电脉冲,故分辨能力差,但是感光灵敏度却高些。视神经在视网膜上汇聚到一点,通向大脑,此点无光敏细胞,称为盲点。视觉是主观对客观的反应,是一种主观感觉。视觉包括光感觉与色感觉,色感觉又有色调与色饱和度之分。色调即颜色的类别,色饱和度指某种颜色的浓度。,1.2视觉心理学 视觉感知特性,从视觉生理学(psychophysics)的角度,人眼的视觉系统可以被看成一个输入-输出系统,输入是视觉刺激(visual
4、 stimuli),输出是感觉。显然,视觉系统完全可以由这个“黑盒子”的传输函数来定义。光强的感知特性空间频率的感知特性时间的感知特性,光强的感知特性,定义1:在给定某个亮度环境下,人眼刚好能够区分的2个相邻区域的亮度差别的最小值,称为视觉阈(Visibility Threshold)。视觉阈值的大小与观察条件(例如周围环境的亮度、邻近区域亮度的变化等)有关。,考虑图1.2(a)所示情况,其中环境亮度为,图的中间有一个张角为、亮度为 的环,环内包围着一个亮度为 的小区域。调节的 大小使其刚好能被察觉到与 有所不同,则 为视觉阈,或者称为临界对比度。它与背景亮度和环境亮度,以及背景和环境的尺寸大
5、小有关。如图1.2(b)所示。在 的情况下,视觉阈 几乎随 线性增长,即 为常数,这就是韦伯定律(Webers law)。,根据韦伯定律,(1.1)所以(1.2)(1.2)表明人眼对光的主观视觉增量与客观亮度的对数增长成线性关系,即,如图1.3中直线部分所示。,图1.3是实验获得的人眼对不同亮度的主观亮度感觉级数曲线。曲线中间有折断点,表示两种细胞的感觉不一样。亮度低时杆状细胞起作用。亮度高时锥状细胞起作用,在某些亮度时二者同时起作用。每一种细胞的感觉曲线的中间部分都近于直线,这表示感觉差一级时,亮度的差 并不是常数,而 是常数。也就是说,当亮度大时,二者的差别 也要大才能感觉到亮度的差别。但
6、在亮度很大或很小时,则与每一感觉级相对应的 要更大一些,示如曲线两端的弯曲部分。,定义2:眼睛所能感觉到的亮度级差(1.3)称为对比度阈,常称韦伯比(Weber Ratio)。韦伯比表示相对某一亮度能引起亮度感觉差别所必需的最小相对亮度变化。在对视频信号的亮度分量进行PCM数/模转换时,通常就是根据上述的视觉阈效应来选择合适的量化级数。,另一方面,图1.3的亮度感觉曲线还表明人眼的视觉范围是非常宽阔的,它能感觉亮度低至千分之几cd/m2的光,也能感受亮度高至百万cd/m2的光,差别达 这样大的视觉范围是由于眼睛有适应性。这是人眼适应性的第一种表现 在实际条件下观看某一景象时,眼睛已适应于景象的
7、某一平均亮度,也就是说已调节到某一平均灵敏度,这时视觉范围就小多了。这是人眼适应性的第二种表现,它说明人眼是绝不可能同时观看图1.3所示那么大的视觉范围的.,实验证明,在平均亮度一定时,人眼能观察到亮度差别(即景象层次)的范围如图1.4中虚线所示,图中按不同的平均亮度给出了相应的范围。可见,当平均亮度 为一定值时,大约在它周围 的范围内,对比度阈保持在比较小的数值,人眼有区别亮度层次的能力。图1.4的曲线还表明,由于人眼的适应性,对于明暗的感觉是相对的,同一个亮度,在某种平均亮度下可能给人以白的感觉,但在更高的平均亮度下却可能给人以黑的感觉。因此,对于一副景象,重要的是体现其相对的明暗层次。利
8、用这一原理,电视实现了比自然景象亮度范围小得多的景象视觉。,空间频率的感知特性,空间频率是指单位视角()内所含黑或白的条纹数,单位是线/度。假设人眼的视觉系统是一个线性系统,如果已知该系统的冲击响应或者传输函数,则可以计算出给定背景亮度下的视觉阈值。如果用不随时间变化的空间正弦光栅作为人眼的测试信号,即(1.4)则可以得到视觉阈随空间频率变化的函数。例如图1.5所示的曲线是在背景亮度为500cd/m2的条件下得到的。这个函数被称为对比度灵敏度函数(Contrast Sensitivity Function)。它具有特定的形状,空间频率在3-4.5 Cycles/degree时有最大值,即最小对
9、比度阈。,值得说明的是,图1.5实际上不是视觉阈对空间频率的函数,而是对比度灵敏度对空间频率的函数。对比度灵敏度的定义是,平均背景亮度 与测试信号达到视觉阈时的调制电平 的比;或者说是对比度阈 的倒数。在(1.4)式中,是背景亮度,是正弦光栅的空间频率,是空间频率偏离纵轴的角度,是调制电平,是时间频率。对于给定的,通过调整 得到在、和 的各种取值情况下的视觉阈。图1.6(a)给出一种测试光栅图样,图1.6(b)是前人的各种实验得出的对比度灵敏度函数曲线。可得到如下结论:,(1)给定光栅的 和,视觉阈主要取决于调制深度,而不单单取决于背景亮度 或调制电平。(2)对比度灵敏度,即达到视觉阈时 的值
10、,随着空间频率 从低频到中频近似线性地增大,并在中频区段取得最大值。从图1.6(b)可见,在空间频率的方向上,人眼对亮度的作用相当于一个带通或低通滤波器(3)对比度灵敏度还与光栅的角度 有关。它在垂直或水平光栅时取得最大值,随着光栅偏离水平或垂直轴而减小,在 角时大约减小3dB。(4)图1.7给出了视觉对彩色变化的频率响应。由图可见,人眼对亮度的空间分辩力明显地比对色度的空间分辨力要高。因此,在图像及视频传输时就可以使用较少的比特数来传输色度信号,以达到压缩数据量、节省带宽资源的目的。,视觉的空间掩蔽(spatial masking)效应也发生在空间频域。实验发现,背景亮度变化(不均匀性)剧烈
11、时,对比度灵敏度就会下降,即视觉阈增大。这被称为空间掩蔽效应。图1.8、1.9给出了典型的实验结果。在该试验中,一条很细的垂直光线出现在有一条垂直亮度边界的背景的不同位置上,这条光线在不同位置上的视觉门限(即光线刚好能被识别时的亮度值)曲线如图1.8所示。,关于空间掩蔽效应,一些相关实验得出的几点重要结论如下:(1)在接近边界的两边,光线的视觉阈增大。(2)在对比度 较小的边界附近,掩蔽效应也较弱。(3)从图1.9可以看出掩蔽效应是一种非常局部化的效应,仅出现在背景亮度剧烈变化的边界附近很窄的区域上。(4)若背景掩蔽边缘出现的时间很短,则视觉阈不会有明显的提高。例如无意识的眼运动就是这种情况。
12、现代压缩编码中无例外的都利用了人眼的视觉掩蔽效应。例如,使用不均匀量化步长(step size)的DPCM量化就是依赖于亮度的空间变化对误差的掩蔽。又如,对噪声的主观感受受图像内容的影响,在图像亮度跳变边沿处,视觉阈增高。即此处噪声的可见度降低。在图像大面积处(亮度变化缓慢),视觉阈降低,即对噪声敏感。,需要强调的是,不应把空间掩蔽效应与马赫效应(Mach effect)混淆。马赫效应指的是在边界处感知到的亮度的变化,如图1.10所示,在较亮的一侧亮度明显地增大,而在较暗的一侧亮度明显地减小。因此,感知到的对比度增大,亮的一侧更亮,暗的一侧更暗。通常认为,人眼的横向抑制(lateral inh
13、ibition)作用是导致马赫效应的主要原因。,时间的感知特性,视觉系统的时域特性研究的是外界亮度以不同的时间频率进行变化时,人眼的视觉敏感度。时域中的视觉阈值对于帧间编码技术十分重要。其中一个重要的时域视觉阈值就是临界闪烁频率(Critical Flicker Fusion Frequency)。如果让观察者观察按时间重复的亮度脉冲,当脉冲重复频率不够高时,人眼就有一亮一暗的感觉,称之为闪烁(Flicker)。如果重复频率足够高,闪烁感觉消失,看到的则是一个恒定的亮点。闪烁感刚好消失时的频率称为临界闪烁频率。临界闪烁频率在图像与视频处理中应用的非常广泛,视频采集和显示设备的帧率必须大于临界闪
14、烁频率,以避免人眼觉察到闪烁现象。,1.3黑白视觉的数学模型,光线进入人眼首先要经过由角膜、晶状体组成的前端光学系统,其功能相当于一个二维低通光学镜头,系统函数为。在电磁波谱范围内,分布在约380780nm波长范围的电磁波可以被人类视觉感知,称为可见光。人眼对不同波长光的敏感程度并不相同,该特性用视觉系统的相对光效率函数 描述,如图1.12所示。来自光分布函数为 的空间物体的光经过人眼空间响应之后的输出空间分布函数为:(1.5),接下来,杆状细胞和锥状细胞的作用是使人眼对亮度的对比度进行分辨而不是亮度本身,用非线性函数 表示,输出为对比度。最后视觉细胞中的横向抑制效应可用空间频率相应为 的空不
15、变(spatially invariant)的、各向同性的、线性系统来表示,输出是神经信号,即人眼感受到的主观亮度。人眼的黑白系统的总体模型如图1.13所示:,1.4二维空间频率与视频时间信号谱,二维空间频率,数字图像是分布在二维空间的样值阵列,因此需要研究其二维空间频率。以下我们通过几个二维空间信号的例子来直观的了解二维空间频率的概念,视频时间信号及频谱,1、二维取样的定义 视频信号通常在摄像机的输出端,通过扫描二维的运动场景,并将其转化为一维的电信号来产生。运动场景是一组图片或图像,每幅被扫描的图像生成一帧视频信号。扫描从图像的左上开始,到右下结束,如图1.16所示。恒速扫描定义为从左至右
16、的扫描速率为,从上至下的扫描速率为,即:(1.7)(1.8)其中,H是行周期,F是帧周期;a、b分别是图像宽度和高度。,线性恒速扫描等效为将图像在x方向及y方向上无限重复地取样,从而将二维图形变为一维时间信号。图1.17是逐行扫描和隔行扫描。,2、频谱分析,1.5、线性移不变滤波器,用 表示,线性系统,移不变系统,线性移不变(LSI)系统,离散卷积的直接运算,1.6 傅立叶变换,二维离散图像信号的付氏变换及其特性 离散信号的展开,二维离散图像信号的付氏变换及其特性,二维离散图像信号的付氏变换和反变换如下:(1.19a)(1.19b)其中,m、n为空间坐标,k、l为空间频率。k、l的单位是m、n
17、的单位的倒数。,二维离散图像信号的付氏变换及其特性,下面介绍二维离散图像信号的付氏变换的一些特性。(1)空间频率 在节已讲述二维连续空间信号的空间频率的概念。对于二维离散的亮度信号,空间频率就是空间单位距离内亮度的变化数,有时用cycles/degree(观察角)来表示。(2)可分离性 从式(1.19a)可知,付氏变换的基核是可分离的,即可以对m和n分别作变换:,二维离散图像信号的付氏变换及其特性,(3)传输函数及特征函数(特征矢量)特征函数的定义:用特征函数做输入,则输出等于此输入函数乘传输函数(它是频率的函数,即传输函数)。容易证明,是满足以上定义的特征函数。,二维离散图像信号的付氏变换及
18、其特性,(4)两函数卷积等于两函数付氏变换之积。若 则,(5)能量保持 若 是 的傅立叶变换,则。(6)由付氏变换的相位函数恢复原图像 若是的傅立叶变换,则用相位幅度的形式表示为:,二维离散图像信号的付氏变换及其特性,从相位恢复的信号为:从幅度恢复的信号为:其中,是傅立叶反变换运算符。实践表明,比 更像原始图像。,1.6.2 离散信号的展开,用基函数作信号的展开,可实现各种正交变换(付氏变换及小波变换),进一步易于用滤波器组(filter bank)实现。离散信号展开的原理:是平方可积序列,则在平方可积空间 中 可正交展开为:其中,是 的变换。基函数 满足正交条件:,离散信号的展开,正交展开的
19、一个重要特性是能量保持:(1.22),离散信号的展开,作为数字图像处理中常用的工具,我们在这里考察傅立叶变换的离散性和周期性在时域与变换域中的对应关系。根据不同的组合列表如下:,傅立叶变换,(1)傅氏级数 给定平方可积周期函数,其周期为T,即,则它可表示为频率为 的复指数函数的线性组合:(1.23a)其中,(1.23b),傅立叶变换,(2)傅氏变换 给定绝对可积函数,它的傅氏变换:(1.24a)其反变换:(1.24b),傅立叶变换,(3)离散时间傅氏变换 给定序列 为平方可积的,其基函数为,(1.25a)它以 为周期,其逆变换为:(1.25b),傅立叶变换,(4)离散时间傅氏级数 若离散时间序
20、列是周期为N的信号,即,基函数为,则 的离散时间傅氏级数表示为:(1.26a)其中,(1.26b)(1.27),傅立叶变换,此时两卷积为周期卷积 其中 和 等于 和 的一个周期。即。以上四种傅氏变换/级数的时域和频域波形示意图如图所示。,傅立叶变换,傅立叶变换,(5)离散傅氏变换 有限长的离散时间序列 的傅氏变换叫离散傅氏变换(DFT),可实现FFT,基函数为,则 的离散傅氏变换为(1.29a)逆变换(1.29b)其中。,1.7 矩阵表示,1.7.1 二维图像的矩阵向量表示1.7.2 卷积的矩阵向量积表示1.7.3 图像在计算机中的表示及处理,1.7.1 二维图像的矩阵向量表示,将二维图像写成
21、向量形式,便于利用一维信号处理方法。二维图像的坐标表示到矩阵表示的映射如图1.23所示。,1.7.1 二维图像的矩阵向量表示,二维图像的行列矩阵表示为:,1.7.1 二维图像的矩阵向量表示,用列(或行)向量 表示。,1.7.2 卷积的矩阵向量积表示,用矩阵向量表示卷积,如图1.24所示。由扫描矩阵 得到,由扫描 得到。卷积的矩阵向量表示为:(1.30)其中 是 维的矩阵。与系统的冲击响应有关,关系在后页分析。,1.7.2 卷积的矩阵向量积表示,(1)一维的情况 若 与 长度不同,分别为 和,即 用补零的方法将它们变为长度。于是有线性卷积:(1.31),1.7.2 卷积的矩阵向量积表示,写为矩阵
22、形式:或者,(1.32)其中,的构成元素 取决于,满足(1.33)这就是Toeplitz矩阵。,1.7.2 卷积的矩阵向量积表示,对于因果系统有,所以为实现快速算法,在 NM1+M2-1时,可用循环卷积来计算该线性卷积。长为N的两个序列 和 的循环卷积为,1.7.2 卷积的矩阵向量积表示,式中 表示整数模的最小非负余,例如图1.25所示。用矩阵表示为:或者,其中,矩阵 既是Toeplitz矩阵,也是循环矩阵。,1.7.2 卷积的矩阵向量积表示,(2)二维情况 设 大小为,大小为,将它们都变成大小为 的延伸图像,如图1.26所示,方法是在上述序列中加零:(1.36)(1.37)其中,,1.7.2
23、 卷积的矩阵向量积表示,则循环卷积为(1.38),1.7.2 卷积的矩阵向量积表示,将一维的结论直接用在二维上,有:或者,即,其中、为列矢量,每个列矢量含M个像元。由 个子块 组成,每一子块 是 维的矩阵,由 的第 j 列构成的循环矩阵。,1.7.3 图像在计算机中的表示及处理,如前所述,数字图像可以很方便的使用矩阵 形式表示,这就给图像在计算机中的表示及处理带来了方便。设矩阵中的元素代表 8 bit 数字图像中的象素,取值范围为 0 至 255 之间的整数。因此该元素可使用 C 语言中的符号类型或浮点数类型来表示:,1.7.3 图像在计算机中的表示及处理,实际应用中,图像的大小往往是预先不知
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- DVIP01 数字图像 基础
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-6504782.html