第1讲计算机视觉总论ppt课件.ppt

上传人：小飞机

文档编号：2133076

上传时间：2023-01-15

格式：PPT

页数：55

大小：6.64MB

《第1讲计算机视觉总论ppt课件.ppt》由会员分享，可在线阅读，更多相关《第1讲计算机视觉总论ppt课件.ppt（55页珍藏版）》请在三一办公上搜索。

1、计算机视觉概述,本节内容,人类视觉计算机视觉Marr的视觉计算理论框架视觉系统研究的三个层次视觉信息处理的三个阶段计算机视觉与相关研究领域计算机视觉与图像处理计算机视觉与计算机图形学计算机视觉与模式识别计算机视觉与人工智能计算机视觉与心理物理学计算机视觉的应用,百闻不如一见,One picture is worth more than ten thousand words.,人类视觉,周围环境中的物体在可见光的照射下，在人眼的视网膜上形成图像，由感光细胞转换成神经脉冲信号，经神经纤维传入大脑皮层进行处理与理解。,人类约有75%的信息是通过视觉系统获取的。视觉是思维的一种最基本的工具,人类视觉,

2、计算机视觉,计算机视觉是一门研究如何使机器“看”的科学，即用摄影机和电脑代替人眼对目标进行识别、跟踪和测量。用计算机实现对视觉信息处理的全过程,计算机视觉,人类视觉是通过人眼来感知世界的过程输入：通过眼睛对世界的观察输出：对世界的感知,计算机视觉,计算机视觉是通过对图像和视频的分析处理，实现类似人类视觉感知能力的过程输入：图像（images）或视频（video）输出：对象的恢复以及对对象信息的使用,本节内容,人类视觉计算机视觉Marr的视觉计算理论框架视觉系统研究的三个层次视觉信息处理的三个阶段计算机视觉与相关研究领域计算机视觉与图像处理计算机视觉与计算机图形学计算机视觉与模式识别计算机

3、视觉与人工智能计算机视觉与心理物理学计算机视觉的应用,视觉的计算理论Marr的视觉计算理论框架,David Marr(1945-1980)是英国心理学家。他将心理学、人工智能和神经生理学的结果结合起来，对视觉的研究做出了重要贡献。他是计算视觉的奠基人。David Marr 70年代末在美国MIT提出了第一个较为完善的视觉系统框架此框架尽管存在很多缺陷，但过去20多年一直处于主导地位,D.Marr,Vision,1982.中译本：视觉计算理论姚国正、刘磊、汪云九译，科学出版社，1988。,Marr的视觉计算理论框架视觉系统研究的三个层次,一个例子：超市的自动收银机（cash register),

4、1)计算理论它做的是加法。为什么它做加法而不是乘法？2)表达与算法加法的输入输出是十进制的阿拉伯数字。加法的算法是满十进一。3)物理实现由电线和晶体管组成的电子设备。,Marr的视觉计算理论框架视觉信息处理的三个阶段,低层视觉(Low-level vision)构成所谓的“要素图”(primary sketch),包含一些基本的图像特征(角点、边缘、线条、边界、色彩、纹理等),Marr的视觉计算理论框架视觉信息处理的三个阶段,低层视觉(Low-level vision)构成所谓的“要素图”(primary sketch),包含一些基本的图像特征(角点、边缘、线条、边界、色彩、纹理等),M

5、arr的视觉计算理论框架视觉信息处理的三个阶段,低层视觉(Low-level vision)构成所谓的“要素图”(primary sketch),包含一些基本的图像特征(角点、边缘、线条、边界、色彩、纹理等),Marr的视觉计算理论框架视觉信息处理的三个阶段,中层视觉(Intermediate-level vision)构成对环境的2.5维描述，即部分的、不完整的三维信息描述(恢复场景可见部分的深度、法线方向、轮廓等，包含了深度信息，但不是真正的物体三维表示。),Marr的视觉计算理论框架视觉信息处理的三个阶段,中层视觉(Intermediate-level vision)构成对环境的2.5维

6、描述，即部分的、不完整的三维信息描述(恢复场景可见部分的深度、法线方向、轮廓等，包含了深度信息，但不是真正的物体三维表示。),Marr的视觉计算理论框架视觉信息处理的三个阶段,中层视觉(Intermediate-level vision)构成对环境的2.5维描述，即部分的、不完整的三维信息描述(恢复场景可见部分的深度、法线方向、轮廓等，包含了深度信息，但不是真正的物体三维表示。),Marr的视觉计算理论框架视觉信息处理的三个阶段,高层视觉(High-level vision)从2.5维描述得到完整的三维描述(恢复、表示和识别三维物体),Marr模型的缺点：假定视觉系统是被动的，给什么图像就处理

7、什么缺乏或者未足够重视高层知识的指导作用由局部信息到整体信息的单向过程，没有反馈,Marr框架的计算机视觉三阶段,本节内容,人类视觉计算机视觉Marr的视觉计算理论框架视觉系统研究的三个层次视觉信息处理的三个阶段计算机视觉与相关研究领域计算机视觉与图像处理计算机视觉与计算机图形学计算机视觉与模式识别计算机视觉与人工智能计算机视觉与心理物理学计算机视觉的应用,图像处理(Image Processing)：实现从输入图像到另一种图像的转换（把输入图像转换成具有所希望特性的另一幅图象）。,图像去噪,计算机视觉与相关研究领域计算机视觉与图像处理,计算机视觉与相关研究领域计算机视觉与图像处理,图像增强,

8、图像处理(Image Processing)：实现从输入图像到另一种图像的转换（把输入图像转换成具有所希望特性的另一幅图象）。,计算机视觉与相关研究领域计算机视觉与图像处理,图像修复,图像处理(Image Processing)：实现从输入图像到另一种图像的转换（把输入图像转换成具有所希望特性的另一幅图象）。,计算机视觉与相关研究领域计算机视觉与图像处理,图像去模糊,图像处理(Image Processing)：实现从输入图像到另一种图像的转换（把输入图像转换成具有所希望特性的另一幅图象）。,图像中多余物体的去除,计算机视觉与相关研究领域计算机视觉与图像处理,图像处理(Image Proces

9、sing)：实现从输入图像到另一种图像的转换（把输入图像转换成具有所希望特性的另一幅图象）。,图像处理(Image Processing)：实现从输入图像到另一种图像的转换（把输入图像转换成具有所希望特性的另一幅图象）。图像处理：人是最终的解释者计算机视觉：计算机是图像的解释者计算机视觉系统需要图像处理模块（利用图像处理技术进行预处理和特征抽取）,计算机视觉与相关研究领域计算机视觉与图像处理,计算机视觉与相关研究领域计算机视觉与计算机图形学,计算机图形学（Computer Graphics）：从三维描述到二维图像显示。(给定关于景象结构、表面反射特性、光源配置及相机模型的信息，生成图像。)计算

10、机视觉：从二维图像数据到三维描述。(给定图象，推断景象特性实现的是从模型到图像的变换，也就是说从图象数据提取信息，包括景象的三维结构，运动检测，识别物体等。)在一定意义上讲，计算机视觉是计算机图形学的逆问题两者从最初相互独立的平行发展到最近的融合是一大趋势,计算机视觉与相关研究领域计算机视觉与模式识别,模式识别（Pattern Recognition）：研究各类模式的分类，其中模式可以有不同的物理意义和表现形式。例如，文字识别或指纹识别。,字符识别,计算机视觉与相关研究领域计算机视觉与模式识别,模式识别（Pattern Recognition）：研究各类模式的分类，其中模式可以有不同的物理意义

11、和表现形式。例如，文字识别或指纹识别。,计算机视觉与相关研究领域计算机视觉与模式识别,图像模式的分类是计算机视觉中的一个重要问题模式识别中的许多方法可以应用于计算机视觉中在计算机视觉中模式识别技术经常用于对图象中的某些部分（例如分割区域）的识别和分类。,模式识别（Pattern Recognition）：研究各类模式的分类，其中模式可以有不同的物理意义和表现形式。例如，文字识别或指纹识别。,计算机视觉与相关研究领域计算机视觉与人工智能,人工智能（Artificial intelligence）：主要研究智能系统的设计和有关智能的计算理论与方法AI may be considered as ha

12、ving three stages:perception,cognition and action计算机视觉经常被视为AI的一个分支,计算机视觉与相关研究领域计算机视觉与心理物理学,心理物理学(Psychophysics)：主要研究人类自身视觉系统的有关机理与现象,闪烁的蓝点,在你移动视线时，图中的蓝点似乎在闪烁。但如果盯住一个点，这种发光便消失踪影。德国阿伦验光研究所在1994年发现的闪烁网格错觉现象,“蓝宝石之光”,怀特效应1979年，塔斯马尼亚高级教育学院的迈克尔怀特发现了一种错觉现象，彻底改变了视觉学的面貌。如图所示，左侧的灰条亮度超过右侧灰条。而实际上，所有灰条都是一样的。在怀特发现

13、这种现象前，所有亮度错觉均被认为由拮抗过程所致，也就是说，灰色物体在被白色物体包围时看上去更为暗淡，被黑色物体包围时则显得更为明亮。但在这幅错觉图中，被白色包围的灰条亮度更高，被黑色包围时则更为暗淡。迄今为止，怀特效应背后的大脑机制仍旧是一个未知数。,年度最佳错觉图结合了怀特效应(窗帘后面的花瓶似乎呈现出不同的颜色)和著名的面部-花瓶错觉(花瓶被换成获胜者的奖杯)构成。,怀特效应-眼见未必为实,视觉错位本身就是摄影的一种艺术和创作,计算机视觉与相关研究领域计算机视觉与心理物理学,心理物理学(Psychophysics)：主要研究人类自身视觉系统的有关机理与现象心理物理学的研究结果往往被用来作为

14、建立计算机视觉模型的理论根据,本节内容,人类视觉计算机视觉Marr的视觉计算理论框架视觉系统研究的三个层次视觉信息处理的三个阶段计算机视觉与相关研究领域计算机视觉与图像处理计算机视觉与计算机图形学计算机视觉与模式识别计算机视觉与人工智能计算机视觉与心理物理学计算机视觉的应用,计算机视觉的应用,零件识别与定位产品检验移动机器人导航遥感图像分析医学图像分析安全、监控与跟踪国防系统其它（动画、体育、考古）,空间探索,Sojourner 火星车前部图，中部的两个小突出是两个黑白CCD摄像机,Sojourner视觉系统获取的立体图象对,障碍物探测示意图Sojourner视觉系统对场景的深度

15、恢复,地球资源勘探,军事应用目标跟踪,军事应用隐形飞机、定位轰炸,军事应用,军事应用,交通监控自动驾驶,三维人脸重建,计算机视觉的应用,http:/www.cs.ubc.ca/spider/lowe/vision.htmlhttp:/www.cs.washington.edu/homes/seitz/http:/people.cs.ubc.ca/lowe/vision.htmlhttp:/groups.csail.mit.edu/vision/medical-vision/surgery/surgical_navigation.htmlhttp:/en.wikipedia.org/wiki/Spirit_roverhttp:/www.robocup.org/http:/www.hawkeyeinnovations.co.uk/http:/,小结,人类视觉计算机视觉Marr的视觉计算理论框架视觉系统研究的三个层次视觉信息处理的三个阶段计算机视觉与相关研究领域计算机视觉与图像处理计算机视觉与计算机图形学计算机视觉与模式识别计算机视觉与人工智能计算机视觉与心理物理学计算机视觉的应用,