计算机视觉的发展相关.ppt
计算机视觉的任务及目前研究的现状(一点个人观点和感受),胡占义中国科学院自动化研究所模式识别国家重点实验室,人类视觉的目的,J J Gibson 理论 1:适应外界环境2:控制自身的运动D Marr:重构可见表面的几何形状,形状位置运动,整体感知:不可计算,可计算,计算机视觉的任务,中心任务就是对图象进行理解对单幅图象的理解对多幅图象的理解对视频图象的理解,21世纪,是对video图象进行理解的世纪,理解什么?,形状,位置、运动,历史与现状,计算机视觉20多年来的二大事件,主动视觉,目的视觉,Marr计算视觉理论(80年代)使计算机视觉成为一门独立科学,摄象机自标定和分层重建(90年代)使计算机视觉走出了低谷,Marr计算视觉理论,Marr计算视觉理论有二个核心论点:1:人类视觉的主体是重构可见表面的几何形状;2:人类视觉的重构过程是可以通过计算的方式完成的。,Random-dot stereograms,Bela Julesz in 1960,病理学证据,Marr计算视觉理论,三个层次计算理论表达与算法算法实现,三个步骤Primitives2.5 D 3D,算法的三个步骤,图像,Zero-crossing,Raw primal sketch,Full primal sketch,物体种类形状位置的描述,人类立体视觉模块,尽管人们对Marr计算视觉理论提出了这样那样的质疑和批评,但Marr计算视觉仍然是计算机视觉的主流理论。也许Marr的“视觉主体为对可见表面的重构”假设是错误的,但人类的立体视觉通道是最主要的通道之一。,人类视觉通道,计算机视觉的发展历程,工业应用,精度要求高,精度要求不高的应用,?,92年以来最大的理论成果,分层重构理论,欧氏空间,认知心理学实验支持分层重构理论,优先级别,拓扑空间,射影空间,仿射空间,欧氏空间,不同空间下重建的定义,如果,则,当A为射影变换矩阵时,称此时的重建为射影重建当A为仿射变换矩阵时,称此时的重建为仿射重建当A为刚体变换矩阵时,称此时的重建为欧氏重建,PE,XE,X,P,U,PE,XE 欧氏空间,欧氏变换欧氏重建,射影变换射影重建,仿射变换仿射重建,计算机视觉的几个核心问题,单幅图象,分割问题,多幅图象,与心理学、神经解剖学、生物物理学结合,解决计算机视觉的核心问题,可计算性,三维重构,运动分析,运动分割物体跟踪,对应问题重构理论,值得研究的主要方向,当前的研究热点,视觉监视,运动问题,重构问题,最终目标General vision system,计算机视觉的主要机构,代表人物,O.Faugeras,B.Triggs:INRIAA.Zisserman,Oxford U.L.Van Gool,M.Poleffeys:Leuven U.R.Hartley,AustraliaY.Ma,Illinois U.,分割不是一个well-posed 问题,我们能从图象中分割出一个红把手的白茶杯吗?,基于内容的图象检索不是一个well-posed 问题,在射影空间如何度量形状的相似性?,重构问题的三个主要步骤,Correspondence,Camera Calibration,Motion decomposition,鲁棒性问题,计算机视觉的根本问题是一个鲁棒性问题,如果不考虑鲁棒性问题的话,计算机视觉几乎所有问题都解决了R.Harallick 前IEEE Trans.PAMI 主编,IAPR 主席,Questions!,