图象理解理论和系统.ppt
《图象理解理论和系统.ppt》由会员分享,可在线阅读,更多相关《图象理解理论和系统.ppt(48页珍藏版)》请在三一办公上搜索。
1、章毓晋(TH-EE-IE),第12章图象理解理论和系统,12.1从感知到理解 12.2图象理解理论框架 12.3图象理解系统模型12.4具体系统分析 12.5典型系统比较 12.6讨论和展望,章毓晋(TH-EE-IE),12.1从感知到理解,1.感知理解的研究方法(1)分析方法分析方法从分析视觉刺激开始得到了对大脑结构研究结果的支持已发现存在完成基本功能的特殊细胞,例如感知边缘、线条、运动方向等的细胞建立在不变假设上。对一个给定的视网膜投影模式,可以认为有无穷个可能的场景会导致该模式的产生。不变假设认为,在这么多个可能的场景中,观察者总会选择一个且只选择一个,章毓晋(TH-EE-IE),12.
2、1从感知到理解,1.感知理解的研究方法(2)综合方法 试图在感观刺激中找出所观察世界的等价物 认为视网膜上的光学图象(包括图象随时间的变化)应该包含感知空间目标所需要的全部信息其基于思路是复杂和密集的视网膜刺激可帮助进入视觉世界的不变量,即其最基本和本质的特性,章毓晋(TH-EE-IE),12.1从感知到理解,2.图象理解系统完成视觉感知理解的系统是图象理解系统视觉信息从广义上说包括:由人类视觉系统感知的信息 由人类发明的各种视觉装置所获取的信息 以及由这些信息推导出的其它表示形式 从上述这些信息中抽象出来的高级表达和行为规划以及与这些信息密切相关的知识和处理这些信息所需的经验,章毓晋(TH-
3、EE-IE),12.1从感知到理解,2.图象理解系统采集、表达、处理、分析和理解上述信息 基本问题是模式问题(表达)基本问题是组织问题(管理)理论还不完善,仅初步的理论框架马尔(Marr)提出的视觉计算理论 对人类视觉系统了解不充分信号处理问题 人工智能问题,章毓晋(TH-EE-IE),12.2图象理解理论框架,马尔视觉计算理论对马尔理论框架的改进关于马尔重建理论的讨论新理论框架的研究,章毓晋(TH-EE-IE),马尔视觉计算理论,马尔1982年出版了视觉一书 Marr D.1982.Vision A Computational Investigation into the Human Rep
4、resentation and Processing of Visual Information.W.H.Freeman 一个理解视觉信息处理的框架要先理解视觉目的再去理解其中细节,章毓晋(TH-EE-IE),马尔视觉计算理论,1.视觉是一个复杂的信息加工过程视觉是一个远比人所想象更为复杂的信息加工任务和过程,而且其难度常不为人们所正视为理解视觉这个复杂的过程,要解决两个问题 视觉信息的表达问题:某些信息是突出的和明确的,另一些信息则是隐藏的和模糊的 视觉信息的加工问题:对信息处理、分析、理解,将不同表达形式转换,逐步抽象,章毓晋(TH-EE-IE),马尔视觉计算理论,2.视觉信息加工的三个要
5、素计算理论;算法实现;硬件实现 计算理论可计算性问题:一个任务要用计算机完成,它应该是可以被计算的一般对于某个特定的问题,如果存在一个程序,对于给定的输入,这个程序都能在有限步内给出输出,这个问题就是可计算的,章毓晋(TH-EE-IE),马尔视觉计算理论,2.视觉信息加工的三个要素计算理论视觉问题是否可用现代计算机计算?对计算机给定输入,能否得到人类视觉可获得的类似结果两方面的研究内容:计算的是什么以及为什么要计算它们;提出一定的约束条件,它们可唯一地确定最终得到的运算结果,章毓晋(TH-EE-IE),马尔视觉计算理论,2.视觉信息加工的三个要素算法实现需要给加工所操作的实体选择一种合适的表达
6、选择加工的输入和输出表达确定完成表达转换的算法一般情况下可以有许多可选的表达算法的确定常取决于所选的表达给定一种表达,可有多种完成任务的算法,章毓晋(TH-EE-IE),马尔视觉计算理论,2.视觉信息加工的三个要素硬件实现有了表达和算法在物理上如何实现算法也是必不可少的 算法的确定常依赖于物理上实现算法硬件的特点同一个算法也可由不同的技术途径实现,章毓晋(TH-EE-IE),2.视觉信息加工的三个要素视觉信息加工三要素的含义,马尔视觉计算理论,章毓晋(TH-EE-IE),2.视觉信息加工的三个要素它们之间有一定的逻辑因果联系,但并无绝对的依赖关系实际上看成两个层次更恰当一旦有了计算理论,表达和
7、算法与硬件实现是互相影响的,马尔视觉计算理论,章毓晋(TH-EE-IE),马尔视觉计算理论,3.视觉信息的三级内部表达(1)基素表达(primal sketch)一种2-D表达,它是图象特征的集合,描述了物体上属性发生变化的轮廓部分只用基素表达不能保证得到对场景的唯一解释,章毓晋(TH-EE-IE),马尔视觉计算理论,3.视觉信息的三级内部表达(2)2.5-D表达(2-D sketch)将物体可见面正交投影分解成单元表面用法线代表单元表面的取向将各法线画出,叠加于物体轮廓内可见面上,章毓晋(TH-EE-IE),马尔视觉计算理论,3.视觉信息的三级内部表达(2)2.5-D表达(2-D sketc
8、h)本征图,表示了物体表面面元的朝向可将2.5-D图转化成(相对)深度图 既表达了一部分物体轮廓的信息(这与基素表达类似)表达了以观察者为中心、可观察到的物体表面的取向信息 与人所理解的3-D物体一致(可见物体轮廓以内目标的3-D信息,如边界、深度,反射特性等),章毓晋(TH-EE-IE),马尔视觉计算理论,3.视觉信息的三级内部表达(2)2.5-D表达(2-D sketch)将2.5-D图转化成(相对)深度图给定z(x,y)对x和y的偏导p和q,理论上讲可通过在平面上沿任意曲线的积分来恢复z(x,y)为最小化误差可选择z(x,y)满足,章毓晋(TH-EE-IE),马尔视觉计算理论,3.视觉信
9、息的三级内部表达(3)3-D表达(3-D representation)以物体为中心(即也包括了物体不可见部分)的表达形式 在以物体为中心的坐标系中描述3-D物体的形状及其空间组织 空间占有数组,单元分解,几何模型广义圆柱体表达方法,章毓晋(TH-EE-IE),马尔视觉计算理论,3.视觉信息的三级内部表达 从计算机或信息加工的角度来说,视觉可计算性问题可分成几个步骤,步骤之间是某种表达形式,而每个步骤都是把前后两种表达形式联系起来的计算/加工方法,章毓晋(TH-EE-IE),3.视觉信息的三级内部表达,马尔视觉计算理论,章毓晋(TH-EE-IE),马尔视觉计算理论,4.视觉信息处理按照功能模块
10、的形式组织 把视觉信息的系统看成由一组相对独立功能模块所组成的思想,不仅有计算方面进化论和认识论的论据支持,而且某些功能模块已经能用实验的方法分离出来人通过使用多种线索或从它们的结合来获得各种本征视觉信息。这启示计算机视觉系统应该包括许多模块,每个模块获取某一特定的视觉线索,结合不同的模块来最终完成视觉任务,章毓晋(TH-EE-IE),马尔视觉计算理论,5.计算理论形式化表示必须考虑约束条件 在图象采集获取过程中,原始场景中的信息会发生各种变化(1)当3-D的场景被投影为2-D图象时,丢失了物体深度和不可见部分的信息(2)图象是从特定视角获取的,同一物体的不同视角图象会不同,另外由于物体遮挡也
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 图象 理解 理论 系统

链接地址:https://www.31ppt.com/p-6258098.html