机器视觉人工智能及其应用ppt课件.ppt
《机器视觉人工智能及其应用ppt课件.ppt》由会员分享,可在线阅读,更多相关《机器视觉人工智能及其应用ppt课件.ppt(124页珍藏版)》请在三一办公上搜索。
1、第九章 机器视觉,人工智能及其应用,对人类感觉信息的理解与处理是人工智能研究和应用又一重要领域。人类的这些感觉信息是多种多样的,包括视觉、听觉、力觉、触觉、嗅觉、味觉、接近感和临场感(telexistence或telepresence)以及情感等。其中,对视觉和力觉的研究最为重要,且均已进入实用阶段。对触觉和听觉的研究也已获得显著进展。不过,对嗅觉,尤其是味觉的研究尚未有重大突破。至于对人工情感的研究,仍停留在科学幻想阶段。 除了对各种单一的传感信息进行研究外,近年来又出现了对多种传感信息的集成与融合(integration and fusion)研究;它利用各种传感器性能上的差异性与互补性,
2、融合不同传感器的信息源并加以综合分析,以得到正确理解的、稳定可靠的周围环境信息,使系统具有容错性,提高系统的信息处理速度,保证决策的正确性和准确性。,联为-稻草人自动化,联为-稻草人自动化,视觉是人类最重要的感觉能力之一。视觉数据是人的最复杂和最有用的感觉输入信息。人眼能感觉颜色,因为它具有全色能力。人眼能感觉运动,因为视网能提供所出现事物的实际响应。 当代科学技术能否用机器来完全解释、模拟、复现和处理人的视觉呢?作为一种感觉输入数据,人们已能以有限的但是比较重要的方法重现视觉信息。机器视觉涉及对相似视觉数据的解释。接至计算机的视觉传感器感受到图像的明暗信号,并把这些信号变换为可供处理的形式。
3、把视觉传感器装在机器人的机械手上,只要物体与其背景的对比度明显不同,而且不相互接触或重叠,那么就能够让机器人通过图像轮廓来识别物体。这种视觉系统已获得应用。 由机器来感觉环境并执行要完成的任务具有明显的优点,并获得多方面的应用。除了用于由机器人进行装配和检验作业外,还可用于星际空间搜索、医用X-射线自动鉴别、地球资源遥感监视和各种军事应用等。这种视觉机器有助于执行许多日常单调的甚至对人危险的任务;如果没有某种感觉能力,那么这些任务是很难甚至无法完成的。,大多数工业装配任务,包括一些看起来很简单的任务(如把车辆装在汽车上),一般都需要采用视觉技术。在恶劣环境下(例如,在太空和水下)或在加工有害材
4、料时,一般都需要机器视觉。对于许多应用,视觉系统必须是自主的。 计算机视觉(即机器视觉)就是由图像数据来产生视野环境内有用符号描述的过程。所开发的计算机视觉的特点与过程往往与其应用场合有关。 机器视觉包含众多的研究课题,如视觉可计算性原理、图像的形成和获取、图像预处理、边缘检测与分割、特征抽取与匹配、区域生成与分割、形状分析与识别、运动视觉、主动视觉、三维视觉以及视觉知识的表示和视觉系统的控制策略等。机器视觉已发展成为一门独立的学科。因此,对机器视觉的系统、全面和深入的研究,已不是本书的任务。本章仅对机器视觉进行导论性介绍,仅限于讨论一些比较基本的问题,这些问题可能与机器人视觉有比较直接的关系
5、。,联为-稻草人自动化,9.1图像的理解与分析,对图像的理解和解释是计算机视觉的研究中心,也是人工智能研究的焦点之一。可以把视觉理解为一个从外部世界图像产生对观察者有用的描述过程。这些描述依次由许多不同的记录了的景物某一方向的固定表达组成。因此,选择视觉系统的表达方法,对于视觉系统是至关重要的。,联为-稻草人自动化,联为-稻草人自动化,9.1.1视觉信息的表达方法,根据马氏(Marr)提出的假设,视觉信息处理过程包括三个主要表达层次,即初始简图、二维半简图和三维简图,如图9.1所示。,联为-稻草人自动化,1.初始简图 亮度图像含有两种重要信息:图像的亮度变化和局部几何特征。初始简图是一种本原表
6、达法,它能完全而又清楚地表示上述信息。初始简图所包含的信息大部分集中在与实际边缘以及边缘终止点有关的剧烈灰度变化上。对于每一边缘亮度变化,在初始简图上都有对应的描述。这些描述包括:与边缘有关的亮度变化率、总的亮度变化、边缘长度、曲率和方向等。粗略地说,初始简图是以勾画草图的形式来表示图像中的亮度变化的。,图9.2即为初始简图的一个例子,说明它的辉亮边界描述和亮度变化。如果所用边缘检测方法所产生的是短线段,那么,就要利用聚集过程把那些相容的描述线段连接起来。 根据马氏理论产生初始简图,并不需要关于特定物体的有关知识。也就是说,马氏建议试图描述图像具有的属性,而对景物可能与什么事物有关则不作任何假
7、设。,联为-稻草人自动化,2.二维半简图 要对图像进行更深入的描述,需要知道其内在特性。这些内在特性包括表面方向、从观察者至被观察表面的距离、反射和入射光照表面的纹理以及材料特性等。二维半简图(2D sketch)包含景物表面的信息,可以把它看做某些内在特性的混合信息。二维半简图清楚地表示物体表面方向的信息。物体表面法线从物体内部穿出来,使物体好像穿刺满了针一样。有时,这种二维半简图又称为指针图,或简称针图(needle diagram)。此外,二维半简图还包含从观察者到图像各部分的距离。图9.3表示出二维半简图的表面方向信息。图中,指针的箭头表示垂直于表面的矢量,即为表面法线。 在初始简图和
8、二维半简图中,信息往往是以与观察者有关的坐标系表示的。因此,这种表达法称为观察者中心表达法。,联为-稻草人自动化,3.三维模型 三维表达法能够完全而又清晰地表示有关物体形状的信息,其方法之一即为广义柱体。广义柱体的概念十分重要,而其表示方法又十分简单,如图9.4所示。图中,柱体的横截面沿轴线的投影不变。一个普通圆柱可看做是一个圆周沿其中心垂线移动而成;一个楔形物是一个三角形沿其中垂线移动而得的,等等。一般地说,一个广义柱体是二维轮廓图沿其轴线移动而成的。在移动过程中,轮廓与轴线之间保持固定的角度不变。轮廓可为任何形状,而且在移动过程中其尺寸可能是变化的,其轴线也不一定是垂线或直线,如图9.5所
9、示。,联为-稻草人自动化,复杂物体往往是由一些广义柱体连接而成的。一般地,一个中央主柱体被一些凹槽或凸面所修正。这样,复杂物体就可以由一些基本图形构成。,联为-稻草人自动化,9.1.2 边缘距离的计算,1.图像辉亮边缘的平均与差分 图9.6表示出两平面间边缘处的亮度变化图。其中,图9.6(a)为理想边缘亮度变化;这时,亮度在边缘处由一值跃变为另一值。图9.6(b)则表示实际边缘亮度变化;这时亮度的变化比较模糊,不存在明显的阶跃变化,因而也就很难确定边缘的位置。这种情况是与图像输入装置不可能产生足够清晰的图像有关的。因为在获得图像时,会遇到传感器的亮度灵敏性波动、图像坐标信息误差、电子噪声、光源
10、扰动以及无力接收大范围变化的亮度信息等。另一个原因是图像本身很复杂,其实际边缘并不是陡峭的,而是逐步过渡的;还可能存在相互照明效应、意外划痕和灰尘等。,联为-稻草人自动化,一种处理噪声边缘的方法包括下列4个步骤:(1)从图像建立平均亮度阵列。取局部亮度的平均值能够减少噪声的影响。下述公式说明需要进行的计算。为简化起见,所列公式是用于二维计算的一维形式: 式中,Ii为i点的图像亮度,而Ai为i点的平均亮度。(2)从平均亮度阵列产生平均一阶差分阵列。取右邻差分(Ai+1 -Ai)与左邻差分(Ai-Ai-1)的平,联为-稻草人自动化,均值,这相当于把i的左邻和右邻相平均。令Fi为平均亮度Ai的一次平
11、均差分,则有: 上式与一次微分的有限差分近似。(3)从一次平均差分阵列建立二次平均差分阵列。 为此,求一次差分的平均值。令Si为平均亮度的平均二次差分,则(4)据所得阵列,记下峰点、陡变斜率和过零点,以寻求边缘信号的集合。 平均过程是把理想的台阶曲线和被噪声模糊的台阶曲线都变换为平滑的台阶曲线;一次差分过程把平滑了的台阶曲线变换为凸缘形曲线;二次差分过程又把凸缘形曲线变换为S形曲线,如正弦曲线一样变化。图9.7(b)至(d)表示出上述边缘处理过程,而图9.7(a)则表示理想的边缘亮度分布。,联为-稻草人自动化,平均和差分作用能够被综合到一个综合平均过程中去,并通过点扩散函数由输入点特性来确定输
12、出点特性。点扩散函数表示单个孤立点亮度不为。的点在图像中如何扩散其影响。当按输入来确定输出特性时,称输出被点扩散函数所滤波。 在实际图像中所用到的点扩散函数必须表示比较多的点的组合,而且点扩散函数必须是二维的。这些计算论证的概要是:,联为-稻草人自动化,(1)必须用衰减高频点扩散函数对噪声进行滤波处理。选用二维高斯函数要比平均函数好得多。(2)应当用二次差分来对边缘进行定位。高斯滤波器对噪声的抑制作用能够抵消差分过程对噪声增强的影响。(3)用二维高斯滤波后,进行的二次二维差分相当于以形状像墨西哥草帽或宽边草帽的单个点扩散函数来滤波。墨西哥草帽形状是一维情况下尖峰和穿越(peak-and-thr
13、ough)形状在二维情况下的相似物。,联为-稻草人自动化,(4)一个窄的正高斯点扩散函数加上一个宽的负高斯点扩散函数,能够足够精确地表示出先高斯滤波后差分所对应的二维墨西哥草帽状的点扩散函数,如图9.8所示。(5)用二维高斯点扩散函数来滤波相当于连续以两个一维高斯点扩散函数(一个为垂直方向,另一为水平方向)来滤波。这意味着,高斯滤波是快速的。因此,墨西哥草帽形滤波也可以是快速的。,联为-稻草人自动化,2.灵长目动物视网膜特性 墨西哥草帽形滤波器与一些了解灵长目动物早期视觉的实验相一致。关键实验如图9.9所示。被试动物注视各种从白色背景前移过的色质(stimuli)。这些色质包括一条窄的黑带、一
14、条宽的黑带以及一个单白一黑边缘。记录探针测定各种神经反应。把此神经反应与据墨西哥形草帽滤波器作出的预计进行比较。,联为-稻草人自动化,图9.10给出比较结果。在图9.10中,(a)表示3个自左向右移动的色质的亮度分布曲线;(b)表示以适当宽度的墨西哥草帽形滤波器对所给出的亮度分布进行滤波的结果;(c)为所谓X神经节细胞上记录的实验数据。比较图9.10(b)和(c)可见,两者极其相似。这表明灵长目动物的视网膜确实进行了某些与墨西哥草帽形滤波器十分相似的处理工作。如果对墨西哥草帽形滤波器稍加修改,就能够改善相似性,如图9.10(d)所示。,联为-稻草人自动化,比较结果得到的高度相似性,使我们有足够
15、的根据作出下列假设:(1)灵长目动物视网膜所进行的滤波处理功能在运算上与由墨西哥草帽形点扩散函数所进行的滤波相似。(2)存在有两种视网膜细胞,一种用于传输滤波图像的正向部分,另一种传递滤波匾像的负向部分。(3)对于每种细胞,墨西哥草帽形滤波器是通过激发与禁止这两种操作的组合来实现的。这个滤波器等价于两个以二维高斯滤波器滤波所得图像的差。,联为-稻草人自动化,3.物体距离的确定 立体视觉由两眼得到的信息来确定距离。由于两眼间的距离是已知的,因而一旦在两眼所得图像中找到了物体的位置,就容易求得观察者到此物体的距离。 图9.11表示两眼立体视觉中的相对位置关系。图中,P点为一物体。两个透镜的轴线是平
16、行的。f为两透镜与图像平面的距离,即为其焦距。b为两透镜轴线在基线上的距离,即为两眼的距离。l和r分别为P点与左、右透镜轴的距离。和分别为左右图像与其相应透镜轴线的距离。 从两相似三角形,我们可以得下列关系式:,联为-稻草人自动化,已知b=L+r,代入上式,可求得观察者双眼至物体的距离: 由于双眼距离b为已知,焦距f也是确定的,因此,一个物体与双眼的距离和(+)反比。 (+)为该点的一幅图像点位置相对于另一幅图像点位置的位移,称为视(disparity)。 立体视觉的实际问题就是根据左右两图像找到相应的物体,以便能够测量视差。有许多不同的立体视觉系统能在不同程度上成功地寻找出相应的物体。,联为
17、-稻草人自动化,9.1.3表面方向的计算,研究由图像明暗度(shading)来计算物体表面方向信息的过程,其目的在于更多翅解为产生二维半简图信息所需要的计算。1.反射图体现光照约束 从物体表面反射的光量取决于表面材料以及光源、观察者与表面法线之间的相对角度。这些角度如图9.12所示。其中, i为表面法线与光源方向之间的入射角;e为表雇线和观察者之间的出射角;g为观察者方向与光源方向间的相位角。 把从所有可能位置观察到的亮度都相同的表面定义为朗伯表面(Lamber surface),它的亮度只由光源的方向决定。这一关系遵循下列公式: Ecosi (9.5) 式中,E为被观察亮度; 为表面反射率(
18、对于特定的表面材料, 为一常数);i为入射角。,联为-稻草人自动化,联为-稻草人自动化,为了认识朗伯表面如何反射光,我们进行如下实验:用朗伯颜料涂敷一个球面,并让它在一点光源附近移动。对于每一光源位置,观察并记下亮度与表面法线的关系,画出其等亮度线。图9.13给出三个不同光源方向情况下的等亮度线。其中,对于图9.13(a),光线正好从观察者背后照射,其等亮度线为一些同心圆。最亮点的亮度为, 此点的法线正好指向观察者。这时,cos i=1。离开球面的边界方向,亮度逐渐变暗,在边界处的亮度变为0,因为这时cosi=0。对于图9.13(b),光源方向与观察者方向间的夹角为450,这时,最亮点的亮度仍
19、为,但它已不是表面法线正对观察者的点,而是表面法线指向光源的点。亮度为0的线是球面上的圆周,但不是球面的二维图像中的圆周。有时,称亮度为0的线为阴影线(shadow line),或明暗界线(terminator)。对于图9.13(c),光线是从右面照射的,而且观察者方向与光源方向呈直角交角。这时,最亮点是在球面边缘上,而阴影线则为直线。,联为-稻草人自动化,联为-稻草人自动化,虽然图9.13可用来说明表面方向与亮度的关系,不过它是在空间曲面上的表示方法,因而不便于实际使用。实际中使用的方法是把等亮度线投影到平面上去。投影后的等亮度线构成反射图(reflectance map)。 有多种绘制反射
20、图的方法,其中之一是把等亮度线投影到梯度空间平面。梯度空间平面是一个和视线垂直的切面。投影的方法是把表面各点的法线向外延长,直至与梯度空间平面相交为止。另一种有用的投影方法也是把球面上的点投影到球面的切面上去(切面的坐标轴为F和G),其投影方法是:从球面上与观察者相对的点出发,与要投影的点连成直线,再与切面相交。,联为-稻草人自动化,2.表面方向的确定 上面研究了利用表面方向预测表面的亮度。下面研究相反的问题,即从感测到的亮度来计算表面各方向参数f和g。 由f和g来确定表面方向,初看起来似乎是不可能的。因为一小块表面只能确定切面FG上的一条曲线,而不是单一的点。但是,事实上这样做却是可能的,因
21、为大部分表面是平滑的,在不同深度和方向上只出现有少数不连续的情况。因此,可以利用下面两个约束:(1)亮度。由f和g所确定的表面方向应与表面亮度所要求的表面方向无多大不同。(2)表面平滑度。一点的表面方向应与邻近各点的表面方向无多大变化。 对于每个点,计算的f和g值应兼顾上述两个约束计算所得的值。图9.14中,根据亮度,要求特定点的f和g值应落在等亮度线上,而据表面平滑度则要求f和g值接近相邻点f和g的平均值。 从直观上看,在平均点与等亮度线之间选择某个点是有道理的。不过,仍然存在两个间题,即这个所选择的点在哪里,以及如何知道相邻点的平均值。下面是这两个问题的解答。,联为-稻草人自动化,(1)折
22、中通过平均点并垂直于等亮度线的直线上的某个点,作为所选择的点。(2)首先假设所有未知的f和g均为零值,然后用在初始值的平均点与等亮度线之间求得的折中方法,为每一点计算新的f和g值,再重复利用更新了的值计算f和g值,直至其值变化足够小为止。 为检查上述计算过程是否可行,需要一些耗时的和可选择的计算。先研究两种误差平滑性偏差e1和预计亮度偏差e2的测量。,联为-稻草人自动化,联为-稻草人自动化,总误差为e=e1+e2,其中为一常数,用于调整两偏差以保持一定的平衡。要求得使总偏差为最小的fi,j和gi,j,我们对fi,j和gi,j分别取微分,并令其微分值等于0。这样可得下式: 根据下列第(n+1)个
23、迭代项(fi,jn+1,gi,jn+1)与第n个迭代项(fi,jn,gi,jn)的相关规则,能够求得这些方程式的解答如下:式中, fi,j0=0,gi,j0=0,联为-稻草人自动化,这些规则称为松弛公式。应用这些公式相当于从原来的估计值出发,沿着垂直于等亮度线方向,朝等亮度线移动一步,以改善对f和g的估计。每步移动大小正比于所观察到的亮度与据当前f和9预测到的亮度之差,也与误差平衡参数成正比。 应用松弛公式的过程,通常称为松弛过程。 综上所述,可得计算表面方向的松弛算法如下:(1)对所有非边界点,令f=0和g=0。对所有边界点,令f和g规定一个长度为2的垂直于边界的矢量。称输入阵列为当前阵列。
24、(2)进行下列步骤(直到所有的值变化得足够慢为止): (a)对当前阵列中的每个点: i)如果是边界点,则不做任何事; ii)如果是非边界点,那么用松弛公式计算新的f和g值。 (b)把所得新阵列称为当前阵列。,联为-稻草人自动化,9.2积木世界的景物分析,景物分析是研究视觉的重要问题。可见的景物由传感器编码,并被表示为一个灰度数值矩阵,再由检测器处理。检测器搜索图像的主要成分,如线段、简单曲线和角度等。对这些成分进行处理,以便利用知识来推断有关景物的三维特征信息。其最终目标在于利用模型来表示该景物。,联为-稻草人自动化,9.2.1积木世界景物的线条标示方法,积木世界视觉研究的主要目标是理解从一堆
25、玩具积木的图像得到对于景物的描述。所谓描述就是把出现在图像中的大量的线条聚集成代表景物中各个积木的线条组。研究积木世界景物时,输入的图像可以是积木景物的照片、电视摄影图像或是线条图。如果是属于前两种,那么第一步就是从图像得到线条图。这属于马氏初始简图的范围,但没有那样复杂,只是用了边缘检测算子。在以下的讨论中,我们都假设已经得到了积木世界的线条图的情况。,联为-稻草人自动化,积木世界景物分析的研究对象比较狭窄,并且是有意地进行了简化,但仍不失为合适的计算机视觉研究的初步目标。在这个领域中的研究已经取得了一些有实用意义的成果。积木世界可以推广为类似工业零件的多面体,而理解简单的三维工程图是建立有
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 机器 视觉 人工智能 及其 应用 ppt 课件
链接地址:https://www.31ppt.com/p-1342301.html