第五章智能机器人的视觉ppt课件.pptx
《第五章智能机器人的视觉ppt课件.pptx》由会员分享,可在线阅读,更多相关《第五章智能机器人的视觉ppt课件.pptx(100页珍藏版)》请在三一办公上搜索。
1、智能机器人原理与实践,机器人的视觉功能在于识别环境、理解人的意图并完成工作任务。机器人的视觉技术包括:给定图像的检测与跟踪、多目视觉与距离测量、时序图像检测运动并跟踪、主动视觉等。,5 智能机器人的视觉,5.1 机器视觉基础理论,5.1.1 理论体系,(1) 计算理论层是视觉信息处理的最高层次是抽象的计算理论层次,它回答系统各个部分的计算目的和计算策略。(2) 表达与算法层是要进一步回答如何表达视觉系统各部分的输入、输出和内部的信息,以及实现计算理论所规定目标的算法。(3) 硬件实现层要回答的是“如何用硬件实现各种算法”。,机器视觉研究可以分为如下五大研究内容: 1、低层视觉 2、中层视觉 3
2、、高层视觉 4、输入设备 5、体系结构,1. 图像多义性 不同形状的三维物体投影在图像平面上可能产生相同图像。不同形状的三维物体投影在图像平面上可能产生相同图像,如图所示。,5.1.2 关键问题,2. 环境因素影响 照明、物体形状、表面颜色、摄像机以及空间关系变化都会对获取的图像有影响,几个立方体构成的多义性图像如图所示。,3. 知识导引 同样的图像在不同的知识导引下,将会产生不同的识别结果。不同的知识导引也可能产生不同的空间关系。4.大数据 灰度图像、彩色图像、高清图像、深度图像、图像序列的信息量会非常大,需要很大的存贮空间和计算处理能力。,5.2 成像几何基础,成像系统即是将三维场景变换成
3、二维灰度或彩色图像。这种变换可以用一个从三维空间到二维空间的映射来表示:,简单的三维图形获取过程如图所示。,5.2.1 基本术语,1. 投影 平面几何投影的分类如图所示。,2. 投影中心,3. 投影线与投影面,4. 投影变换 透视投影和平行投影分别如图所示。,5.2.2 透视投影,1. 透视现象,2. 透视投影成像模型,5.2.3 平行投影,平行投影也称为正交投影,是指用平行于光轴的光将场景投射到图像平面上。,5.2.4 视觉系统坐标变换,1. 坐标系 (1)像素坐标 (2)图像平面坐标 (3)摄象机坐标 (4)场景坐标,2. 齐次坐标 考虑对笛卡尔空间内点P分别进行旋转、平行移动、放大、缩小
4、,对应的射影空间内PpPp的变换操作可用44矩阵 来作为P的齐次坐标的线性变换: p= p Ti 式中Pp表示P点变换后,对应在射影空间内的点。,1) 旋转变换 空间内物体绕x、y、z轴旋转角度,对应的变换矩阵Ti可表示为:,2) 平移变换 空间内物体在x、y、z方向平移(h,k,l),对应的变换矩阵Ti可表示为:,3) 扩大、缩小变换 空间内物体以原点为中心,在x、y、z轴方向扩大或者缩小 mx、my、mz倍,或者全体的1/mw 倍,则对应的变换矩阵Ti可表示为:,三维空间中,以某一个视点为中心往二维平面上投影的过程称为透视变换。如图所示,这种将平面上的图形投影到另一图像平面上这一过程称作“
5、配景映射”。,5.2.5 射影变换,三维空间的坐标系规定为现实世界坐标,称为实坐标或者世界坐标。三维空间中,三维物体的投影和图像化过程如图所示。,5.3 图像的获取和处理,5.3.1成像模型 成像系统的建模是建立摄像机成像面坐标与客观三维场景的对应关系。1. 成像坐标变换,1) 图像坐标系 摄像机采集的图像以 M x N的二维数组存储的。如图所示,在图像上定义的直角坐标系中,坐标系原点位于图像的左上角,图像坐标系的坐标( u , v )是以像素为单位的坐标。,2) 成像平面坐标系 若原点q在uv坐标系中的坐标为(u0, v0),每一个像素在x轴与y轴方向上的物理尺寸为dx, dy,则图像中任意
6、一个像素在两个坐标系下的坐标关系:,3) 摄像机坐标系 摄像机坐标系是以摄像机为中心制定的坐标系。摄像机成像几何关系如图所示:,4) 世界坐标系 设三维空间中任意一点P在世界坐标系的齐次坐标为 xw , yw , zw , 1T,在摄像机坐标系下的齐次坐标为 xc , yc , zc , 1 T,则摄像机坐标系与世界坐标系的关系:,2. 摄像机小孔成像模型 实际成像系统应采用透镜成像原理,物距u、透镜焦距f、象距v三者满足如下关系:,3. 摄像机非线性成像模型 由于实际成像系统中存在着各种误差因素,如透镜像差和成像平面与光轴不垂直等,这样像点,光心和物点只同一条直线上的前提假设不再成立,这表明
7、实际成像模型并不满足线性关系,而是一种非线性关系。尤其在使用广角镜头时,在远离图像中心处会有较大的畸变,如图所示。像点不再是点P和O的连线与图像平面的交点,而是有了一定的偏移,这种偏移实际上就是镜头畸变。,4. 摄像机的标定1) 传统标定方法 传统的标定方法采用一个标定块(高精度的几何物体)的精确数据与摄像机获得的标定块图像数据进行匹配,求取摄像机的内部参数。 2) 自标定方法 相机自标定是指仅通过相机运动所获取的图像序列来标定内部参数,而不需要知道场景中物体的几何数据。,5.3.2 图像处理,视觉传感系统图像处理的一般流程如图所示:,1. 图像预处理 图像预处理的目的就是增强图像,以便为后续
8、过程做好准备。 1)图像平滑 2)图像灰度修正,2. 图像分割 图像分割就是把图像分成各具特征的区域并提取出感兴趣目标的技术和过程,这里的特征可以是灰度、颜色、纹理等。 图像分割可被粗略分为三类: (1) 基于直方图的分割技术(阈值分割、聚类等); (2) 基于邻域的分割技术(边缘检测、区域增长); (3) 基于物理性质的分割技术(利用光照特性和物体表面特征等)。,3. 特征提取 特征提取就是提取目标的特征,也是图像分析的一个重点。 最常见的图像特征包括:线段、区域和特征点。点特征提取主要是明显点,如角点,圆点等。4. 图像识别 根据预定的算法对图像进行图像识别,或区分出合格与不合格产品,或给
9、出障碍物的分类,或给出定量的检测结果。,5.4智能机器人的视觉传感器,视觉传感器一般由图像采集单元、图像处理单元、图像处理软件、通信装置、I/O接口等构成,如图所示。,5.4.1 照明系统,照明系统的主要任务是以恰当的方式将光线投射到被测物体上,从而突出被测特征部分的对比度。照明系统直接关系到检测图像的质量,并决定后续检测的复杂度。,5.4.2 光学镜头,镜头是视觉传感系统中的重要组件,对成像质量有着关键性的作用。 1镜头的分类 根据焦距能否调节,镜头可分为定焦距镜头和变焦距镜头两大类。,2镜头的选择方法 镜头主要性能指标如下: 1)最大像场 2)清晰场 3)有效场 在选取镜头时,一般从以下几
10、个方面入手进行考虑: 1)相机CCD尺寸 2)所需视场 3)景深 4)畸变,3特殊镜头 针对一些特殊的应用要求,在设计机器视觉系统时,我们还可以选择一些特殊的光学镜头来改善检测系统的性能,常用的特殊镜头有: 1)显微镜头 2)远心镜头 3)紫外镜头和红外镜头,4接口 镜头与摄像机之间的接口有许多不同的类型,工业摄像机常用的包括C接口、CS接口、F接口、V接口等。,5.4.3 摄像机,摄像机是机器视觉系统中的一个核心部件,其功能是将光信号转变成有序的电信号。摄像机以其小巧、可靠、清晰度高等特点在商用与工业领域都得到了广泛地使用。1. 类型 1) CCD摄像机和CMOS摄像机 2) 线阵式和面阵式
11、摄像机,2. 摄像机的主要性能指标 (1) 分辨率 (2) 像素深度 (3) 最大帧率/行频 (4) 曝光方式和快门速度 (5) 像元尺寸 (6) 光谱响应特性,5.4.4 图像处理器,一般嵌入式系统可以采用的处理器类型有:专用集成电路(ASIC)、数字信号处理器(DSP)及现场可编程逻辑阵列(FPGA)智能相机中最常用的处理器是DSP和FPGA。,5.5智能机器人视觉系统,5.5.1智能机器人视觉系统构成 人眼的深度感知能力(Depth Perception),主要依靠人眼的如下几种机能: (1) 双目视差 (2) 运动视差 (3) 眼睛的适应性调节 (4) 视差图像在人脑的融合 (5) 其
12、它因素。,立体视觉系统可以划分为以下六个模块: 1. 图像采集 2. 摄像机标定 3. 特征提取 4. 立体匹配 5. 三维重建 6. 机器人视觉伺服,5.5.2单目视觉,单目测距原理:焦距为f的CCD摄像机距离地面的高度为h,其俯仰角度为;O0是镜头中心;O(x0,y0)是光轴与像平面的交点,可作为像平面坐标系原点; R为目标物体,假设被测点为P,它与镜头中心的水平距离为d; P(x,y)是被测点P在像平面上的投影,如下图所示。,国际仿人机器人奥林匹克竞赛高尔夫比赛项目示意图如图所示,机器人配备了一只CMOS摄像头。,根据上述原理,可以通过二维图像获取深度信息。具体步骤如下: (1) 通过摄
13、像机标定来获取摄像机的参数; (2) 实时获取摄像机的俯仰角; (3) 选取目标物体的目标像素点。 (4) 通过正运动学原理建模获取机器人当前的摄像头的实时高度; (5) 计算距离。,5.5.3 立体视觉,1. 平行式立体视觉模型 最简单的摄像机配置,如图所示。在水平方向平行地放置一对相同的摄像机,其中基线距B=两摄像机的投影中心连线的距离,摄像机焦距为f。前方空间内的点 ,分别在“左眼”和“右眼”成像,它们的图像坐标分别为 , 。 。,1) 几何关系 现两摄像机的图像在同一个平面上,则特征点P的图像坐标Y坐标相同,即 ,则由三角几何关系得到:,2) 性能分析 双目立体成像的视场关系如下图所示
14、。,3) 立体视觉测量过程 立体视觉的测量过程如下: (1) 图像获取 (2) 相机标定 (3) 图像预处理和特征提取 (4) 立体匹配 (5) 深度确定,4) 立体视觉的关键技术 视差本身的计算是立体视觉中最困难的一步工作,它涉及模型分析、摄像机标定、图像处理、特征选取及特征匹配等过程。特征匹配的本质就是给定一幅图像中的一点,寻找另一幅图像中的对应点。它是双目立体视觉中最关键、最困难的一步。,2. 汇聚式立体视觉模型 一般情况下,汇聚式立体视觉采用如图所示的任意放置的两个摄像机来组成双目立体视觉系统。,3. 多目立体视觉模型 多个摄像机设置于多个视点,观测三维对象的视觉传感系统称为多目视觉传
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第五 智能 机器人 视觉 ppt 课件
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-1400606.html