视频中的行人检测数字图像处理课程设计说明书.doc
《视频中的行人检测数字图像处理课程设计说明书.doc》由会员分享,可在线阅读,更多相关《视频中的行人检测数字图像处理课程设计说明书.doc(29页珍藏版)》请在三一办公上搜索。
1、目 录目 录I摘 要II第 1 章 绪论11.1 研究背景与意义11.2 智能视频监控概述21.2.1 智能视频监控的发展21.2.2 智能视频监控的研究内容31.3 行人检测与跟踪31.3.1 行人检测41.3.2 行人跟踪41.4 国内外研究现状41.5 论文主要研究内容与章节安排6第 2 章 视频序列图像中运动目标检测与跟踪方法72.1 图像处理基础72.1.1 颜色空间72.1.2 图像预处理102.1.3 形态学方法102.2 运动目标检测方法102.2.1 背景差分法102.2.2光流法112.2.3 边缘检测方法122.3 运动目标跟踪方法122.3.1 基于特征的跟踪方法132
2、.3.2 基于模型的跟踪方法142.3.3 基于主动轮廓的跟踪方法152.4 本章小结16三、设计内容XVII3.1背景减法运动目标检测XVIII3.2阈值的选取XX3.3形态学滤波XXI四、实验结果及分析XXV结束语XXVII摘 要 智能视频监控是计算机视觉领域新兴的研究方向,它通过对摄像机拍摄的视频图像序列进行自动分析来对被监控场景中的事物变化进行定位、跟踪和识别,并以此对相关目标的行为进行分析和判别,在实现了日常管理工作的同时又能对目标的异常行为做出及时反应。行人目标检测与跟踪算法是智能视频监控系统中的核心问题,研究相关算法对于提高智能视频监控系统的性能具有重要的意义。本文在熟悉和掌握了
3、有关数字图像处理原理和技术的基础上,分析对比了常用的目标检测和跟踪方法,针对不同条件下的行人目标检测和跟踪进行了研究。本文完成的主要研究工作如下:1)针对运动摄像机跟踪行人所导致的背景运动与行人尺寸变化问题,提出了一种综合应用梯度方向直方图和粒子滤波的行人跟踪算法。该方法以粒子滤波为跟踪框架,利用改进的小型化梯度方向直方图方法实现了小尺度行人跟踪,并根据其检测结果确定目标,不断修正粒子采样,有效实现了行人跟踪。仿真实验结果表明,与传统的粒子滤波算法相比,该算法能够更加准确有效地跟踪动态背景中尺寸变化的行人目标。2)介绍了智能视频监控系统的重要应用社会治安视频监控系统,在分析其图像处理技术及架构
4、后,针对实际监控条件与要求,完成了行人检测和跟踪模块的设计,采用matlab平台和 OpenCV 算法库进行了图像提取和预处理、运动目标分割、目标分类、目标特征提取、行人目标跟踪等部分的功能实现。实验结果表明,本模块能够处理一般静态背景条件下的行人目标,满足了实际应用的初步要求。关键词:智能视频监控 行人检测 行人跟踪 粒子滤波 动态背景 梯度方向直方图II第 1 章 绪论1.1 研究背景与意义 计算机视觉是计算机科学和人工智能的一个重要分支。它研究的主要内容包括怎样利用各种成像系统代替视觉器官来获取信息,由计算机代替大脑完成对信息的处理和解释使计算机具有人一样的视觉功能。智能视频监控技术是计
5、算机视觉领域近年来新兴的一个研究方向,是模式识别技术在视频监控领域的重要应用。智能视频监控的研究对象为监控视频中的行人、车辆和其他物体。它通过对视频中的运动目标进行实时检测、跟踪和行为分析,使得系统能够自动去除大量的非必要信息。通过分析视频图像中目标的运动行为,它可以为实时的监控和预警提供更为有效的信息。 智能视频监控技术将计算机视觉同网络化的视频监控结合起来,增强了系统的智能化自动处理能力,从而极大地减少主观干扰,增强监控效果,在减轻了相关人员的工作量的同时,对视频监控场景中的目标实现了自动实时的检测、跟踪、识别与分析等功能。智能视频监控技术可用于安防监控、智能交通、医院护理等众多方面,具有
6、重要的研究意义和美好的应用前景。当前较多的应用主要集中在以下几个方面:行人和车辆目标的自动检测、跟踪和识别,目标异常行为预警,敏感场所的异常物体滞留以及物品丢失,人流量估计、人群运动监测及拥塞控制,行人和车辆的交通流量监测等。 作为当前视频监控系统发展的必然方向,近年来智能视频监控相关技术的研发受到一些发达国家的重视,其商业化应用也得到了很大的发展。尤其在 2001年美国 9.11 事件及 2005 年英国 77 伦敦地铁爆炸案等恐怖暴力事件的发生后,出于对反恐、社会安定、国家公共安全等多方面的考虑,世界各国更是都高度重视如何在重要、敏感的安全相关部门和拥有很大人流量的公共场合实现 24 小时
7、自动化实时的监测,智能视频监控成为了国际上最被关注的前沿研究领域之一。考虑到监控场景中行人是作为主要目标,因而行人行为分析作为智能视频监控的重要功能部分,正受到当前诸多研究人员的关注。行人行为分析的实现要以行人检测与跟踪为基础,所以对行人的检测和跟踪是一个至关重要的问题。对运动人体快速而准确的检测和跟踪是一项十分重要且极具挑战性的工作,这属于智能视频监控系统的前端工作,其工作性能的好坏将直接影响后续工作以至整个系统的性能。除了视觉监控之外,人体检测和跟踪在高级人机交互、动画制作等方面也有着广泛的应用。1.2 智能视频监控概述1.2.1 智能视频监控的发展智能视频监控是在传统的视频监控基础上发展
8、起来的。传统的视频监控自投入应用已有数十年,其发展经历了三个时代。第一代:模拟时代。上个世纪末以前,初始的视频监控以模拟式磁带录像机(Video Cassette Recorder, VCR)为代表。此时的视频监控存储量大,信息检索和查询相对困难。第二代:数字时代。进入 21 世纪后,随着数字视频压缩编码技术的产生和发展,数字式视频录像机(Digital Video Recorder, DVR)投入使用。数字化存储极大增强了对视频信息的处理效率,事后的信息检索也变得相对简单。第三代:网络时代。从 2004 年开始,随着网络带宽的提高和成本的降低、硬盘容量的加大和中心存储成本的降低,以及各种实用
9、视频处理技术的出现,视频监控步入了全数字化的网络时代,DVR 系统进一步发展为网络数字视频录像机(Network DVR, NVR),实现了视频信息的数字化网络传播。更进一步,发展成为了网络化视频监控系统,又称 IP 监控系统(IP Video Surveillance, IPVS)。网络化视频监控系统基于 TCP/IP 协议,采用开放式架构,其视频信息从摄像机或网络视频服务器下来就直接进入网络,以数字视频的压缩、传输、存储和播放为基础,通过强大的平台软件实施管理。视频监控系统在系统功能和设备性能上得到了很大的提高,但是仍然受到了一些固有因素的限制,整个系统在安全性和实用性方面难以满足人们不断
10、提高的要求(李子青,2007)。具体的制约因素如下:(1)人类自身的弱点。很多情况下,由于生理上的弱点,人们经常无法觉察安全威胁,从而产生了漏报(false negatives)的现象。(2)监控时间。大多数视频监控系统难以按照 1:1 的比例来配置监控摄像机和视频显示装置,尤其是在机场、港湾等大型的视频监控系统中,各个监控点很难都处于监控之下。(3)误报和漏报。这是视频监控系统中最常见的两大问题,误报(falsepositives)会浪费人力物力,漏报可能会导致非常危险的后果发生。这两种情况都会大大降低人们的信任,进而降低监控系统的应用价值。(4)数据分析困难。传统的视频监控系统缺乏智能因素
11、,录像数据无法被有效地分类存储,更毋论其他的智能处理,因此数据分析工作要耗费相当多的时间。而经常发生的误报漏报现象也造成了无用数据的进一步增加,带来更大的困难。(5)响应时间长。对于安全威胁的响应速度直接关系到一个安全系统的整体性能。传统的视频监控系统通常由人来对威胁做出响应和处理,而实际处理问题时,往往同时涉及到多个功能部分,需要多个相关部门的协调配合,共同处理,因而对响应时间有了更高的要求。为了解决上述导致视频监控系统效率低下的问题,人们把计算机视觉的相关技术引入视频监控中,从而发展起新型的视频监控技术智能视频监控,也称自动视频监控,在视频监控系统中处于核心地位,对于整个系统的效率提高具有
12、重要意义。1.2.2 智能视频监控的研究内容智能视频监控的研究内容包括运动目标检测、运动目标跟踪以及对监视场景中目标行为的理解与描述,如图 1.1 所示。图 1.1 中,目标检测、目标分类、目标识别和目标跟踪是视频处理中的基础部分,而行为分析和理解则属于更高级的处理分析部分。运动检测、目标分类和目标跟踪是研究者们关心最多的三个基本问题;而行为分析与理解因为跟应用直接相关,所以近些年成为被广泛关注的热点问题。1.3 行人检测与跟踪视频监控场景中行人是监控的主要对象,因此对行人的检测和跟踪是一个至关重要的问题,这属于智能视频监控系统的底层工作,其性能好坏将直接影响后续工作乃至整个系统的性能。1.3
13、.1 行人检测行人检测就是把视频图像中的行人目标从背景中分割出来并精确定位。基于视觉的行人检测目前仍旧是计算机视觉领域的一个公认的难题。原因在于:行人同背景混合在一起,行人可能走,也有可能站着或者不可预测地改变运动方向;行人所处的背景非常复杂,特别是当视觉系统基于运动云台上的摄像系统时,背景的突然改变不可避免。到目前为止,一些人体检测系统在某些约束环境中被证明能有效地检测行人,从而鼓舞了研究人员开展进一步的研究工作。行人的衣着、运动姿态、光照存在着很大的差异,并且存在背景复杂、遮挡和其它运动物体的干扰,这些因素是行人检测要解决的重点问题。1.3.2 行人跟踪行人跟踪监视人体在视频中的空间和时间
14、变化,包括人体的出现、位置变化、大小信息、形状等,在连续帧上匹配目标区域,求解时间上的对应问题。基于视觉的人体跟踪一般从人体检测开始,而且在后继的视频序列中需要不断地检测人体以校验跟踪和维持跟踪连续进行,它是人体的姿态估计和活动识别的基础。跟踪过程根据应用场景中的目标数目分为单目标和多目标。场景中目标数目的不同,跟踪的难易程度不同,所采用的技术也不同。1.4 国内外研究现状伴随着视频处理、数据库、人工智能等学科的发展,智能视频监控越来越显现出广阔的应用前景和潜在的经济价值。欧美等国家将其作为是维护社会安全的重要手段,投入大量人力、财力以促进其发展。例如,1997 年美国国防高级研究项目署(DA
15、RPA)设立了 VSAM(VisualSurveillance And Monitoring)(Collins et al. 2000)项目,该系统融合多种不同类型传感器,研究军事和民用场景下视频理解技术。2004 年,英国的雷丁大学与法国 INRIA 等研究机构共同开展了智能监控项目 AVITRAC(Sullivan5et al. 2000)的研究,研究对机场地面目标进行智能跟踪和异常行为监控与报警的系统解决方案。智能视频监控更是受到很多学者的高度关注,在理论方面取得了长足的进展。计算机视觉领域中的著名期刊如 IJCV、CVIU、PAMI、IVC 和重要的学术会议如 ICCV、CVPR、EC
16、CV、IWVS 等先后刊登了大量智能视觉监控领域相关的最新研究成果。国际上也有许多公司研究智能视频监控技术并推出了市场化的产品(焦波,2005)。其中有美国的 Vidient 和 ObjectVideo 等公司。Vidient 前身为 NEC 公司的一个实验室,产品 SmartCatch,能检测包括移动物体检测、遗留物体检测、周边入侵检测等的多种异常行为,其主要用户为机场;ObjectVideo 公司的产品类型包括边界保安和入侵探测、可疑人员逗留、物品遗留异样物体探测、财产保护防盗探测、人流物流监控,图像变化摄像机检测、交通工具监控和测速等等。还有以色列的 Mate、NiceVision 和
17、Ioimage 等公司也提供了市场化的产品。Mate 的主要产品为 BehaveWatch,可检测六种异常行为,包括路径检测、突然出现报警、定向运动检测等,提出三层防护概念;NiceVision 视频分析仪对不同的威胁提供实时侦测功能,其检测活动包括对闯入者、车辆、被遗弃的行李和包裹、周边及设施保护、阻塞安全出入口及消防路线、盗窃侦测防止安全设备被移动、计算人数,车辆和其它其物件、显示人群聚集、监控安全率水平、量度人流、显示企图尾随进入入口处控制点等;Ioimage 的产品能实现五种行为的检测,包括入侵探测、PTZ 自动跟踪、遗留物体探测、非法滞留探测、移动物体探测等。以及法国的 CitiLo
18、g 公司,其核心技术是自主研发的动态图像背景自适应技术和车辆图像跟踪技术,彻底消除了光线、雨雪、灰尘对系统的影响,可以及时检测监控区域内发生的交通事件,采集交通数据,辅助进行交通控制等。智能化监控技术在中国起步较晚,其技术研发和市场推广都有待进一步发展,当前大多数国内视频监控产品都是非智能化的。随着公共安全意识的提高,国内市场上对智能化视频监控产品的需求日益增大,己经有部分公司如海康威视、智安邦等企业开展相关的研究。但是,受到国内研发能力限制,当前大多公司都是引进国外成熟技术,推出面向中国市场的相关产品。如汉王科技公司与Mate 公司合作推出了基于多种行为的嵌入式视频检测产品。国内的科研机构近
19、年来也在积极展开智能视频监控系统的研究与商业产品开发(李子青,2007)。中国科学院自动化所模式识别国家重点实验室视觉监控小组总结了英国雷丁大学 VIEWS 的车辆交通监控原型系统的研究经验,在以往的理论研究的基础上,自行设计并初步实现了一个拥有完全自主知识产权的交通监控原型系统 Vstar(Visual Surveillance Star)。另外还有南京大学、南京长城6信息系统有限公司和江苏省公安厅刑警总队联合研制的“基于单幅训练图像的多表情人脸自动识别系统”等等。行人检测是指将行人区域从视频图像中分割出来,其分割的有效与否影响后期目标跟踪、行为分析和理解等高层处理的效果。因为图像背景存在动
20、态变化,以及阴天、雨雪、光照阴影和其他干扰等的影响,使得运动检测工作具有相当困难,当前的常用方法有背景差分法(Haritaoglu et al. 2000)、相邻帧差分(Collins et al. 2000)、光流法(Mayer et al. 1998)以及基于目标特征的统计识别(Stauffer and Grimson 2000)等检测方法。行人跟踪大多是基于位置、速度、色彩、纹理等特征的目标匹配跟踪,存在很多的相关算法。Polana et al(1994)和 Daniel et al(2002)都提出基于运动特征的跟踪方法,Polana 以质心为特征实现了行人运动跟踪,Daniel 利用
21、了颜色特征,对多目标进行分类、识别和跟踪。Kass et al(1992)利用 Snake 轮廓模型进行目标跟踪。Park et al(200l)对 Snake 方法有所改进,提出一种指向型的Snake 模型,可减少边缘定位错误。Gardner et al(1996)提出了基于 3D 模型的方法,Ralf et al(2001)在此基础上建立了人体 3D 模型。Avidan et al(2004)提出了支持向量跟踪算法(Support Vector Tracking),通过将支持向量机与基于光流场的跟踪器相结合,在目标邻域搜索具有最大 SVM 得分的区域进行跟踪。Isard 和Blake(19
22、98)等提出condensation (conditional Density Propagation)算法,通过先验概率采样,再根据观测似然修正权值,以此近似后验概率。Deutscher et al(2001)等采用退火粒子滤波(Annealed Particle Filtering),并采用自动空间分解和交叉算子进行跟踪。当前在行人检测和跟踪方面已经开展了大量的工作,取得了很多研究成果,但面临各种具体情况,仍存在着许多问题有待解决。本文针对动态场景和静态场景进行了研究,分别提出了有特色的行人检测和跟踪方法。1.5 论文主要研究内容与章节安排本文主要研究社会治安视频监控中行人目标的检测与跟踪
23、,为更高级的行为分析和异常行为检测奠定基础。本文在分析常用运动目标检测以及运动跟踪方法的基础上,结合行人目标特点,实现了社会治安视频中行人目标的智能检测与跟踪。同时针对运动摄像机跟踪行人所导致的背景运动与行人尺寸变化问题,本文提出了一种综合应用梯度方向直方图(Histograms of Oriented Gradients,HOG)和粒子滤波的行人跟踪算法。第 2 章 视频序列图像中运动目标检测与跟踪方法智能视频监控中的行人检测与跟踪方法涉及到很多研究领域,如数字图像处理、计算机视觉、信息融合、模式识别与人工智能等。为了后续各章内容的展开,本章系统地介绍相关的一些预备知识和常用的目标检测与跟踪
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 视频 中的 行人 检测 数字图像 处理 课程设计 说明书
链接地址:https://www.31ppt.com/p-2391764.html