基于卷积神经网络的目标检测算法研究ppt课件.ppt
《基于卷积神经网络的目标检测算法研究ppt课件.ppt》由会员分享,可在线阅读,更多相关《基于卷积神经网络的目标检测算法研究ppt课件.ppt(58页珍藏版)》请在三一办公上搜索。
1、,CONTENTS,1,4,2,5,3,6,研究背景,研究方法2,理论基础,结论,研究方法1,科研成果,RESEARCH BACKGROUNDS,RESEARCH FRAMWORK,RESEARCH METHODS,ANALYSIS AND DISCUSSION,CONCLUSION,SCIENTIFIC ACHIEVEMENTS,1,研究背景,RESEARCH BACKGROUNDS,内容简介BRIEF INTRODUCTION,本文以智能交通为背景,针对智能视频监控系统进行剖析,对其中目标检测算法进行了具体的研究和改进。首先,针对目标检测特征提取环节,本文以卷积神经网络为基础,构建深度特征
2、提取器,提取深度特征训练可变形部件模型,作为最终的检测模型,并有效的提高检测精度。另外,在目标后处理环节中,将抑制重复检测和误检的面积重叠率阈值动态化后,进一步的提高了检测精度,减少了误检和重检。,PPT模板下载:行业PPT模板:节日PPT模板:PPT素材下载:PPT图表下载:优秀PPT下载:PPT教程:Word教程:Excel教程:资料下载:PPT课件下载:范文下载:试卷下载:教案下载:PPT论坛:,智能交通中的目标检测,传统的视频监控解决方案只是进行视频图像的记录、存储与调取等机械的操作,用来记录发生的事情,不具有针对异常情况进行预测和报警的作用。需要工作人员时时刻刻查看显示屏,才能进行预
3、测和报警。由于传统视频监控技术的不足,所以智能视频监控被用来帮助工作人员发现异常情况并及时报警。,1,研究背景,RESEARCH BACKGROUNDS,智能视频监控的功能是让计算机模拟人类的大脑对图像的处理机制,利用摄像头模拟的人类的眼睛,运行图像处理算法,分析从摄像头中获取的图像序列,并对被监控场景中的内容进行理解,实现对异常行为的自动预警和报警。智能监控的智能化主要表现在对图像序列中的目标进行检测、目标识别,理解目标的行为。目前常用的智能监控系统主要包括视频获取、图像预处理、目标检测、目标分类、目标跟踪、目标行为分析和理解等七个部分,图1-1给出了智能监控系统具体的流程图。,图1-1,国
4、内现状,大部分目标检测算法任然使用单一或者几种手工设计的特征。手工设计的特征,不仅计算开销大,降低算法的执行速度,对于目标多样性的变化并没有很好地鲁棒性,严格限制应用前提。因此亟需对特征提取进行改进。,1,研究背景,RESEARCH BACKGROUNDS,国外现状,在国外,也经历了由人工设计特征到算法自动设计并提取特征的过程。2010年,Dalai等利用人工设计的方向梯度直方图特征,训练出来多视角的可变形的检测模型,虽然有效的提高了检测精度,但仍然存在计算复杂,对小目标鲁棒性不强等问题。2012年,卷积神经网络在全球图像分类比赛中得到最优的成绩,因此卷积神经网络自适应的提取图像特征受到重视,
5、卷积神经网络通过反向传播算法进行网络参数的更新,通过自适应的调整不同特征的权重有效的组合特征,得到鲁棒性更好的高层特征。因此,如果让计算机主动学习图像的特征,相对于人工设计的特征而言,能够有效的提高检测精度,改善实验结果。,1,研究背景,RESEARCH BACKGROUNDS,国外现状,1,研究背景,RESEARCH BACKGROUNDS,目标检测;卷积神经网络;非极大值抑制,本文研究的最终目的是将卷积神经网络应用到目标检测任务中:如何避免手工设计的特征,减少计算的复杂度,提高算法执行速度,最终提高检测精度。具体的基于现有的开发库,在现有的卷积神经网络模型的基础上,利用迁移学习和重新训练,
6、更新模型参数,提取深度特征并训练分类器。同时在滑动窗口检测后,动态化面积重叠率阈值,进一步提高检测精度。,目标检测,针对不同场景图像,能够对不同类目标进行自动检测和识别,定位目标的位置和识别目标的类型。,卷积神经网络,一种模拟人类大脑皮层视觉处理机制,由多个神经元连接并列成一层,多层神经元构成多层视觉处理结构。,非极大值抑制,检测过程得到的重复检测和误检,需要利用非极大值抑制算法来减少,对于不同类的目标需要动态化面积重叠率阈值。,1,研究背景,RESEARCH BACKGROUNDS,研究内容,深度学习,研究了深度学习的背景知识:包括深度学习的概念,以及典型的常用的深度学习模型。,卷积神经网络
7、,研究了卷积神经网络的基本原理,组成和连接方式。,基于深度特征的目标检测,研究了基于现有的卷积神经网络模型Alexnet,通过迁移学习,获得深度特征提取器,提取特征训练多组件的可变形部件模型,对不同类目标的多样姿态进行检测。,基于动态阈值的非极大值抑制,研究了目标检测后处理过程,分析了其中的非极大值抑制算法,对核心的阈值进行了动态化,实现了自适应的抑制重检和误检。,1,研究背景,RESEARCH BACKGROUNDS,1,2,3,深度学习,卷积神经网络的连接方式,卷积神经网络,2,研究框架,RESEARCH FRAMWORKS,深度学习概念,典型的深度学习模型,卷积神经网络基本原理,前向传播
8、和反向传播,局部感受野和权值共享,多核卷积,2,研究框架,RESEARCH FRAMWORKS,在大数据,大模型,大计算的驱动下,深度学习属于一种深度学习模型。其实深度学习实质就是将低层特征进行有效的组合从而生成更丰富的深层特征,现有的许多识别和分类模型都是浅层模型,限制较多,在样本数量较少,计算机计算单元不足的情况下,对高非线性的复杂函数的逼近能力不足,所以应用于识别和检测问题时,会出现分类准确率不高,泛化性不足等问题。而利用深度学习框架则不同,通过训练深层非线性的多层网络模型,学习到的最优模型参数可以将样本的最本质的特征表示出来。深度学习最经典的模型就是全连接的神经网络,如自适应编码器,深
9、度置信网络,还有就是卷积神经网络。,1.深度学习,深度学习的基本概念,深度学习的典型结构,2,研究框架,RESEARCH FRAMWORKS,2.卷积神经网络,卷积神经网络的基本原理,卷积神经网络是第一个真正训练多层神经元连接的深度学习模型,该模型构造方式是受到人类视觉系统处理机制的影响,利用权值共享的神经元在输入图像上进行卷积计算,则能获得同一种特征,当利用多种不同权值的神经元在输入图像上进行卷积操作,则能获得多种特征。该网络可以直接输入原始图像,避免了对图像进行复杂的前期预处理,因而得到广泛的应用。,2,研究框架,RESEARCH FRAMWORKS,CNN模型AlexNet,是由多层神经
10、元构成,其中前5层为卷积层,因为这些层神经元的连接方式是通过卷积核模板连接,是非全连接的方式连接,所以称为卷积层。后三层为全连接层,采用的连接方式为全连接,所以称为全连接层。,卷积神经网络的基本原理,卷积层,每一层和前一层之间依靠卷积核连接,每一个卷积核都在前一层特征映射图的局部感受野进行卷积操作,同时由于卷积核表示的是神经元权重。卷积模板为22,上一层的特征图分辨率是44,用这个卷积核在特征图上按固定的步长和顺序遍历计算一遍,计算得到33的特征图,池化层也是CNN模型中重要的一层,对于降低特征向量的维数,避免维数灾难有重要的作用。所以一般情况下,池化层都是跟随在卷积层的后面。图像在某一区域的
11、特征分布与其他区域的特征分别类似。所以在描述大的图像时,可以对不同位置的特征进行聚合统计,聚合统计后在求均值或者最大值,均值或者是最大值即为池化后的结果。,2.卷积神经网络,2,研究框架,RESEARCH FRAMWORKS,2.卷积神经网络,卷积神经网络的基本原理,从人类大脑角度理解神经网络,卷积神经网络中的神经元与我们的大脑无关,是通过函数f将输入图像转变成类别评分。,2,研究框架,RESEARCH FRAMWORKS,2.卷积神经网络,卷积神经网络的基本原理,从人类大脑角度理解神经网络,卷积神经网络中的神经元与我们的大脑无关,是通过函数f将输入图像转变成类别评分。,2,研究框架,RESE
12、ARCH FRAMWORKS,卷积神经网络的基本原理,2.卷积神经网络,2,研究框架,RESEARCH FRAMWORKS,前向传播和反向传播,2.卷积神经网络,2,研究框架,RESEARCH FRAMWORKS,前向传播和反向传播,2.卷积神经网络,2,研究框架,RESEARCH FRAMWORKS,局部感受野和权值共享,2.卷积神经网络,(a)神经元在感受野全连接,(b)神经元在感受野局部连接,2,研究框架,RESEARCH FRAMWORKS,多核卷积,2.卷积神经网络,边缘特征,LBP特征,3,研究方法1,RESEARCH METHODS1,1,基于深度特征的目标检测,提取深度特征,训
13、练分类器,目标检测,结果与分析,迁移学习,深度特征金字塔,训练LSVM,PASCAL数据集,单组件目标检测,多组件目标检测,3,研究方法1,RESEARCH METHODS1,3.基于深度特征的目标检测,Felzenswalb等人40研究了基于可变形部件模型DPM,通过提取目标的HOG特征,对组成目标的局部模型建模,采用多样本学习并进行推理,最后利用根滤波器和部分滤波器对测试图像进行匹配检测实现目标检测。该方法为基于模型的检测方法提供了新的思路,但是局部判别式模型只采用了HOG特征,忽略的一些可靠的高层和底层特征,在一定程度上制约了检测的精度。,本章利用CNN对DPM算法进行改进。首先通过迁移
14、学习获取CNN模型AlexNet,然后将其截断获得AlexNet的卷积层,用来提取丰富的高层特征,具体是利用模型的前5层卷积层来获取深度特征,然后利用特征金字塔的每一层特征训练隐藏变量的支持向量机LSVM得到DPM的全局检测器和局部检测器。检测的过程中要对测试图像构造全局特征映射图和局部特征映射图,再对局部特征映射图进行池化,之后级联全局特征映射图得到新的特征映射图,然后用训练好的判别式模型去卷积级联后的特征映射图,得到检测结果。实验表明,利用CNN获取深度特征,训练可变形部件模型,有效的改进了算法的检测精度。,3,研究方法1,RESEARCH METHODS1,3.基于深度特征的目标检测,迁
15、移学习,3,研究方法1,RESEARCH METHODS1,3.基于深度特征的目标检测,迁移学习,通过分析AlexNet模型中的隐层可以发现,其中的底层的功能的是图像通用特征的提取,并在高层生成图像的深度特征。这一发现暗示,如果将AlexNet的底层看做一个特征提取器,则可以在其他的视觉任务重复中使用。因此最终用ImageNet训练AlexNet模型获得初始参数,然后利用迁移学习获得最终的模型参数。,参数迁移,源任务,目标任务,可变形部件模型,3,研究方法1,RESEARCH METHODS1,3.基于深度特征的目标检测,深度特征金字塔,首先要截断该网络,去除掉最后卷积层后的Mp层(max p
16、ool,如图2-4),所有的全连接层(fc6,fc7,fc8,如图2-4)。这样,网络的输出变成了第5层卷积层计算得到的256通道特征映射图。其中最左侧的是输入图像,后面的5层是卷积层,最右侧的是第5层卷积层,也就是卷积模型的输出层,该层包含256个卷积模板,所以得到的特征金字塔每层都有256个通道特征图。,3,研究方法1,RESEARCH METHODS1,3.基于深度特征的目标检测,提取深度特征,从图3-4中可以看出,利用AlexNet前5层卷积层得到的深度特征金字塔的可视化图,选取的是256通道中的最后一个通道的七层。图中第一排第一列是原图像,接着从左往右分别是深度特征金字塔层的第一层、
17、第二层、第三层,第二排从左往右表示的是深度特征金字塔的第四至第七层。从图中可以看出,金字塔层的第一层尺度是原图像尺度的十分之一。,3,研究方法1,RESEARCH METHODS1,3.基于深度特征的目标检测,训练分类器,PASCAL VOC 2007数据集 训练及测试样本,3,研究方法1,RESEARCH METHODS1,3.基于深度特征的目标检测,训练分类器,本文采用的DPM算法,需要训练出目标的全局模型和局部模型,由于没有在训练集和测试集中的标注文件中给出部件的类别和位置信息,所以相当于将部件的信息隐藏起来了,将这些信息作为隐藏变量,将所有的隐藏变量定义为集合,集合中定义了样本所有可能
18、的隐藏变量值。,这里是模型参数向量,是隐藏变量。是样本所有可能取的隐藏变量值的集合。对以上得分阈值化,就可以得到了样本的分类类标。,3,研究方法1,RESEARCH METHODS1,3.基于深度特征的目标检测,训练分类器,本文使用带类标的样本,来训练参数,通过最小化下面的目标函数:,其中是标准铰链损失函数,常数C控制正则项的相对权重。,3,研究方法1,RESEARCH METHODS1,3.基于深度特征的目标检测,单组件目标检测,1.获得5层CNN输出的 256通道7层特征金字 塔,对于其中的每一 层分别输入到检测系 统中;,2.将每一层通道特征图分别 去和根滤波器,个部件滤 波器进行卷积,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 卷积 神经网络 目标 检测 算法 研究 ppt 课件
链接地址:https://www.31ppt.com/p-3005279.html