目标检测RCNN系列讲解ppt课件.pptx
《目标检测RCNN系列讲解ppt课件.pptx》由会员分享,可在线阅读,更多相关《目标检测RCNN系列讲解ppt课件.pptx(38页珍藏版)》请在三一办公上搜索。
1、,基于R-CNN的系列目标检测算法,组员:,R-CNN, SPP NET, Fast R-CNN, Faster R-CNN,目 录,CONTENTS,01,背景知识,02,RCNN,SPP NET,Fast R-CNN,Faster R-CNN,03,05,04,实例展示,06,01,背景知识,PART ONE,背景知识,目标检测是在给定的图片中精确找到物体所在位置,并标注出物体的类别。物体的尺寸变化范围很大,摆放物体的角度,姿态不定,而且可以出现在图片的任何地方,并且物体还可以是多个类别。,目标检测,背景知识,图像识别(classification):输入:图片输出:物体的类别评估方法:准
2、确率。,定位(localization):输入:图片输出:方框在图片中的位置(x, y, w, h)评估方法:检测评价函数 intersection-over-union,背景知识,目标检测算法,1.传统的目标检测算法:Cascade + HOG/DPM + Haar/SVM以及上述方法的诸多改进、优化;,2. 候选区域/窗 + 深度学习分类:通过提取候选区域,并对相应区域进行以深度学习方法为主的分类的方案,如:R-CNN(Selective Search + CNN + SVM)SPP-net(ROI Pooling)Fast R-CNN(Selective Search + CNN + R
3、OI)Faster R-CNN(RPN + CNN + ROI)R-FCN等系列方法;,3. 基于深度学习的回归方法:YOLO/SSD/DenseBox 等方法;以及最近出现的结合RNN算法的RRC detection;结合DPM的Deformable CNN等。,02,R-CNN,PART TWO,R-CNN,传统目标检测方法,传统目标检测的算法基本流程如下:使用不同尺度的滑动窗口选定图像的某一区域为候选区域;从对应的候选区域提取如Harr HOG LBP LTP等一类或者多类特征;使用Adaboost、SVM 等分类算法对对应的候选区域进行分类,判断是否属于待检测的目标。,1、基于滑动窗口
4、的区域选择策略没有针对性,时间复杂度高,窗口冗余;2、手工设计的特征对于多样性的变化没有很好的鲁棒性。,传统目标检测方法的缺点,R-CNN,R-CNN是Region-based Convolutional Neural Networks的缩写,中文翻译是基于区域的卷积神经网络,是一种结合区域提名(Region Proposal)和卷积神经网络(CNN)的目标检测方法。区域提名(Region Proposal):利用图像中的纹理、边缘、颜色等信息,预先找出图中目标可能出现的位置。需要解决的问题:(1)适应不同尺度 (2)多类别图像的适应性 (3)速度。R-CNN的主要贡献:1)传统目标检测算法一
5、般使用滑动窗口扫描所有可能区间,同时需要考虑变化窗口尺寸以适应不同大小的目标,这种方法效率太低。R-CNN使用Selective Search方法预先提取所有候选区域;2)传统目标检测算法依赖人工设计的特征,R-CNN使用深度学习自动提取和学习特征。,R-CNN,R-CNN的简要步骤如下:(1) 输入测试图像;(2) 利用选择性搜索( Selective Search )算法在图像中从下到上提取2000个左右的可能包含物体的候选区域;(3) 因为取出的区域大小各自不同,所以需要将每个候选区域缩放(warp)成统一的227x227的大小并输入到CNN,将CNN的fc7层的输出作为特征;(4) 将
6、每个候选区域提取到的CNN特征输入到SVM进行分类。,R-CNN的总体思路,R-CNN,Selective Search算法,使用 Efficient Graph-Based Image Segmentation的方法获取原始分割区域R= r 1 , r 2 , r n 。区域内间距区域为对应最小生成树中权重最大的边的权重值。区域间间距即在所有分别属于两个区域且有边连接的点对中,寻找权重最小的那对(若两个区域内的点没有边相连,则定义间距为正无穷大)。2. 初始化相似度集合=。3. 计算两两相邻区域之间的相似度将其添加到相似度集合中。 r i , r j = 1 r i , r j + 2 r
7、i , r j + 3 r i , r j + 4 r i , r j 4. 从相似度集合中找出,相似度最大的两个区域 r i 和 r j ,将其合并成为一个区域 r ,从相似度集合中除去原先与 r i 和 r j 相邻区域之间计算的相似度,计算 r 与其相邻区域(原先与 r i 或 r j 相邻的区域)的相似度,将其结果添加的到相似度集合S中。同时将新区域 r 添加到区域集合R中。5. 获取每个区域的Bounding Boxes,这个结果就是物体位置的可能结果L。,R-CNN,RCNN的具体步骤,步骤一:训练(或者下载)一个分类模型(比如AlexNet),R-CNN,步骤二:对该模型做fin
8、e-tuning将分类数从1000改为20,比如20个物体类别 + 1个背景去掉最后一个全连接层,R-CNN,步骤三:特征提取提取图像的所有候选框(选择性搜索Selective Search);对于每一个区域:修正区域大小以适合CNN的输入,做一次前向运算,将第五个池化层的输出(就是对候选框提取到的特征)存到硬盘。,R-CNN,步骤四:训练一个SVM分类器(二分类)来判断这个候选框里物体的类别每个类别对应一个SVM,判断是不是属于这个类别,是就是positive,反之nagative。比如下图,就是对狗分类的SVM,R-CNN,步骤五:使用回归器精细修正候选框位置:对于每一个类,训练一个线性回
9、归模型去判定这个框是否框得完美,R-CNN,1、基于R-CNN目标检测算法只能输入固定尺寸的图片,样本输入受限2、经人工处理过的图片,易降低网络识别检测精度3、R-CNN需对各候选区域进行一次卷积操作,计算量大,耗时长,R-CNN存在的问题,人工图片处理样例,03,SPP NET,PART THREE,SPP NET,在R-CNN的第一步中,对原始图片通过Selective Search提取的候选框多达2000个左右,而这2000个候选框每个框都需要进行CNN提特征+SVM分类,计算量很大,导致R-CNN检测速度很慢,一张图都需要47s。而且,基于R-CNN目标检测算法只能输入固定尺寸的图片,
10、样本输入受限,使用很不方便。那么如何改进呢?SPP-NET的出现恰好解决了这些问题。,SPP-Net(Spatial Pyramid Pooling)是何凯明2014年提出的方法,通过解决传统CNN无法处理不同尺寸输入的问题对同年的R-CNN算法做改进,实验结果表明SPP方法比R-CNN快了近100倍从算法架构上,SPP-Net与R-CNN相似:通过Selective Search获取候选区域,最后也是使用SVM做分类。但不再将每个候选区域过一次CNN,而是将原始图过一次CNN,在CNN的全连接层前添加新提出的SPP层,根据候选区域位置crop的图像卷积结果通过SPP层来确保输入全连接层的尺寸
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 目标 检测 RCNN 系列 讲解 ppt 课件
链接地址:https://www.31ppt.com/p-1352758.html