计算机模式识别文献阅读.ppt
《计算机模式识别文献阅读.ppt》由会员分享,可在线阅读,更多相关《计算机模式识别文献阅读.ppt(41页珍藏版)》请在三一办公上搜索。
1、课程:计算机模式识别,课 题:集成学习与Adaboost算法 学 院:通信与信息工程学院 学 号:学生姓名:上课老师:,学期:春 2015,集成学习理论Adaboost算法原理论文分析1.The Human Face Detection Algorithms Based on AdaBoost2.Face Detection Based on Skin Color Segmentation and AdaBoost Algorithm,目 录:,1.0 集成学习术语,强分类器:如果一个学习算法通过一组样本的学习后,能够达到理想的识别率。,弱分类器:如果一个学习算法的识别率仅好于随机的猜测。,1
2、 集成学习理论,1.1 集成学习动机,在机器学习中,直接建立一个高性能的分类器是很困难的。但是,如果能找到一系列性能较差的分类器,并把它们集成起来的话,也许就能得到更好的分类器。,譬如选总统,每个人都以自己的考虑,投下自己的一票,但最后由多数人选出的总统,似乎应该好于由一个人指定的总统。,集成学习,就是一种把输入送入多个学习器,再通过某种办法把学习的结果集成起来的办法。,1.2 集成学习概念,弱分类器,1.3 集成学习构造,我们一般选定加权平均的方法来构造集成学习的最终学习器。但是里面的每一个Classifier i怎样做呢?,有一些研究,针对每个学习器都不同构的情况。比如识别一个人,一个学习
3、器考虑脸,另一个考虑步态,另一个考虑指纹,这种研究通常称为Information Fusion。,另一种方法是用同样的学习算法来构造不同的弱学习器的方法。,1.3 集成学习构造,加权采样:通过给训练数据赋以不同的权,实际上使得每个学习器关注训练集中的某一部分,这也符合我们最初民主投票的想法。,1.3 集成学习构造,直观上,每个学习器关注训练集中的某一部分,很多个训练集应该可以覆盖训练集中的大部分,只要巧妙的选择加权平均的权,就可以得到更好的学习效果。,1.3 集成学习构造,【集成学习对个体有要求么?】,1.3 集成学习构造,【个体越多越好吗?】,既然多个个体的集成比单个个体更好,那么是不是个体
4、越多越好?,更多的个体意味着:(1)在预测时需要更大的计算开销,因为要计算更多的个体预。(2)更大的存储开销,因为有更多的个体需要保存 个体的增加将使得个体间的差异越来越难以获得,1.3 集成学习构造,传统的机器学习一般都自认为是单模型的,对于模型的分析总是在整体上完成,如:BP和SVM等。但是,所有这些模型其实都可以看作是一种加权平均的多模型。,所以,当然应该考虑研究一般的多模型。在算法上,集成学习的典型代表AdaBoost算法,已经成为与SVM并立的方法。而且,集成学习比SVM更为一般,可能可以有更广阔的前景。,2 AdaBoost算法,2.1 AdaBoost来源,通常,针对一个具体的识
5、别问题,我们很难找到一个理想的强分类器,但是弱分类器一般都会很多,基于这种现象,Freund和Schapire提出了Adaboosting算法:通过一定的算法可以将一组弱分类器提升为一个强分类器。,Adaboost 算法是一种用来分类的方法,它的基本原理就是“三个臭皮匠,顶个诸葛亮”。它把一些比较弱的分类方法合在一起,组合出新的很强的分类方法。,2.2 AdaBoost算法主要思想,针对同一个训练集训练不同的分类器(弱分类器),然后将这些弱分类器集合起来构成一个更强的最终分类器(强分类器)。,初始化的时候对每一个训练样本都赋予相同的权重,然后用该学习算法对训练集训练T轮,每次训练后,对训练失败
6、的训练样本赋予较大的权重,在训练过程中会生成的一个预测函数hj,其中hj也有一定的权重,预测效果好的预测函数权重大。最终预测函数H用加权多数投票的方法产生。,2.3 AdaBoost算法描述,输入:一组训练集:,其中 为样本描述,为样本标识,;其中0,1分别表示正例子和反例。在人脸检测中,可以定义0为非人脸,1为人脸。初始化:初始样本权值设为。对,循环执行下面的步骤:(1)归一化权重:,(2)对每个特征f,训练一个弱分类器;计算所有特征的弱分类器的加权错误率(3)选取最佳弱分类器,按最小错误率。(4)按照这个最佳弱分类器,调整权重:,其中 表示 被正确分类,表示 被错误分类。,2.3 AdaB
7、oost算法描述,(5)最后的强分类器为:其中。,2.3 AdaBoost算法描述,2.3 AdaBoost算法描述,例如在下图中,需要一些线段把红色的球和深蓝色的球分开,然如仅果仅用一条线的话,是分不开的。,调整权重,调整权重,调整权重,弱分类器一,弱分类器二,弱分类器三,最终强分类器,2.3 AdaBoost算法描述,3.1 The Human Face Detection Algorithms Based on AdaBoost,3 论文分析讲解,3.1 The Human Face Detection Algorithms Based on AdaBoost,【1】人脸特征选择-Haa
8、r-like特征,【算法步骤】,【2】人脸特征计算-积分图,【3】分类函数学习,【4】级联检测器进行人脸检测,3.1.1 Haar-like特征,Haar-like特征:是用一种类似Haar小波的方法来形成人脸特征的。典型的矩阵特征由2到4个矩形组成,分别对应于边界、细线/棒或者对角线特征,见下图。对应的矩形特征的特征值定义为白色矩形内的像素和减去黑色矩形内的像素和。,在基于Adaboost的人脸检测系统中,每个弱分类器都是对图像一个特征值的判断,常用的特征是Haar-like特征。,3.1 The Human Face Detection Algorithms Based on AdaBoo
9、st,积分图是一种快速计算矩形特征(Haar-like)的方法。在一张积分图上,点i(x,y)的积分值ii(x,y)是原图像上该点的上方和左方所有点的亮度值的和。即:其中ii(x,y)为积分图,i(x,y)为原始图像,如下图所示。,3.1.2 积分图,3.1 The Human Face Detection Algorithms Based on AdaBoost,当采用下面两式,只需对原图像扫描一次即可计算出积分图:其中,是对这一行及其以前行的像素值求和,并且有:,3.1.2 积分图,3.1 The Human Face Detection Algorithms Based on AdaBo
10、ost,有了积分图,矩形特征值就可以通过很少的计算量得到。任意一个矩形内的像素和可以由积分图上对应的四点得到。由此可见,矩形特征的特征值的计算,只与此特征的端点的积分图有关,而与图像的坐标值无关。所以积分图的引入,大大提高了检测速度。,采用Adaboost算法对人脸特征数据进行训练,经过T轮训练,将T个弱分类器并联形成强分类器。(详细过程见AdaBoost算法原理),3.1.3 分类函数学习,3.1 The Human Face Detection Algorithms Based on AdaBoost,将强分类器串联在一起形成级联检测器,每层的强分类器经过阈值调整,使得每一层都能让几乎全部
11、的人脸样本通过,而拒绝很大部分非人脸样本。,级联检测器进行人脸检测,3.1 The Human Face Detection Algorithms Based on AdaBoost,由于前面的层使用的矩形特征数据很少,计算非常快,越往后匹配的图片越少。尽管随着级数的增多矩形特征数量在增加,但计算量却在减少,检测速度在加快,具有实时性。,3.1 The Human Face Detection Algorithms Based on AdaBoost,Adaboost算法通过从大量的haar特征中挑选出最优的特征,并将其转换成对应的弱分类器进行分类使用,从而达到对目标进行分类的目的。,3.1
12、The Human Face Detection Algorithms Based on AdaBoost,3.1 The Human Face Detection Algorithms Based on AdaBoost,3.2 Detection Based on Skin Color Segmentation and AdaBoost Algorithm,本文将扩展的Haar-like特征(下图所示)作为人脸特质,每个特征由23个矩形组成,分别检测边界、细线、中心特征等。,3.2.1 扩展Haar-like特征,3.2 Detection Based on Skin Color Segm
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机 模式识别 文献 阅读
链接地址:https://www.31ppt.com/p-6376289.html