智能检测理论与技术08.ppt
《智能检测理论与技术08.ppt》由会员分享,可在线阅读,更多相关《智能检测理论与技术08.ppt(45页珍藏版)》请在三一办公上搜索。
1、第八章 基于支持向量机的智能检测,Intelligent Detection Theory and Technology,智能检测理论与技术,第七章内容回顾,一、基于神经网络智能检测的概述二、神经网络与智能检测建模三、基于神经网络智能检测的通用模型四、基于神经网络智能检测应用实例,第八章 基于支持向量机的智能检测,一、统计学习理论二、支持向量机基本理论三、用于智能检测的支持向量机回归模型四、基于支持向量机的智能检测应用实例,第八章 基于支持向量机的智能检测,第八章 基于支持向量机的智能检测,支持向量机(SVM)是基于结构风险最小化原则的统计学习方法,能够避免人工神经网络方法的过拟合、容易陷入局
2、部极小等缺陷。由于支持向量机不但较好地解决了以往困扰很多学习方法的小样本、过学习、高维数、局部最优等实际难题,而且具有很强的泛化能力,因此,支持向量机在函数估计和软测量建模方面逐步得到应用。支持向量机是一种新的机器学习算法,该方法由于采用了结构风险最小化原则,与传统机器学习方法相比,在最小化学习误差的同时可以保证具有较小的泛化误差。,第八章 基于支持向量机的智能检测,过学习问题某些情况下,当训练误差过小反而会导致推广能力的下降。例如:对一组训练样本(x,y),x分布在实数范围内,y取值在0,1之间。无论这些样本是由什么模型产生的,总可以用y=sin(w*x)去拟合,使得训练误差为0。,第八章
3、基于支持向量机的智能检测,机器学习的目的是根据给定的训练样本求对某系统输入输出之间依赖关系的估计,使它能够对未知输出作出尽可能准确的预测。变量y与x存在一定的未知依赖关系,即遵循某一未知的联合概率,(x和y之间的确定性关系可以看作是其特例,机器学习问题就是根据n个独立同分布观测样本,在一组函数 中求一个最优的函数 对依赖关系进行估计,使期望风险,最小。,是由于,对y的预测误差而造成的损失。,第八章 基于支持向量机的智能检测,学习的目标在于使期望风险最小化,但是由于可以利用的信息只有样本,期望风险并无法计算,因此在传统的学习方法中,采用了所谓经验风险最小化(Empirical Risk Mini
4、mization,ERM)准则,即用样本定义经验风险设计学习算法使 最小化,作为对期望风险的估计。,第八章 基于支持向量机的智能检测,用经验风险最小化准则代替期望风险最小化并没有经过充分的理论论证,但这种思想却在传统的机器学习方法研究中占据了主要的地位。以前大量研究都将注意力集中到如何更好地最小化经验风险上,而实际上,即使可以假定当n趋向于无穷大时,在很多问题中的样本数目也离无穷大相差很远。有限样本下ERM准则得到的结果并不能使真实风险也较小。神经网络的过学习问题:很多注意力都集中在如何使经验风险更小,但是训练误差小并不总能导致好的预测效果。某些情况下,训练误差过小反而会导致推广能力的下降,即
5、真实风险的增加,这就是神经网络的过学习问题。(过拟合),第八章 基于支持向量机的智能检测,有限样本的情况下,经验风险最小并不一定意味着期望风险最小;学习机器的复杂性不但应与所研究的系统有关,而且要和有限数目的样本相适应。需要一种能够指导在小样本情况下建立有效的学习和推广方法的理论。统计学习理论就是研究小样本统计估计和预测的理论,主要内容包括下面四个方面:经验风险最小化准则下统计学习一致性的条件;在这些条件下关于统计学习方法推广性的界的结论;在这些界的基础上建立的小样本归纳推理准则;实现新的准则的实际方法(算法)。,SVM,第八章 基于支持向量机的智能检测,VC维 为了研究学习过程一致收敛的速度
6、和推广性,Vapnik V N在统计学习理论定义了一系列有关函数集学习性能的指标,其中最重要的是VC维(Vapnik-Chervonenkis Dimension)。模式识别方法中VC维的直观定义 对一个指示函数集,如果存l个样本能够被函数集中的函数按所有可能的2 l种形式分开,则称函数集能够把l个样本打散;函数集的VC维就是它能打散的最大样本数目l。若对任意数目的样本都有函数能将它们打散,则函数集的VC维是无穷大。有界实函数的VC维可以通过用一定的阈值将它转化成指示函数来定义。,第八章 基于支持向量机的智能检测,VC维反映了函数集的学习能力,VC维越大则学习机器越复杂。目前尚没有通用的关于任
7、意函数VC维计算的理论,只对一些特殊的函数集知道其VC维。在n维实数空间中线性分类器和线性实函数的VC维是n+1。对于一些比较复杂的学习机器(如神经网络),其VC维除了与函数集(神经网结构)有关外,还受学习算法等的影响,其VC维的确定更加困难。对于给定的学习函数集,如何(用理论或实验的方法)计算其VC维是当前统计学习理论中有待研究的一个重要问题。,第八章 基于支持向量机的智能检测,结构风险最小化经验风险和实际风险之间的关系,即推广性的界。得到的结论是:经验风险 和实际风险 之间以至少 的概率满足如下关系 其中l是函数集的VC维,n是样本数。这一结论从理论上说明了学习机器的实际风险是由两部分组成
8、的:一是经验风险(训练误差),另一部分称作置信范围,它和学习机器的VC 维及训练样本数有关。,第八章 基于支持向量机的智能检测,结构风险最小化 经验风险和实际风险之间的关系,即推广性的界。上式表明,在有限训练样本下,学习机器的VC维越高则置信范围越大,导致真实风险与经验风险之间可能的差别越大。这就是为什么会出现过学习现象的原因。机器学习过程不但要使经验风险最小,还要使VC维尽量小以缩小置信范围,才能取得较小的实际风险,即对未来样本有较好的推广性。,第八章 基于支持向量机的智能检测,结构风险最小化统计学习理论给出了合理的函数子集结构应满足的条件及在SRM准则下实际风险收敛的性质。构造一组嵌套的函
9、数子集,使其VC维由内向外依次递增,然后在该嵌套子集中寻找能够使经验风险和置信范围之和最小的子集,从而使得实际风险上界达到最小化。支持向量机方法实际上就是这种思想的具体实现。,结构风险最小化示意图,第八章 基于支持向量机的智能检测,用于线性分类的支持向量机SVM是从线性可分情况下的最优分类面发展而来的,基本思想可用右图的两维情况说明。最优分类线就是要求分类线不但能将两类正确分开(训练错误率为0),而且使分类间隔最大。使分类间隔最大实际上就是对推广能力的控制,这是SVM的核心思想之一。,线性可分情况下的最优分类线,第八章 基于支持向量机的智能检测,用于线性分类的支持向量机在线性分类SVM算法中,
10、假设训练样本集为 其中(R表示为实数域)。对于两类的分类问题,。支持向量机分类算法的原始形式可归结为下列二次规划问题(Quadratic Programming,QP)当无错分样本时,最小化目标函数的第一项等价于最大化两类间的间隔,可降低分类器的VC维,实现结构风险最小化原则。,为松弛项,表示错分样本的惩罚程度;,C为常数,用于控制对错分样本惩罚的程度,实现在错分样本数与模型复杂性之间的折衷;,第八章 基于支持向量机的智能检测,用于线性分类的支持向量机上述二次规划的对偶形式为根据最优化理论中的KKT条件,只有少量样本的 值不为零,Vapnik V N等人称之为支持向量,这便是支持向量机名称的由
11、来。SVM的最优求解基于结构风险最小化思想,因此比其它非线性函数逼近方法具有更强的泛化能力。,其中 为Lagrange乘子。,第八章 基于支持向量机的智能检测,用于非线性回归的支持向量机,最小化,最大化,非线性回归模型,第八章 基于支持向量机的智能检测,用于非线性回归的支持向量机概括地说,支持向量机就是首先通过用内积函数定义的非线性变换将输入空间变换到一个高维空间,在这个空间中求(广义)最优分类面。SVM形式上类似于一个神经网络,输出是中间节点的线性组合,每个中间节点对应一个支持向量。,支持向量机结构示意图,第八章 基于支持向量机的智能检测,SVM常用核函数,第八章 基于支持向量机的智能检测,
12、SVM训练算法传统的利用标准二次型优化技术解决对偶问题的方法,是SVM训练算法慢及受到训练样本集规模制约的主要原因。目前已提出了许多解决方法和改进算法,主要是从如何处理大规模样本集的训练问题、提高训练算法收敛速度等方面改进。代数算法:QP算法、Chunking算法、Osuna算法、SMO算法。几何算法:SK算法、Gilberts算法、MDM算法、NPA算法。,第八章 基于支持向量机的智能检测,SVM训练算法:序贯最小优化(SMO)SVM的训练问题实际上是一个凸规划问题,或者其对偶问题一个二次规划问题。在最优化理论中的许多成熟的算法都需要利用整个Hessian矩阵,但是受计算机内存容量的限制,这
13、些算法仅适用于学习样本较少的情况,而无法处理大量学习样本数据的训练问题。因此设计适于大量学习样本的训练算法成为SVM建模研究中的一个重要内容。其中序贯最小优化(Sequential Minimal Optimization,SMO)算法是一种比较有效的训练算法,在SVM大样本训练中得到广泛应用。,第八章 基于支持向量机的智能检测,SVM训练算法:序贯最小优化序贯最小优化是由Platt J C提出的,该算法工作集中只有2个样本,其优点是针对2个样本的二次规划问题可以有解析解的形式,从而避免了多样本情形下的数值解不稳定及耗时问题,同时也不需要大的矩阵存储空间,非常适合稀疏样本。Platt J C利



- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 智能 检测 理论 技术 08

链接地址:https://www.31ppt.com/p-5936877.html