机器学习 01引言ppt课件.ppt
1,机器学习主讲:张莉,第一章 引言,2,什么是机器学习,什么是机器学习计算机程序如何随着经验积累自动提高性能系统自我改进的过程成功应用学习识别人类讲话学习驾驶车辆学习分类新的天文结构学习对弈西洋双陆棋,3,人工智能学习概念的符号表示作为搜索问题的机器学习作为提高问题求解能力的学习利用先验知识和训练数据来引导学习计算复杂性理论复杂性的理论边界计算量、训练数据量、错分量,相关学科,4,控制论为了优化预定目标,学习对各种处理过程进行控制,学习预测被控过程的下一状态信息论熵和信息内容的度量学习最小描述长度方法统计学根据有限数据样本,给定精度时,估计误差置信区间、统计检验,相关学科,5,定义如果一个计算机针对某类任务T的用P衡量的性能根据经验E来自我完善,那么我们称这个计算机程序在从经验E中学习,针对某类任务T,它的性能用P来衡量。西洋跳棋学习问题的解释任务T:参与比赛性能标准P:比赛成绩(或赢棋能力,击败对手的百分比) 经验E:和自己下棋,学习问题的标准描述,6,手写识别学习问题任务T:识别和分类手写文字性能标准:分类的正确率经验:已知类别的手写体文字数据库机器人驾驶学习问题任务:通过视觉传感器在四车道高速公路上行使性能标准:平均无差错行使里程(差错由人来监督裁定)训练经验E:注视人类驾驶时录制的一系列图像和驾驶指令,学习问题的标准描述(2),7,定义太广泛甚至包括了以非常直接的方式通过经验自我提高的计算机程序科技型定义通过经验提高性能的某类程序目的定义一类问题探索解决这类问题的方法理解学习问题的基本结构和过程,学习问题的标准描述(3),8,设计一个学习系统,基本设计方法和学习途径(以西洋跳棋为例)选择训练经验选择目标函数选择目标函数的表示选择函数逼近算法最终设计,9,第一个关键属性,训练经验能否为系统的决策提供直接或间接的反馈第二个重要属性,学习器在多大程度上控制样例序列第三个重要属性,训练样例的分布能多好地表示实例分布,通过样例来衡量最终系统的性能,选择训练经验,10,西洋跳棋学习问题任务T,下西洋跳棋性能标准P,击败对手的百分比训练经验E,和自己进行训练对弈学习系统需要选择要学习的知识的确切类型对于这个目标知识的表示一种学习机制,选择训练经验(续),11,目标函数ChooseMoveChooseMove: BM,接受合法棋局集合中的棋盘状态作为输入,并从合法走子集合中选择某个走子作为输出问题转化我们把提高任务T的性能P的问题转化(或简化)为学习像ChooseMove这样某个特定的目标函数,选择目标函数,12,ChooseMove的评价学习问题很直观地转化成这个函数这个函数的学习很困难,因为提供给系统的是间接训练经验另一个目标函数V一个评估函数,V: BR,它为任何给定棋局赋予一个数值评分,给好的棋局赋予较高的评分优点,学习简单V的应用根据V能够轻松地找到当前棋局的最佳走法,选择目标函数(2),13,V的设计,对于集合B中的任意棋局b,V(b)定义如下如果b是一最终的胜局,那么V(b)=100如果b是一最终的负局,那么V(b)=-100如果b是一最终的和局,那么V(b)=0如果b不是最终棋局,那么V(b)=V(b),其中b是从b开始双方都采取最优对弈后可达到的终局,选择目标函数(3),14,上面设计的缺陷递归定义运算效率低不可操作简评学习任务简化成发现一个理想目标函数V的可操作描述通常要完美地学习这样一个V的可操作的形式是非常困难的一般地,我们仅希望学习算法得到近似的目标函数V,因此学习目标函数的过程常称为函数逼近,选择目标函数(4),15,函数的表示一张大表,对于每个唯一的棋盘状态,表中有唯一的表项来确定它的状态值规则集合二项式函数人工神经网络,选择目标函数的表示,16,重要的权衡过程希望选取一个非常有表现力的描述,以最大可能地逼近理想的目标函数越有表现力的描述需要越多的训练数据,使程序能从它表示的多种假设中选择,选择目标函数的表示(2),17,简单表示法对于任何给定的棋盘状态,函数V可以通过以下棋盘参数的线性组合来计算x1,黑子的数量x2,红子的数量x3,黑王的数量x4,红王的数量x5,被红子威胁的黑子数量x6,被黑子威胁的红子数量,选择目标函数的表示(3),18,目标函数V(b)=w0+w1x1+w2x2+w6x6其中,w0w6是权值,表示不同棋局特征的相对重要性至此,问题转化为学习目标函数中的系数(即权值),选择目标函数的表示(4),19,每个训练样例表示成二元对b是棋盘状态,Vtrain(b)是训练值比如,,100训练过程从学习器可得到的间接训练经验中导出上面的训练样例调整系数wi,最佳拟合这些训练样例,选择函数逼近算法,20,选择函数逼近算法(2),估计训练值困难处一个简单的方法,Vtrain(b)=V(Successor(b)调整权值最佳拟合的定义,比如误差平方和最小寻找算法,比如最小均方方法,LMS Least Mean Squares,21,LMS权值更新法则,对于每个训练样本使用当前的权计算V (b)对每个权值wi 进行如下更新,22,最终设计,实验生成器,执行系统,泛化器,鉴定器,新问题,解答路线,假设,训练样例,23,执行系统用学会的目标函数来解决给定的任务鉴定器以对弈的路线或历史记录作为输入,输出目标函数的一系列训练样例。泛化器以训练样例为输入,产生一个输出假设,作为它对目标函数的估计。实验生成器以当前的假设作为输入,输出一个新的问题,供执行系统去探索。,最终设计(2),24,图1-2第13章理论上的保证这种学习技术是否确保发现一个非常接近的近似。更复杂的目标函数其他学习算法最近邻算法,存储训练样例,寻找保存的最接近的情形来匹配新的情况遗传算法,产生大量候选的西洋跳棋程序,让它们相互比赛,保留最成功的程序并进一步用模拟进化的方式来培育或变异它们基于解释的学习,分析每次成败的原因,西洋跳棋学习的更多讨论,25,一个有效的观点机器学习问题归结于搜索问题本书给出了对一些基本表示定义的假设空间的搜索算法通过搜索策略和搜索空间的内在结构来刻画学习方法,机器学习的一个观点,26,存在什么样的算法能从特定的训练数据学习一般的目标函数呢?如果提供了充足的训练数据,什么样的条件下,会使特定的算法收敛到期望的函数?哪个算法对哪些问题和表示的性能最好?多少训练数据是充足的?怎样找到学习到假设的置信度与训练数据的数量及提供给学习器的假设空间特性之间的一般关系?学习器拥有的先验知识是怎样引导从样例进行泛化的过程的?当先验知识仅仅是近似正确时,它们会有帮助吗?,机器学习的问题,27,关于选择有效的后验训练经验,什么样的策略最好?这个策略的选择会如何影响学习问题的复杂性。怎样把学习任务简化为一个或多个函数逼近问题?换一种方式,系统该试图学习哪些函数?这个过程本身能自动化吗?学习器怎样自动地改变表示法来提高表示和学习目标函数的能力?,机器学习的问题,28,第2章,基于符号和逻辑表示的概念学习第3章,决策树第4章,人工神经网络第5章,统计和估计理论的基础概念第6章,贝叶斯理论第7章,计算学习第8章,基于实例的学习第9章,遗传算法第10章,规则学习第11章,基于解释的学习第12章,近似知识与现有数据的结合第13章,增强学习,全书内容简介,29,涉及学科搜索的观点相关杂志、会议、国际组织,小结和补充读物,30,针对下面的学习任务,给出它们的学习系统设计方案手写识别学习问题机器人驾驶学习问题。 (自定义),Discussion for introduction,31,END,设计过程,