第6章机器学习.ppt
《第6章机器学习.ppt》由会员分享,可在线阅读,更多相关《第6章机器学习.ppt(89页珍藏版)》请在三一办公上搜索。
1、第六章 机器学习,6.1 机器学习概念6.2 示例学习6.2.1示例学习的两个空间模型6.3 基于解释的学习6.4基于案例的推理6.5 加强学习,6.1 机器学习的概念,6.1.1 机器学习的发展历史1.神经元模型研究阶段这个时期主要技术是神经元模型以及基于该模型的决策论和控制论;机器学习方法通过监督(有教师指导的)学习来实现神经元间连接权的自适应调整,产生线性的模式分类和联想记忆能力。具有代表性的工作有FRosenblaft的感知机(1958年);NRashevsky数学生物物理学(1948年);WSMcCullouch与WPitts的模式拟神经元的理论(1943年);RMFriedberg
2、对生物进化过程的模似等。,2符号概念获取研究阶段60年代初期,机器学习的研究进入了第二阶段,在这个阶段,心理学和人类学习的模似占有主导地位,其特点是使用符号而不是数值表示来研究学习问题,其目标是用学习来表达高级知识的符号描述。在这一观点的影响下,主要技术是概念获取和各种模式识别系统的应用;研究人员一方面深入探讨学习的简单概念,另一方面则把大量的领域知识并入学习系统,以便它们发现高深的概念。这个阶段代表性的工作是温斯顿(Winston,1975)的基于示例归纳的结构化概念学习系统。,3基于知识的各种学习系统研究阶段机器学习发展的第三个阶段始于70年代中期,这个阶段不再局限于构造概念学习系统和获取
3、上下文知识,结合了问题求解中的学习、概念聚类、类比推理及机器发现的工作。相应的有关学习方法相继推出,比如示例学习、示教学习、观察和发现学习、类比学习、基于解释的学习。工作特点强调应用面向任务的知识和指导学习过程的约束,应用启发式知识于学习任务的生成和选择,包括提出收集数据的方式、选择要获取的概念、控制系统的注意力等。,4联结学习和符号学习共同发展阶段80年代后期以来,形成了联结学习和符号学习共同发展的局的第四个阶段。在这个时期,发现了用隐单元来计算和学习非线性函数的方法,从而克服了早期神经元模型的局限性,同时,由于计算机硬件的迅速发展,使得神经网络的物理实现变成可能,在声间识别、图像处理等领域
4、,神经网络取得了很大的成功。在这个进期,符号学习伴随人工智能的进展也日益成熟,应用领域不断扩大,最杰出的工作有分析学习(特别是解释学习)、遗传算法、决策树归纳等。现在基于计算机网络的各种自适应、具有学习功能的软件系统的研制和开发,将机器学习的研究推向新的高度。,6.1.2什么是机器学习,什么是机器学习,到今仍没有严格定义,不同学派对机器学习有不同的定义 准确、完整地给出机器学习的定义很困难,综合上述三种观点可以得出,学习是对某一个特定目标的知识获取的智能过程,系统的内部表现为新知识结构的建立和改进,外部表现为系统性能的改善,变得更快、更精确、更健全。,一个机器学习系统应具有以下特点:1.具有适
5、当的学习环境学习系统中环境并非指通常的物理条件,而是指学习系统进行学习时所必需的信息来源。2.具有一定的学习能力一个好的学习方法和一定的学习能力是取得理想的学习效果的重要手段。所以,学习系统应模拟人的学习过程,使系统通过与环境反复多次相互作用,逐步学到有关知识,并且要使系统在学习过程中通过实践验证、评价所学知识的正确性。3.能用所学的知识解决问题学习的目的在于应用,学习系统能把学到的信息用于对未来的估计、分类、决策和控制。,4.能提高系统的性能提高系统的性能是学习系统最终目标。通过学习,系统随之增长知识,提高解决问题的能力,使之能完成原来不能完成的任务,或者比原来做得更好。学习系统至少应有环境
6、、知识库、学习环节和执行环节四个基本部分。一种典型的机器学习系统(迪特里奇(Dietterich)学习模型)如图6-1所示。环境向系统的学习部件提供某些信息,学习环节利用这些信息修改知识库,增进执行部件的效能;执行环节根据知识库完成任务,同时把获得的信息反馈给学习部件。下面介绍其主要组成部分的功能。,1.环境,系统中的环境包括工作对象和外界条件。比如在医疗系统中,环境就是病人当前的症状,物化检验的报告和病历等信息;在模式识别中,环境就是待识别的图形或影物;在控制系统中,环境就是受控的设备或生产流程。环境提供给系统的信息水平和质量对于学习系统有很大的影响。信息的水平是指信息的一般性程度,也就是适
7、用范围的广泛性,高水平的信息往往比较抽象,适用面更广泛。信息的质量指信息的正确性、信息选择的适宜性和信息组织的合理性。信息质量对学习难度有明显的影响。,2.学习环节,学习环节是系统的学习机构,是学习系统的核心。它通过对环境的搜索取得外部信息,然后经分析、综合、类比、推理等思维过程获得知识,并将这些知识送入知识库,供执行环节使用。事实上,由于环境提供的信息水平与执行环节所需的信息水平之间往往有差距,学习环节的任务就是解决这个水平差距问题。如果环境提供较高水平的信息,学习环节就去就去补充遗漏的细节,以便执行环节能用于具体情况。如果环境提供较具体的低水平信息,即在特殊情况执行任务的实例,学习环节就要
8、上此归纳规则,以便系统能完成更为一般的任务。,3.知识库,学习系统设计的另一个重要问题就是知识库的形成设计以及其内容。学习系统实质上就是对原有知识的扩充和完善。,4.执行环节,执行环节实际上是由执行环节和评价两部分组成,执行环节用于处理系统面临的现实问题,比如定理证明、智能控制、自然语言处理、机器人行动规划等;评价环节用来验证、评价执行环节执行的效果,比如结果的正确性等。评价环节的处理方法有两种,一种是把评价时所需的性能指标直接建立在系统中,由系统对执行环节所做出的结论进行评价;另一种是由人类协助完成评价工作。另外,从执行环节到学习环节心须要有反馈信息。这们,学习环节就可以根据反馈信息决定是否
9、要从环境中获取进一步的信息进行再学习,以便修改、完善知识库中的知识。,6.1.3机器学习分类,当前国际上流行的机器学习分类方法主要有四种:按应用领域分类:主要的应用领域有专家系统、认知模拟、规划和问题求解、数据挖掘、网络信息服务、图象识别、故障诊断、自然语言理解、机器人和博弈等。按获取的知识的表示分类:有形式逻辑表达式、形式文法、代数表达式参数、图和网络、框架和模式、计算机程序和其它的过程编码、产生式规则、决策树、框架、神经网络等;按推理策略分类:如演绎推理和归纳推理。按学习系统性综合分类的方法:考虑了事物的历史渊源、知识表示、推理策略和应用领域等因素,是对前面三种分类方法的综合。,(一)基于
10、推理策略的分类,一个学习过程实质上是学习系统把环境所提供的信息转换成新的形式,以便存储和使用。这种信息的转换就是种推理,而推理的性质确定了学习策略的类型。在学习过程中,学生所使用的推理越少,他对教师的依赖就越大,因而教师的负担就越重,反过来,学生使用的推理越多,教师的负担就越轻。显然,基于推理策略分类方法可以按学生使用推理的多少和难易程度进行。下面分别进行讨论。,1.机械学习(Rote Learning)机械学习是最简单的学习方法,它亦被称为记忆学习或死记硬背式学习。这种学习方法不需要推理,而是由教师向系统提供被记忆的信息,学习者无需任何推理或其它的知识转换,直接吸取环境所提供的信息,并用这些
11、信息指导系统行为。机械学习是记忆,它仅保存新的知识以便使用。这里是个检索问题,而不是重复计算、推理或查询。机械学习可以认为是基本的学习方式,它本身并不能实现智能学习,但是它是其他学习系统所固有重要组成部分。在机械学习系统中,知识已经以某种方式获取,并且是一种直接可使用的形式。所有学习系统都是建立在机械学习的基础之上,即对知识库中的知识进行存储、维护和检索。,2.示教学习(Learning from Instruction or Learning by being told)示教学习中,教师以某种形式(教导和建议)提出和组织知识,以使学生拥有的知识可以不断地增加。学生把知识转换成内部可使用的表示
12、形式,并将新的知识和原有知识有机地结合为一体;示教系统中,由外部给系统提供抽象的、一般化的信息,学习系统经过选择和改造,把新的信息与系统原有的知识融为一体。由于外部提供的信息过于抽象,它的水平高于执行时所用信息的水平,因此学习环节要把把较高水平的知识转换为较低水平的知识,这种转换称为实用化。,研究示教学习的途径主要有两种。一是在开发系统时接收抽象的、高级的信息,并将它变换成规则,以便批指导执行部分。二是开发完善的工具,比如知识库的编辑和调试辅助程序,使得专家们可以很方便地将专门知识转换成详细的规则。,3.演绎学习(Deductive Learning)这种学习方法是一种常规的逻辑推理方法。其推
13、理的过程通常从公理出发,经过逻辑变换,推导出结论。演绎学习包括知识改造、知识编译、生成宏操作、保持等价操作和其他的一些保真变换。,4.解释学习(Explanation-based Learning)解释学习利用问题求解的示例,依赖领域知识构造出求解过程的因果解释结构,并获取控制知识,为以后类似问题求解提供指导。解释学习过程可分成两个步骤:首先产生解释结构:输入实例后,系统首先对问题进行求解。再用解释结构对得到的解释结构和事例进行概括:概括通常采取的方法是将常量转换成变量,且去掉某些不重要的信息,仅仅保留求解时所必需的那些关键信息,经过一定的方式进行组合形成产生式规则,从而获得概括性的控制知识。
14、,5.类比学习(Learning by Analogy)类比学习利用二个不同领域(源域、目标域)中的知识相似性,通过类比,从源域的知识(包括相似的特征和其它性质)推导出目标域的相应知识。例如:未开过货车的司机有开小车的知识就可完成开货车的任务;类比学习是演绎和归纳学习的组合。它对不同论域的描述进行匹配,确定公共的子结构,以此作为类比映射。寻找公共子结构是归纳推理,而实现类比映射是演绎推理。,6.归纳学习(Inductive learning)归纳学习由教师或环境提供某概念的一些实例或反例,学生通过归纳推理得出该概念的一般描述。归纳学习可分为示例学习和观察与发现学习。示例学习(Learning
15、from Examples)示例学习也称为概念获取(Concept Acquisition)。是由教师提供给系统某种概念的正例集合反例集合,学习通过归纳推理产生覆盖所有正例并排除所有反例的该概念的一般描述。这些正例是由已知概念的教师或者是学生做实验时从系统中得到的反馈信息而提供的。,观察与发现学习(Learning from Observation and Discovery)观察与发现学习是由环境提供一组观察事例,学生构造一个一般的概念描述(即理论)来覆盖所有或大多数事例。这是一种无导师学习。这类学习又分为观察学习与机器发现两类。,(1)观察学习 观察学习是学生将已知事例进行分类,同时产生每
16、一类的一般概念描述。观察学习又可根据是否渐近(incremental)方式而分为a概念聚类 b概念形成(2)机器发现(Machine Discovery)学生从观察的事例或经验数据中进行归纳产生规律或规则,这就是机器发现。机器发现是观察与发现学习的最困难、最富有创造性的一种学习形式。机器发现包括有经验发现和知识发现两种类型。,(二)基于系统综合性的分类,基于系统性分类,机器学习可分为四种类型,即:归纳学习、分析学习、联接学习、遗传算法与分类系统。,1分析学习(Analytie Learning)分析学习是针对几个实际例子,应用领域知识进分析来学习。2联结学习(connection based
17、learning)联结学习的目标是区分输入模式的等价类。一个联结模型是由一些类似神经元的简单单元带权互边而组成的网络。,3遗传算法(Genetic Algorithm)遗传算法似生物繁殖的突变(互换、倒位、点突变等)和达尔文的自然选择(在每一生态环境中适者生存)。4.加强学习(reinforcement learning)加强学习的学习目标是寻找一个合适的动作选择策略,使产生的动作序列可获得某种最优的结果(如累计立即回报最大)。基本方法是通过与环境的试探性(trial and error)交互来确定和优化动作的选择。,6.2示例学习,示例学习属于归纳学习,是目前机器学习方法中最成熟的方法之一。
18、示例学习要求环境能够从一些特殊的实例(这些实例事先由教师划分为正例和反例两类),并由这些实例进行归纳推理,导出一般性的规则。,6.2.1示例学习的两个空间模型示例学习的模型如图6-2所示。例子空间是所有可能的正、反例构成的空间;假设空间(又称概念空间)是所有可能的概念描述(称为假设)构成的空间。假设空间中的每一假设都对应于例子空间中的一个子集,使得该子集中的例子均是该假设的例子。,在图6-2中,除描绘从例子学习的实例空间规则空间外,还描绘了解释实例和实验规划过程。在这个模型中,首先由示教者给实例空间提供一些初始示教例子,然后程序对示教例子进行解释。由于示教例子的形式往往不同于规则形式,所以有必
19、要对例子进行解释。往后再利用被解释的示教例子支搜索规则空间。一般情况下不能一次就从规则空间中搜索到要求的规则,因此还要寻找一些新的示教例子,这个过程就是选择例子。此过程如此循环,直到搜索到要求的规则。,(一)实例空间考虑扑克牌中“同花”概念的问题,同花是五张同一花色所组成的手牌。在这个学习问题中,实例空间是五张牌的全部各手牌的集合。我们可以把这个空间中单个的点表示为一组五个有序对,比如:(2,梅花),(3,梅花),(5,梅花),(J,梅花),(K,梅花)每一有序对指明一张牌的点数和花色。整个实例空间是所有这样的五张牌集合的空间。高质量的示教例子是无二义性的,它可以为规则空间的搜索提供可靠的指导
20、。低质量的示教例子会引起互相矛盾的解释,其结果仅为规则空间的搜索提供试探性的指导。示教例子排列次序也会影响学习的质量。,一般情况下认为实例是同时提供的,也可以主动地选择另外一些附加的实例,以便修正假设,这种方法称为补充学习。还有的程序直接搜索实例空间,这种方法称主动选择例子。,(二)规则空间定义规则空间的目的是指定表示规则的操作符和术语。所谓规则空间是用指定的描述语言可以表示的所有规则(概念假设)的集合。对规则空间有三个方面的要求,即规则的表示形式应适应归纳推理,规则的表示与实例的表示一致,规则空间应包含要求的规则。,三)解释例子解释示教例子的基本目的是提取指导规则空间搜索有用的信息。通常是把
21、示数例子转换成易于进行符号归纳的形式。不过,这种转换也许是困难的,尤其是在感性的学习中。,(四)实验规则一旦学习环节根据示教例子搜索规则空间,并产生可能合理的假设规则集合H后,程序就可能需要收集更多的训练实例加以测试和修改集合H。当实例空间和规则空间是以不相同的方法表示时,就需要判断训练哪些实例和怎样才能获得它们,这是一个复杂的过程。比如,假定一个遗传学习程序要想发现DNA的哪一部分是最重要的,为了测试几个高级假设(即假设的规则)要安排复杂的试验。这些试验合成DNA的特殊成分,并把它插入到适当的细菌细胞中,以观察细胞的最后动作。,搜索规则空间的方法有:特化搜索既从最泛化的假设(概念描述)出发,
22、每次取用一个新的例子,就产生一些特化的描述,直到将初始最泛化的假设特化为解描述。泛化搜索即从最特化的假设(相应于例子空间中的一个例子)开始,每次取用一个新的例子时,就产生一些泛化的描述,直到产生出足够泛化的解描述。大多数示例学习方法都采用这二种方法或这二个方法的结合。下面介绍搜索规则空间的几种方法。这些方法都具有一个假设规则的集合H,不同的仅仅是对H的改进,以便得到要求的规则。,(1)变型空间法(version-space methold)变型空间法是TMMitchell于1977年提出的一种数据驱动型的学习方法。该方法以整个规则空间为初始的假设规则集合H。依据示教例子中的信息,系统对集合H进
23、行一般化或特殊化处理,逐步缩小集合H。最后使得H收敛到只含有要求的规则。由于被搜索的空间H逐渐缩小,故称为变型空间法。,1规则空间的结构在规则空间中,表示规则的点与点之间存在着一种由一般到特殊的偏序关系。我们定义为覆盖,例如,color(X,Y)覆盖color(ball,Z),于是又覆盖color(ball,red)。作为一个简单的例子,考虑有这样一些属性和值的对象域:Sizes=large,smallColors=red,white,blueShapes=ball,brick,cube这些对象可以用谓词obj(Sizes,Color,Shapes)来表示。用变量替换常量这个泛化操作定义,如图
24、6-3的空间。,图6-3表示了一个规则空间偏序关系的一部分。我们可以把归纳学习看成是对同所有训练实例相一致的概念空间的搜索。在搜索规则空间时,使用一个可能合理的假设规则的集合H,是规则空间的子集,从图6-4可知,H中最一般的元素构成的子集为G,H中最特殊的元素构成的子集为S。在规则空间中,H是以G为上确界和以S为下确界的一段。因此,可以用G和要来表示集合H。,2修选删除算法 Mitchell的学习算法称为候选删除算法。在这种算法中,把尚未被数据排除的假设称为可能假设,把所有可能假设构成的集合H称为变型空间。算法一开始,变型空间H包含所有的概念随着向程序提供示教正例后,程序就从变型空间中删除候选
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 机器 学习
链接地址:https://www.31ppt.com/p-6618783.html