人工智能基础05-机器学习.ppt
《人工智能基础05-机器学习.ppt》由会员分享,可在线阅读,更多相关《人工智能基础05-机器学习.ppt(87页珍藏版)》请在三一办公上搜索。
1、目录,第一章绪论第二章知识表示 第三章搜索技术第四章推理技术第五章机器学习 第六章专家系统 第七章自动规划系统第八章 自然语言理解第九章 智能控制第十章 人工智能程序设计,5.1 机器学习概述,学习的基本概念 学习是人类具有的一种重要的智能行为。西蒙的观点:学习就是系统在不断重复的工作中对本身能力的增强或者改进,使得系统在下一次执行同样任务或类似任务时,会比现在做得更好或效率更高。1959年 Samuel 下棋程序,具有学习能力。4年后程序战胜了设计者,又3年后战胜了美国一个冠军。,5.1 机器学习概述,机器学习的定义机器学习是研究如何使用机器来模拟人类学习活动的一门学科。稍为严格的提法是:机
2、器学习是一门研究机器获取新知识和新技能,并识别现有知识的学问。,5.1 机器学习概述,机器学习的发展 机器学习是人工智能应用研究较为重要的分支,它的发展过程大体上可分为4个时期:(1)第一阶段是在50年代中叶到60年代中叶,属于热烈时期。在这个时期,所研究的是“没有知识”的学习,即“无知”学习;其研究目标是各类自组织系统和自适应系统;指导本阶段研究的理论基础是早在40年代就开始研究的神经网络模型。,5.1 机器学习概述,(2)第二阶段在60年代中叶至70年代中叶,被称为机器学习的冷静时期。本阶段的研究目标是模拟人类的概念学习过程,并采用逻辑结构或图结构作为机器内部描述。(3)第三阶段从70年代
3、中叶至80年代中叶,称为复兴时期。在这个时期,人们从学习单个概念扩展到学习多个概念,探索不同的学习策略和各种学习方法。本阶段已开始把学习系统与各种应用结合起来。(4)机器学习的最新阶段始于1986年。一方面,由于神经网络研究的重新兴起,另一方面,对实验研究和应用研究得到前所未有的重视。,5.1 机器学习概述,机器学习研究与应用的发展趋势(1)从有教师指导的归纳学习向无教师指导的发现学习转变。以数据挖掘为核心技术的发现学习成为最有价值的机器学习技术。(2)从面向确定性环境的观察学习到面向不确定性环境的统计学习转变。概率理论和统计分析处理不确定问题。(3)从缺乏坚实理论的经验性学习到具有严密数学基
4、础的学习理论转变。粗糙集和统计学习理论。,5.2 机器学习的主要策略和基本结构,机器学习的主要策略学习过程与推理过程是紧密相连的,按照学习中使用推理的多少,机器学习所采用的策略大体上可分为4种:机械学习、示教学习、类比学习和示例学习。学习中所用的推理越多,系统的能力越强。(1)机械学习就是记忆,是最简单的学习策略。这种学习策略不需要任何推理过程。(2)比机械学习更复杂一点的学习是示教学习策略。系统在接受外部知识时需要一点推理,翻译和转化工作。,5.2 机器学习的主要策略和基本结构,(3)类比学习系统只能得到完成类似任务的有关因此,他比上述两种学习策略需要更多的推理。(4)采用示例学习策略的计算
5、机系统,事先完全没有完成任务的任何规律性的信息,因此需要推理是最多的。,5.2 机器学习的主要策略和基本结构,机器学习系统的基本结构 环境向系统的学习部分提供某些信息,学习部分利用这些信息修改知识库,以增进系统执行部分完成任务的效能,执行部分根据知识库完成任务,同时把获得的信息反馈给学习部分。在具体的应用中,环境,知识库和执行部分决定了具体的工作内容,学习部分所需要解决的问题完全由上述3部分确定。,环境,学习,知识库,执行,5.2 机器学习的主要策略和基本结构,影响学习系统设计的重要因素(1)影响学习系统设计的最重要的因素是环境向系统提供的信息。整个过程要遵循“取之精华,弃之糟粕”的原则,同时
6、谨记“实践是检验真理的唯一标准”。(2)知识库是影响学习系统设计的第二个因素。知识的表示有多种形式,在选择表示方式时要兼顾以下4个方面:表达能力强。所选择的表示方式能很容易地表达有关的知识。易于推理。为了使学习系统的计算代价比较低,希望知识表示方式能使推理较为容易。,5.2 机器学习的主要策略和基本结构,容易修改知识库。学习系统的本质要求它不断地修改自己的知识库,当推广得出一般执行规则后,要加到知识库中。知识表示易于扩展。学习系统不能在全然没有任何知识的情况下凭空获取知识,每一个学习系统都要求具有某些知识理解环境提供的信息,分析比较,做出假设,检验并修改这些假设。因此,更确切地说,学习系统是对
7、现有知识的扩展和改进。,5.3 常见的几种学习方法,5.3.1 机械学习1.机械学习的模式机械学习是最简单的机器学习方法。机械学习就是记忆,即把新的知识存储起来,供需要时检索调用,而不需要计算和推理。机械学习又是最基本的学习过程。任何学习系统都必须记住它们获取的知识。在机械学习系统中,知识的获取是以较为稳定和直接的方式进行的,不需要系统进行过多的加工。,5.3 常见的几种学习方法,5.3.1 机械学习2.数据化简Lenat,Hayes Roth,和Klahr等人于1979年关于机械学习提出一种有趣的观点。他们指出,可以把机械学习看成是数据化简分级中的第一级。数据化简与计算机语言编译类似;其目的
8、是把原始信息变成可执行的信息。在机械学习中我们只记忆计算的输入输出,忽略了计算过程,这样就把计算问题化简成存取问题。,5.3 常见的几种学习方法,5.3.1 机械学习,存储,计算,推导,归纳,算法与理论,机械记忆,搜索规则,5.3 常见的几种学习方法,5.3.1 机械学习3.主要问题对于机械学习,需要注意3个重要的问题:存储组织,稳定性和存储与计算之间的权衡。(1)存储组织信息:采用适当的存储方式,使检索速度尽可能地快,是机械学习中的重要问题。(2)环境的稳定性与存储信息的适用性问题:机械学习系统必须保证所保存的信息适应于外界环境变化的需要,这也就是所谓的信息适用性问题。(3)存储与计算之间的
9、权衡:对于机械学习来说很重要的一点是它不能降低系统的效率。,5.3 常见的几种学习方法,5.3.2 基于解释的学习 解释学习(explanation 最初是由美国Illinois 大学的DeJong 于1983 年提出来的。在经验学习的基础上,运用领域知识对单个例子的问题求解作出解释,这是一种关于知识间因果关系的推理分析,可产生一般的控制策略。解释学习根据任务所在领域知识和正在学习的概念知识,对当前实例进行分析和求解,得出一个表征求解过程的因果解释树,以获取新的知识。在获取新的知识过程中,通过对属性、表征现象和内在关系等进行解释而学习到新的知识。,5.3 常见的几种学习方法,5.3.2 基于解
10、释的学习 解释学习一般包括下列3个步骤:(1)利用基于解释的方法对训练例子进行分析与解释。(2)对例子的结构进行概括性解释。(3)从解释结构中识别出训练例子的特性,获取一般控制知识。1986年Mitchell,Keller 和 Kedar-Cabelli等人为基于解释的学习提出了一个统一的算法EBG(Explanation-Based Generalization),该算法建立了基于解释的概括过程,并运用知识的逻辑表示和演绎推理进行问题求解。,5.3 常见的几种学习方法,5.3.2 基于解释的学习,操作规则,目标概念,训练实例,新规则,领域知识,5.3 常见的几种学习方法,5.3.2 基于解释
11、的学习 EBG求解问题的形式可描述于下:给定:(1)目标概念描述TC;(2)训练实例TE;(3)领域知识DT;(4)操作准则OC。求解:训练实例的一般化概括,使之满足:(1)目标概念的充分概括描述TC;(2)操作准则OC。,5.3 常见的几种学习方法,5.3.2 基于解释的学习 其中,领域知识DT是相关领域的实施和规则,在学习系统中作为背景知识,用于证明训练实例TE为什么可以作为目标概念的一个实例,从而形成相应的解释。训练实例TE是为学习系统提供一个例子,在学习过程中起着重要的作用,它应能充分地说明目标概念TC。操作规则OC用于指导学习系统对目标概念进行取舍,使得通过学习产生的关于目标概念TC
12、的一般性描述成为可用的一般性知识。基于解释的学习从本质上说属于演绎学习,它是根据给定的领域知识,进行保真的演绎推理,存储有用结论,经过知识的求精和编辑,产生适合以后求解类似问题的控制知识。,5.3 常见的几种学习方法,5.3.3 基于事例的学习 当无法建立好的模型时,可通过记录事例进行学习。采用基于事例的学习:首先,任何时候都可以应用相容启发方法,把某个预先观察过的事物的特性赋予一个从未见过的新事物;其次,学会如何用于k维树结构迅速找到特征空间内的最近邻物体。相容启发:无论何时要猜测某事物的特性,除了提供一套参考事例外不知道其他情况;通过测量其他事物的已知特性,找到最相近的事例,该事例的特性特
13、性是已知的。作为猜测:所求未知特性是与最相似事例的已知特性一样的。,5.3 常见的几种学习方法,5.3.3 基于概念的学习 归纳学习的定义(1)归纳(induction)是人类拓展认识能力的重要方法,是一种从个别到一般的,从部分到整体的推理行为。(2)归纳推理是应用归纳方法,从足够多的具体事例中归纳出一般性知识,提取事物的一般规律;它是一种从个别到一般的推理。(3)归纳学习(induction learning)是应用归纳推理进行学习的一种方法。从应用角度看,归纳学习可分为概念学习、概念聚集和启发学习三种。,5.3 常见的几种学习方法,5.3.3 基于概念的学习 概念学习研究的路线:(1)基于
14、工程方法的概念学习,它从可能的学习机理出发,试图试验并确定概念学习的工程方法。(2)基于认知建模的概念学习,开发出人类概念学习的计算理论。概念学习的任务:构造类型定义、分类程序(分类),5.3 常见的几种学习方法,5.3.5 基于类比的学习 1.类比推理和类比学习形式类比推理是由新情况与已知情况在某些方面的相似来推出它们在其它相关方面的相似。显然,类比推理是在两个相似域之间进行的:类比推理的目的是从源域中选出与当前问题最近似的问题及其求解方法以求解决当前的问题,或者建立起目标域中已有命题间的联系,形成新知识。,5.3 常见的几种学习方法,5.3.5 基于类比的学习 类比推理过程如下:(1)回忆
15、与联想遇到新情况或新问题时,首先通过回忆与联想在S中找出与当前情况相似的情况,这些情况是过去已经处理过的,有现成的解决方法及相关的知识。(2)选择从找出的相似情况中选出与当前情况最相似的情况及其有关知识。,5.3 常见的几种学习方法,5.3.5 基于类比的学习(3)建立对应映射在S与T的相似情况之间建立相似元素的对应关系,并建立起相应的映射。(4)转换在上一步建立的映射下,把S中的有关知识引到T中来,从而建立起求解当前问题的方法或者学习到关于T的新知识。,5.3 常见的几种学习方法,5.3.5 基于类比的学习 2.类比学习过程与研究类型类比学习主要包括如下四个过程:(1)输入一组已知条件(已解
16、决问题)和一组未完全确定的条件(新问题)。(2)对输入的两组条件,根据其描述,按某种相似性的定义寻找两者可类比的对应关系。,5.3 常见的几种学习方法,5.3.5 基于类比的学习 2.类比学习过程与研究类型(3)按相似变换的方法,将已有问题的概念、特性、方法、关系等映射到新问题上,以获得待求解新问题所需的新知识。(4)对类推得到的新问题的知识进行校验。验证正确的知识存入知识库中,而暂时还无法验证的知识只能作为参考性知识,置于数据库中。,5.3 常见的几种学习方法,5.3.6 基于决策树的归纳学习 1.决策树的概念 决策树算法起源于概念学习系统(CLS:Concept Learning Syst
17、em),是一种有指导的学习方法。决策树分类算法以其易于提取显示规则、计算量相对较小、具有较高的分类准确率等优点被统计学界接受并获得了信赖,并很快被广泛应用于许多领域。决策树技术在许多数据挖掘系统应用中得到研究者和软件公司的极大关注。许多数据挖掘产品中都采用了决策树算法,例如:SAS公司的SAS Enterprise Miner;IBM公司的Intelligent Miner;Solution公司的Clementine;微软的SQL Server。,5.3 常见的几种学习方法,5.3.6 基于决策树的归纳学习 最为典型的决策树学习算法是由J.Ross Quinlan1979年提出的ID3算法。I
18、D3(Iterative Dichotomiser,迭代的二分器)算法是一种基于信息熵的决策树算法,以Shannon的信息论为依据。ID3改进、优化:C4.5算法:1993年,Quinlan出版了专著机器学习规划对C4.5算法进行详细描述。CART(Classification and Regression Tree)算法:描述了二叉决策树的产生,可对连续型因变量进行处理。,5.3 常见的几种学习方法,5.3.6 基于决策树的归纳学习 决策树(又称判定树 decision tree)是一种树结构,其节点分为两类:一类是内节点,另一类是叶节点。内节点:一般用一个属性名来标记,代表对该属性的测试。
19、与内节点连接的边表示对该属性测试的输出。叶节点:每个叶节点表示分类结果,一般用类标号属性值来标记。,5.3 常见的几种学习方法,5.3.6 基于决策树的归纳学习,Male?,grade,grade,class1,class2,class3,class2,yes,no,60,60,60,60,5.3 常见的几种学习方法,5.3.6 基于决策树的归纳学习 如何构造一颗具有较高分类准确率的决策树?关键:如何确定当前要以哪个属性作为测试属性?1948 年Shannon 提出并发展了信息论,研究以数学的方法度量并研究信息。通过通信后对信源中各种符号出现的不确定程度的消除来度量信息量的大小。(1)自信息量
20、 设系统S中有多个可能发生的事件:a1,a2,an,事件ai发生的概率为p(ai),i=1,2,n,p(ai)0,1 p(ai)越大,事件ai不确定程度越低,反之,则越高。,5.3 常见的几种学习方法,5.3.6 基于决策树的归纳学习 用-log p(ai)表示事件ai的不确定程度,称为ai的自信息量I(ai)I(ai)=-log p(ai)/log以2为底(2)信息熵(entropy)如果将S看作一个信源,a1,a2,an看成信源S发出的n种类型的信息,则信源S的不确定性可以用平均自信息量来度量,记为H(S),定义:,5.3 常见的几种学习方法,5.3.6 基于决策树的归纳学习 2.决策树的
21、学习 决策树学习的过程是从空树开始,从训练集中不断选择测试属性,逐步创建决策树的过程。设X为训练集,分为m类,第i类中的训练实例集合记为Ci,i=1,2,m,那么X中任意一个实例属于类Ci的概率估计值为:p(Ci)=|Ci|/|X|其中|X|表示集合X中的元素个数。训练集X关于类簇C=C1,C2,Cm的分类不确定性可用西面信息熵来度量:,5.3 常见的几种学习方法,5.3.6 基于决策树的归纳学习 在C已知的情况下(训练集中已确定),H(X,C)简写为H(X)。构造决策树的目的:将训练集X的不确定程度H(X)降至最低。从而可以对未知数据(X集以外的数据)进行分类预测。构造决策树的过程是从空树开
22、始不断添加节点的过程,关键是选择测试属性,使得构造起来的“半”决策树最大限度减低训练集X的信息熵H(X)。,5.3 常见的几种学习方法,5.3.6 基于决策树的归纳学习,5.3 常见的几种学习方法,5.3.6 基于决策树的归纳学习 设A=a1,a2,ar为候选的测试属性,那么属性A对X形成一个划分a1,a2,ar,其中ai表示X中在属性A上取值为ai的实例集合,i=1,2,r。现对任意i1,2,r,考虑类ai。令则 形成ai的一个划分,于是类ai关于类簇 的分类不确定性程度为:,5.3 常见的几种学习方法,5.3.6 基于决策树的归纳学习 其中,表示类ai中任意一个实例属于 的概率,令称E(A
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 人工智能 基础 05 机器 学习

链接地址:https://www.31ppt.com/p-5194281.html