机器学习(2.概念学习).ppt
《机器学习(2.概念学习).ppt》由会员分享,可在线阅读,更多相关《机器学习(2.概念学习).ppt(63页珍藏版)》请在三一办公上搜索。
1、1,机器学习 概念学习,2,归纳学习概念概念学习定义作为搜索的概念学习(搜索策略:偏序)Find-S:寻找极大特殊假设变形空间和候选消除算法归纳偏置,OUTLINE,3,归纳学习也可以称作归纳推理或简称归纳,其任务是:给定函数f(未知)的实例集合,返回一个近似于f的函数hh称为假设,所有h的集合称为假设空间一个好的假设应该能够预测未见过的实例这就是基本的归纳问题问题实例用一个单变量函数(近似目标函数)来拟合若干数据点,选择最高次数为k的多项式集合作为假设h的集合,即假设空间H,归纳学习,4,数据拟合,5,上图中显示了拟合两两一组数据的不同函数与所有数据一致的函数称为一致假设如何在多个一致假设之
2、间进行选择?答案奥卡姆剃刀原则(Ockhams razor)优先选择与数据一致的最简单假设原因比数据本身更复杂的假设不能从数据中提取任何模式此外,对于非确定性函数,在假设的复杂度和数据拟合度之间进行折中不可避免,Ockham剃刀原则,6,归纳学习概念概念学习定义作为搜索的概念学习(搜索策略:偏序)Find-S:寻找极大特殊假设变形空间和候选消除算法归纳偏置,OUTLINE,7,概念学习给定某一类别的若干正例和反例,从中获得该类别的一般定义。搜索的观点在预定义的假设空间中搜索假设,使其与训练样例有最佳的拟合。利用假设空间的偏序结构算法收敛到正确假设的条件,概念学习,8,概念学习的定义给定一个样例
3、集合以及每个样例是否属于某个概念的标注,怎样推断出该概念的一般定义。又称从样例中逼近布尔函数。概念学习是指从有关某个布尔函数的输入输出训练样例中推断出该布尔函数。,概念学习,9,例子 enjoy sport,目标概念,Aldo进行水上运动的日子,表示为布尔函数EnjoySport任务目的,基于某天的各属性,预测EnjoySport的值一个样例集,每个样例表示为属性的集合,表2-1 目标概念EnjoySport的训练样例,10,基本概念实例 x:每一个实例使用若干属性表示,相应属性值构成一个实例,例子 enjoy sport,11,基本概念实例集 X:概念定义在一个实例集合之上,这个集合表示为X
4、,例子 enjoy sport,12,基本概念目标概念 c:待学习的概念或函数称为目标概念,记作c,例子 enjoy sport,13,基本概念训练样例 d:每个样例为X中的一个实例x以及他的目标概念值c(x)。表示为序偶 注意:EnjoySport=yes时c(x)=1 EnjoySport=no时c(x)=0,例子 enjoy sport,14,基本概念正例:c(x)=1的实例被称为正例反例:c(x)=0的实例被称为反例,例子 enjoy sport,15,基本概念训练样例集 D:训练样例的集合,例子 enjoy sport,16,例子 enjoy sport,基本概念假设 h:表示X上定
5、义的布尔函数,即h:X 0,1,假设 h:,问题:本例中怎样表示假设?实例的各属性约束的合取值,17,例子 enjoy sport,基本概念假设 h:,明确指定的属性值,任意本属性可接受的值,不接受任何值:,18,例子 enjoy sport,基本概念假设集合 H:所有可能假设的集合,19,例子 enjoy sport,已知:实例集 X假设集 H目标概念 c:X0,1训练样例 D求解(学习目标):H中的一假设h,使对于X中任意x,h(x)=c(x),20,归纳学习假设,归纳学习假设任一假设如果在足够大的训练样例集中很好地逼近目标函数,它也能在未见实例中很好的逼近目标函数,21,归纳学习概念概念
6、学习定义作为搜索的概念学习(搜索策略:偏序)Find-S:寻找极大特殊假设变形空间和候选消除算法归纳偏置,OUTLINE,22,作为搜索的概念学习,概念学习:可以看作一个在假设空间上搜索的过程,学习:训练样例 假设空间选取,假设的表示所隐含定义的整个空间,目标:能够最好地拟合训练样例的假设,23,作为搜索的概念学习,当假设的表示形式选定后,那么就隐含地为学习算法确定了所有假设的空间E.g.EnjoySport的实例空间:3X2X2X2X2X2=96假设空间H中语法不同的假设:5X4X4X4X4X4=5120假设空间H中语义不同的假设:(去掉“空”)4X3X3X3X3X3+1=973,3+?+,
7、24,假设空间,假设的表示形式:析取连接词(Disjunctive conjunction)线性等式(Liner equation)其它方法假设空间大小:|H|X|,25,搜索策略,假设空间中彻底详尽的搜索需要一个策略(顺序)Why?如何对假设排序?线性排序偏序,26,假设的一般到特殊序,假设的一般到特殊序关系考虑下面两个假设h1=h2=任何被h1划分为正例的实例都会被h2划分为正例,因此h2比h1更一般。利用这个关系,无需列举所有假设,就能在无限的假设空间中进行彻底的搜索,27,假设的一般到特殊序,关系“更一般”的精确定义任给实例x和假设h,说x满足h,当且仅当h(x)=1令hj和hk是在X
8、上定义的布尔函数,称hj比hk更一般,当且仅当(xX)(hk(x)=1)(hj(x)=1)记为hj more_general_than_or_equal_to hk,或hj g hk,28,实例、假设和more_general_than关系,x1=x2=,实例X,假设集 H,x1,x2,h1,h2,h3,h1=h2=h3=,specific,general,29,归纳学习概念概念学习定义作为搜索的概念学习(搜索策略:偏序)Find-S:寻找极大特殊假设变形空间和候选消除算法归纳偏置,OUTLINE,30,Find-s:寻找极大特殊假设算法,使用more_general_than偏序的搜索算法从
9、H中最特殊假设开始,然后在假设覆盖正例失败时将其一般化,Specific hypothesis,31,Find-s算法,Find-S算法将h初始化为H中最特殊假设对每个正例x对h的每个属性约束ai 如果x满足ai 那么不做任何处理 否则将h中ai替换为x满足的下一个更一般约束输出假设h,32,Find-s中的假设空间搜索,x1=,+x2=,+x3=,-x4=,+,实例 X,假设集 H,x1,x2,h0,h1,h2,3,h0=h1=h2=h3=h4=,特殊,一般,x3,h4,x4,33,Find-s的特点,Find-S算法演示了一种利用more_general_than偏序来搜索假设空间的方法,
10、沿着偏序链,从较特殊的假设逐渐转移到较一般的假设。因此,每一步得到的假设都是在那一点上与训练样例一致的最特殊的假设。Find-S的重要特点:对以属性约束的合取式描述的假设空间H,保证输出为H中与正例一致的最特殊的假设。,34,Find-s存在问题,存在的问题是否收敛到了正确的目标概念?Find-s找到了与训练样例一致的假设,但无法确定它是否找到了唯一合适的假设(即目标概念本身)。或者说是否还有其它的假设为什么要用最特殊的假设?如果有多个与D一致的假设,它只找到最特殊的假设训练样例是否相互一致?D中出现错误将严重破坏Find-s算法如果有多个极大特殊假设怎么办?,35,归纳学习概念概念学习定义作
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 机器 学习 概念
链接地址:https://www.31ppt.com/p-6583550.html