归纳和分析学习的结合机器学习.ppt
《归纳和分析学习的结合机器学习.ppt》由会员分享,可在线阅读,更多相关《归纳和分析学习的结合机器学习.ppt(27页珍藏版)》请在三一办公上搜索。
1、机器学习-归纳和分析学习的结合 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏,1,机器学习,第12章 归纳和分析学习的结合,机器学习-归纳和分析学习的结合 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏,2,概述,纯粹的归纳学习方法通过在训练样例中寻找经验化的规律来形成一般假设纯粹的分析方法使用先验知识演绎推导一般假设本章考虑将归纳和分析的机制结合起来的方法,并获得两者的优点:有先验知识时获得更高的泛化精度和依赖训练数据克服先验知识的不足所得到的结合的方法比纯粹的归纳方法和分析方法的性能都要高,机器学习-归纳和分析学习的结合 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏,
2、3,动机,归纳学习寻找拟合训练数据的一般假设,分析学习寻找拟合先验知识的一般假设,同时使它覆盖训练数据归纳方法和分析方法对假设的论证方法有根本区别,因此优缺点互为补充,将它们结合起来有可能得到更强有力的学习方法纯粹的分析学习方法的优缺点优点:可用先验知识从较少的数据中更精确地泛化以引导学习缺点:当先验知识不足或不正确时,可能产生误导纯粹的归纳学习方法的优缺点优点:不需要显示的先验知识,主要基于训练数据学习规律缺点:训练数据不足时,会失败,会被其中隐式的归纳偏置所误导,机器学习-归纳和分析学习的结合 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏,4,表12-1 纯粹的分析学习和纯粹的归纳
3、学习的比较,机器学习-归纳和分析学习的结合 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏,5,动机(2),图12-1概述了学习问题的分布范围,它随着可获得的先验知识和训练数据不同而变化在一个极端,有大量的训练数据,但没有先验知识在另一个极端,有很强的先验知识,但训练数据很少多数实际学习问题位于这两个极端之间,通常可以从近似的先验知识开始本章考虑的问题是:什么样的算法,使用近似的先验知识结合可用数据来形成一般的假设,机器学习-归纳和分析学习的结合 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏,6,动机(3),即使使用最纯粹的归纳学习算法,仍有机会基于特定学习任务的先验知识来选择设
4、计方案通常设计者将领域特定的知识嵌入到学习算法中,但我们感兴趣的是一个系统能将先验知识和训练数据作为显示的输入给学习器概括而言,我们感兴趣的是领域无关算法,这种算法使用显示输入的领域相关的知识,这种算法具备以下的属性:如果没有领域理论,它至少能像纯粹的归纳方法一样有效学习如果没有完美的领域理论,它至少能像纯粹的分析方法一样有效学习如果领域理论和训练数据都不完美,它应能结合两者的长处,比单纯的归纳或分析方法的性能要好它应能处理训练数据中未知程度的差错它应能处理领域理论中未知程度的差错这里列出的期望目标很难达到,目前没有算法能以一般化的方式满足所有这些约束,机器学习-归纳和分析学习的结合 作者:M
5、itchell 译者:曾华军等 讲者:陶晓鹏,7,学习的归纳-分析途径,本章考虑的学习问题已知一个训练样例集合D,可能包含差错一个领域理论B,可能包含差错候选假设的空间H求解一个最好地拟合训练样例和领域理论的假设最好地拟合训练样例和领域理论的确切定义,机器学习-归纳和分析学习的结合 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏,8,学习的归纳-分析途径(2),确定先验知识和数据权值的一种解决方法是使用贝叶斯观点贝叶斯定律描述了怎样计算给定训练数据D时假设h的后验概率贝叶斯定律基于观察到的数据D以及先验知识计算后验概率,以P(h),P(D)和P(D|h)的形式表示我们可以把P(h),P(
6、D)和P(D|h)看作是某种形式的背景知识贝叶斯理论可看作一种为领域理论加权的方法,它与观察到的数据D一起,赋予h的后验概率为P(h|D)贝叶斯公式提供了为先验知识和观察到数据的贡献加权的方法但是,贝叶斯公式隐含假定了关于P(h),P(D),P(D|h)概率分布的完美知识贝叶斯公式没有提供将这些近似已知的概率分布与观察数据结合起来的方法,机器学习-归纳和分析学习的结合 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏,9,假设空间搜索,大多数学习任务可以刻画为假设空间上的搜索任务,而决定这个搜索任务的4个参数是:假设空间H搜索的初始假设h0定义单个搜索步的搜索算子集合O指定搜索目标的判据G
7、本章探索了3种方法,它们用先验知识来改变纯归纳方法执行的搜索使用先验知识推导出搜索起步的初始假设:Kbann使用先验知识来改变假设空间搜索的目标:Ebnn使用先验知识改变可用的搜索步:Focl,机器学习-归纳和分析学习的结合 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏,10,使用先验知识得到的初始假设,KBANN技术:一种使用先验知识的方法是将假设初始化为完美拟合领域理论,然后按照需要归纳地精化初始假设以拟合训练数据这种技术的动机是:如果领域理论是正确的,初始假设将正确分类所有训练样例,而无需再修正;如果初始假设不能完美地分类训练样例,那么它需要被归纳精华,以改进它在训练样例上的拟合
8、度在纯粹归纳的反向传播算法中,权值一般被初始化为小的随机值,KBANN的含义是:即使领域理论是近似正确的,将网络初始化为拟合领域理论,比初始化为随机值有更好的近似开端,机器学习-归纳和分析学习的结合 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏,11,KBANN算法,KBANN假定领域理论用一组命题形式的非递归的Horn子句来表示,输入和输出如下:已知:一组训练样例由非递归命题型Horn子句组成的领域理论求解:一个拟合训练样例的被领域理论偏置的人工神经网络KBANN算法包含两个阶段创建一个完美拟合领域理论的人工神经网络使用反向传播算法来精化初始网络以拟合训练样例,机器学习-归纳和分析学
9、习的结合 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏,12,表12-2 KBANN算法,KBANN(Domain_Theory,Training_Examples)Domain_Theory:非递归命题型Horn子句集Training_Examples:目标函数的对的集合分析步:创建一个等价于领域理论的初始网络对每个实例属性创建一个网络输入对Domain_Theory的每个Horn子句,创建如下的网络单元连接此单元的输入到此子句的先行词测试的属性对子句的每个非负先行词,赋予权值W给对应的sigmoid单元输入对子句的每个负先行词,赋予权值-W给对应的sigmoid单元输入设置此单元的
10、阈值w0为-(n-0.5)W,其中n为子句的非负先行词的数目在网络单元之间增加附加的连接,连接深度为i的每个网络单元到深度为i+1的所有网络单元的输入层上,赋予这些附加的连接为接近0的随机权值归纳步:精化此初始网络应用反向传播算法来调整初始网络权值以拟合Training_Examples,机器学习-归纳和分析学习的结合 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏,13,举例,表12-3 Cup学习任务领域理论训练样例在KBANN算法的第一步,构建一个与领域理论一致的初始网络,见图12-2对领域理论中每个Horn子句建立一个sigmoid单元对该Horn子句的每个先行词,建立其对应的S
11、igmoid单元作为输入对于每个对应于非负先行词的输入,权值被设置为某正常量W,对每个对应于负先行词的输入,权值为-W单元的阈值权w0设为-(n-0.5)W,其中n为非负先行词的数目附加许多输入到每个阈值单元,它们的权值设置为近似0,从而允许网络能够学习到超出领域理论的依赖关系在KBANN算法的第二步,使用训练样例和反向传播算法来精化网络权值图12-3在归纳步发现了全新的依赖关系,机器学习-归纳和分析学习的结合 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏,14,KBANN算法说明,KBANN的好处和局限好处:在给定近似正确领域理论时,能够比反向传播有更高的泛化精度,特别是在训练数据稀
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 归纳 分析 学习 结合 机器
链接地址:https://www.31ppt.com/p-6185202.html