机器学习算法汇总汇总课件.ppt
《机器学习算法汇总汇总课件.ppt》由会员分享,可在线阅读,更多相关《机器学习算法汇总汇总课件.ppt(411页珍藏版)》请在三一办公上搜索。
1、,2016.11,机器学习(Machine Learning),报告建议内容,基本概念以及数学定义基本性质及其物理意义具体算法应用(详细举例讲解)该算法与其他类似算法的分析比较可能的发展方向附参考文献,2,机器学习,TomM.Mitchell(汤姆米切尔)著,曾华军,张银华等译,机械工业出版社,2003年。,参考书,其它参考书,机器学习及其应用,周志华,王钰主编,清华大学出版社,2009。神经网络与机器学习,Simon Haykin著,机械工业出版社,2010。机器学习导论,Ethem Alpaydin著,机械工业出版社,2009。Machine Learning A Probabilisti
2、c Perspective Kevin P.Murphy,2012,第1章 引 言,什么是机器学习【经典定义】:计算机程序如何随着经验积累自动提高性能,系统自我改进的过程。或:计算机利用经验改善系统自身性能的行为。米切尔随着该领域的发展,主要做智能数据分析。,学习与智能,学习现象语言、文字的认知识别图像、场景、自然物体的认知识别规则(eg 下雨天要带雨伞)复杂的推理、判断能力(智能)好人与坏人?好猫与坏猫?,什么是机器学习?,使得计算机具备和人类一样的学习能力决策推理认知识别 等智能给定数据(样本、实例)和一定的学习规则,从数据中获取知识的能力,机器学习与人工智能,自然智慧的伟大与奥妙举例:婴
3、儿的认知能力(声音、人脸、汽车)重要的二个特点:容错性,推广能力(举一反三)机器智能:希望用机器实现部分智能基于数据的机器学习问题(引自清华张学工教授)根据已知样本估计数据之间的依赖关系,从而对未知或无法测量的数据进行预测和判断关键:推广能力,什么是机器学习,中科院王珏研究员给出的定义:令W是给定世界的有限或无限所有观测对象的集合,由于我们的观测能力有限,我们只能获得这个世界的一个子集,称为样本集。机器学习就是根据这个样本集,推算这个世界W的模型,使它对这个世界(尽可能地)为真。三个重要的理论问题:一致:W与Q有相同的性质。eg.i.i.d划分:设样本定义于d维空间,要寻找在这个空间上的决策分
4、界面泛化(推广能力):对未知样本的判断能力,Whats is the Learning Problem?,Learning=Improving with experience at some taskImprove over task TWith respect to performance measurement PBased on experience EExample:中国象棋任务T:下中国象棋 性能目标P:比赛中击败对手(的百分比)训练经验E:和自己进行对弈,或者看棋谱,Ref:机器学习(曾华军等译),Pedro对学习理解,Machine Learning,引用自CMU Dr.Eric
5、 Xing的Lecture Notes,机器学习的研究意义,机器学习的重要性!,Science2001年论文:每个科学领域的科学过程都有它自己的特点,但是,观察、创立假设、根据决定性实验或观察的检验、可理解检验的模型或理论,是各个学科所共有的。对这个抽象的科学过程的每一个环节,机器学习都有相应的发展,我们相信它将导致科学方法中从假设生成、模型构造到决定性实验这些所有环节的合适的、部分的自动化。当前机器学习研究在一些基本论题上取得令人印象深刻的进展,我们预期机器学习研究在今后若干年中将有稳定的进展!”在稍早前,2000年Science还发表了另外3篇ML方面的论文“The Manifold Wa
6、y of Perceptron”,“A global geometric framework for nonlinear dimensionality reduction”,”Nonlinear dimensionality reduction by locally”,Mjolsness,D DeCoste,Machine Learning for Science:State of the Art and Future Prospects-Science,2001:2051-2055.,受到令人惊讶的重视!,机器学习的重要性,摘自南京大学周志华教授,生物信息学,计算金融学,分子生物学,行星地质
7、学,工业过程控制,机器人,遥感信息处理,信息安全,机 器 学 习,多学科交叉,机器学习也是一个多学科交叉的产物,它吸取了人工智能、概率统计、神经生物学、认知科学、信息论、控制论、计算复杂性理论、哲学等学科的成果。实践证明,机器学习在很多应用领域发挥了重要的实用价值,特别是在数据挖掘、语音识别、图像处理、机器人、车辆自动驾驶、生物信息学、信息安全、遥感信息处理、计算金融学、工业过程控制。,重要性:例子网络安全,入侵检测:是否是入侵?是何种入侵?,如何检测?历史数据:以往的正常访问模式及其表现、以往的入侵模式及其表现对当前访问模式分类,这是一个典型的预测型机器学习问题常用技术:神经网络 决策树支持
8、向量机 k近邻序列分析 聚类,搜索引擎,摘自南京大学周志华教授,重要性:例子生物信息学,常用技术:神经网络 支持向量机隐马尔可夫模型k近邻 决策树序列分析 聚类,重要性:例子数据驱动控制,相关学科对ML的影响,人工智能:学习的概念符号表示Bayes 方法统计学:统计学习理论(SLT)计算复杂性理论控制论信息论:最小描述长度哲学:“Occams Razor原则”,“没有免费午餐”心理学和神经生物学:Neural Networks(神经网络),机器学习目前主要的一些研究领域,符号机器学习Eg.决策树,ID3,计算学习理论(统计学习理论)PAC,SVM监督学习,非监督学习,半监督学习集群机器学习En
9、semble Learning,Boosting流行(Manifold)学习强化学习Ranking学习聚类学习,Machine Learning Topics from Wiki,http:/en.wikipedia.org/wiki/Machine_Learning,机器学习简要发展历史回顾,ML的发展历史(1),1950s:神经科学的理论基础James关于神经元是相互连接的发现McCullon&Pitts的神经元模型Hebb 学习律(相互连接强弱度的变换规则)1960s:感知器(Perceptron)时代1957年Rosenblatt首次提出,ML的发展历史(2),1969年:Percep
10、tron出版,提出著名的XOR问题1970s:符号主义,逻辑推理1980s:MLP+BP算法成功解决XOR问题,从此进入神经网络时代(连接主义)1960s-1970s:统计学习理论创立VC维的基本概念结构风险最小化原则概率空间的大数定律,ML的发展历史(3),1990s:统计学习理论的发展及完善典型代表:SVM(Vapnik,Bell实验室)结构风险最小化最小描述长度原则小样本问题核函数、核空间变化PAC理论下的弱可学习理论的建立支持向量机,ML的发展历史(4),2000s:各种机器学习理论及算法得以充分发展符号机器学习计算机器学习(统计学习理论,典型例子:SVM)集群机器学习(典型代表:Bo
11、osting)强化机器学习流行机器学习监督学习,非监督学习半监督学习、.,未来发展趋势,机器实际上是一个应用驱动的学科,其根本的驱动力是:“更多、更好地解决实际问题”由于近20年的飞速发展,机器学习已经具备了一定的解决实际问题的能力,似乎逐渐开始成为一种基础性、透明化的“支持技术、服务技术”基础性:在众多的学科领域都得以应用(“无所不在”)透明化:用户看不见机器学习,看见的是防火墙、生物信息、搜索引擎;(“无所不在”)“机器更好用了”(正如CALO的一些描述:“you wont leave home without it”;”embodied as a software environment
12、 that transcends workstations,PDAs,cell phones,”),讨论议题,机器学习的主要策略与基本结构 机器学习的主要策略 机器学习系统的基本结构,机器学习系统的基本结构,我们以西蒙的学习定义做为出发点,建立起下图1.1所示的简单的学习模型,然后通过对这个简单模型的讨论,总结出设计学习系统应当注意的某些总的原则。,图 1.1 学习系统的基本结构,学习问题的标准描述,定义如果一个计算机针对某类任务T,用P来衡量性能,根据经验E来自我完善,那么我们称这个计算机程序在从经验E中学习,针对某类任务T,它的性能用P来衡量。西洋跳棋学习问题的解释E,和自己下棋T,参与比
13、赛P,比赛成绩(或赢棋能力,击败对手的百分比)手写识别学习问题机器人驾驶学习问题,学习问题的标准描述(2),定义太宽泛甚至包括了以非常直接的方式通过经验自我提高的计算机程序实际的机器学习问题往往比较复杂定义一类问题探索解决这类问题的方法理解学习问题的基本结构和过程,有监督学习,有监督的学习方法在样本标签已知的情况下,可以统计出各类训练样本不同的描述量,如其概率分布,或在特征空间分布的区域等,利用这些参数进行分类器设计,称为有监督的学习方法。,无监督学习,无监督学习然而在实际应用中,不少情况下无法预先知道样本的标签,也就是说没有训练样本因而只能从原先没有样本标签的样本集开始进行分类器设计,这就是
14、通常说的无监督学习方法。对一个具体问题来说有监督与无监督的作法是不相同的,有监督学习,x1,x2,无监督学习,x1,x2,机器学习的问题,存在什么样的算法能从特定的训练数据学习一般的目标函数呢?如果提供了充足的训练数据,什么样的条件下,会使特定的算法收敛到期望的函数?哪个算法对哪些问题和表示的性能最好?多少训练数据是充足的?怎样找到学习到假设的置信度与训练数据的数量及提供给学习器的假设空间特性之间的一般关系?学习器拥有的先验知识是怎样引导从样例进行泛化的过程的?当先验知识仅仅是近似正确时,它们会有帮助吗?关于选择有效的后验训练经验,什么样的策略最好?这个策略的选择会如何影响学习问题的复杂性。怎
15、样把学习任务简化为一个或多个函数逼近问题?换一种方式,系统该试图学习哪些函数?这个过程本身能自动完成吗?学习器怎样自动地改变表示法来提高表示和学习目标函数的能力?,课程内容简介,第2章,基于符号和逻辑表示的概念学习(简介)第3章,决策树第4章,回归模型与神经网络第5章,评估假设第6章,贝叶斯理论(混合模型与EM算法)第7章,基于实例的学习(核函数与径向基函数网络)第8章,马尔科夫与隐马尔可夫模型第9章,支持向量机(线性判别与SVM)第10章,增强学习,参考期刊与会议,相关杂志Machine LearningNeural ComputationJournal of the American St
16、atistical AssociationIEEE transactions on Pattern Analysis&Machine Intelligence国际会议国际机器学习会议ICML神经信息处理系统会议NIPS计算学习理论会议CCLT国际遗传算法会议ICGA,参考学术期刊及国际会议,一些网络资源(1),http:/machine-AAAI Machine Learning Topics:www.aaai.org/AITopics/html/machine.html-Support Vector Machines:http:/www.support-vector-machines.org
17、/index.html,一些网络资源(2),http:/www.cs.cmu.edu/tom/10701_sp11/lectures.shtmlMachine Learning(Spring 2011)CMUTom MitchellVideo Lecture&SlidesMachine Learning Resources:http:/,一些网络资源(3),Weka:Data Mining(ML)software in Java:http:/www.cs.waikato.ac.nz/ml/weka/LibSVM-A Library for Support Vector Machines:www
18、.csie.ntu.edu.tw/cjlin/libsvm MLC+:http:/:A library of C+classes for supervised machine learning UCI-Machine Learning information,software and databases:http:/archive.ics.uci.edu/ml/,一些网络资源(4),Kernal Machines:http:/www.kernel-machines.org/http:/mloss.org/software/:Machine Learning Open Source Softwa
19、rehttp:/www3.ntu.edu.sg/home/aswduch/ai-ml.html 数据挖掘研究院:http:/,概念学习给定某一类别的若干正例和反例,从中获得该类别的一般定义。搜索的观点在预定义的假设空间中搜索假设,使其与训练样例有最佳的拟合。利用假设空间的偏序结构算法收敛到正确假设的条件?归纳学习的本质,从训练数据中泛化的理由?,第2章 概念学习和一般到特殊序,简介,许多机器学习涉及到从特殊训练样例中得到一般概念。概念,可被看作一个对象或事件集合,它是从更大的集合中选取的子集,或在这个较大集合中定义的布尔函数。概念学习问题的定义给定一个样例集合以及每个样例是否属于某个概念的标注
20、,怎样推断出该概念的一般定义。又称从样例中逼近布尔函数。概念学习是指从有关某个布尔函数的输入输出训练样例中推断出该布尔函数。,概念学习任务,一个例子目标概念Aldo进行水上运动的日子,表示为布尔函数EnjoySport任务目的基于某天的各属性,预测EnjoySport的值给定一个样例集D每个样例表示为6个属性的集合,概念学习任务(2),Yes,Change,Cool,Strong,High,Warm,Sunny,4,No,Change,Warm,Strong,High,Cold,Rainy,3,Yes,Same,Warm,Strong,High,Warm,Sunny,2,Yes,Same,Wa
21、rm,Strong,Normal,Warm,Sunny,1,EnjoySport,Forecast,Water,Wind,Humidity,AirTemp,Sky,Example,表2-1 目标概念EnjoySport的训练样例,概念学习任务(3),表示假设的形式(目标函数的表示)一个简单的形式,实例的各属性约束的合取式令每个假设为6个约束(或变量)的向量,每个约束对应一个属性可取值范围,为?任意本属性可接受的值明确指定的属性值 不接受任何值假设的例子/所有的样例都是正例/所有的样例都是反例,概念学习任务(4),形式化描述:已知实例集X每个实例x由6个属性描述,每个属性的取值范围已确定假设集H
22、每个假设h描述为6个属性的取值约束的合取目标概念c一个布尔函数,变量为实例训练样例集D目标函数(或目标概念)的正例和反例求解H中的一假设h,使对于X中任意x,h(x)=c(x),术语定义,实例x实例集X概念目标概念c训练样例x训练样例集D正例,目标概念成员反例,非目标概念成员假设h假设集H机器学习的目标就是寻找一个假设h,使得对所有的h,都有h(x)=c(x),归纳学习假设,什么是归纳学习?从特殊的样例得到普遍的规律(从特殊到一般)归纳只能保证输出的假设能与训练样例相拟合归纳假设的一个基本假定对于未见实例最好的假设就是与训练数据最佳拟合的假设归纳学习假设任一假设如果在足够大的训练样例集中很好地
23、逼近目标函数,它也能在未见实例中很好地逼近目标函数。,作为搜索的概念学习,概念学习可以看作一个搜索的过程搜索范围:假设的表示所隐含定义的整个空间搜索目标:能够最好地拟合训练样例的假设当假设的表示形式选定后,那么就隐含地为学习算法确定了所有假设的空间例子EnjoySport的假设空间,如果属性Sky有3种可能的值,而AirTemp、Humidity、Wind、Water和 Forecast都只有两种可能值。实例空间X:包含322222=96种不同的实例假设空间H包含544444=5120种语法不同的假设由于:包含有符号的假设将每个实例都分类为反例。因此,语义不同的假设只有1+433333=973
24、个。,假设的一般到特殊序,假设的一般到特殊序关系考虑下面两个假设h1=h2=任何被h1划分为正例的实例都会被h2划分为正例,因此h2比h1更一般。利用这个关系,无需列举所有假设,就能在无限的假设空间中进行彻底的搜索,假设的一般到特殊序(2),关系“更一般”的精确定义任给实例x和假设h,说x满足h,当且仅当h(x)=1令hj和hk是在X上定义的布尔函数,称hj比hk更一般,当且仅当(xX)(hk(x)=1)(hj(x)=1)记为hj more_general_than_or_equal_to hk,或hj g hk,假设的一般到特殊序(3),“更一般”的严格情形hj g hk,当且仅当,(hj
25、g hk)(hk g hj)“更特殊”关系的定义hj g hk,当且仅当,hk g hj以EnjoySport为例说明上面的定义偏序的特点(区别于全序),全序上的搜索可以是二分法,偏序的搜索比无序简单,比全序复杂。这个偏序关系的定义与目标概念无关,h1=h2=h3=,x1=x2=,Find-S:寻找极大特殊假设,使用more_general_than偏序的搜索算法从H中最特殊假设开始,然后在假设覆盖正例失败时将其一般化Find-S算法将h初始化为H中最特殊假设对每个正例x对h的每个属性约束ai如果x满足ai那么不做任何处理否则将h中ai替换为x满足的另一个更一般约束输出假设h,Find-S:寻
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 机器 学习 算法 汇总 课件
链接地址:https://www.31ppt.com/p-3758671.html