机器学习入门:回归问题课件.pptx
《机器学习入门:回归问题课件.pptx》由会员分享,可在线阅读,更多相关《机器学习入门:回归问题课件.pptx(40页珍藏版)》请在三一办公上搜索。
1、机器学习入门:回归算法原理及应用,1,.,人类学习过程,认知,模仿,实践,反馈,再认知,2,.,?,机器学习就是让计算机从大量的数据中学习到相关的规律和逻辑,然后利用学习来的规律来进行决策,推理和识别等。,什么是机器学习?,测试数据,发现规律,测试,结果评估,规则,邮件Xi,Yi:垃圾or正常,发件人邮件地址异常;标题含有“低价促销”,3,.,机器学习应用实例,应用实例:1、对语言、文字的认知与识别2、对图像、场景、自然物体的认知与识别3、对规则的学习与掌握例如:下雨天要带伞,生病要吃药,天冷了要穿厚衣服等4、对复杂事物的推理与判断能力例如:好人与坏人的辨别能力,事物的正误的判断能力,4,.,
2、机器学习的种类,根据学习方式的不同,可以分为监督学习,无监督学习和强化学习等几种类型。,监督学习(有指导),无监督学习(自学),强化学习(自我评估),5,.,机器学习三要素,机器学习可以认为是一个在逐步发现和探索规律的过程。学习过程主要包含以三个要素:模型表示问题的影响因素(特征)有哪些?它们之间的关系如何?模型评估什么样的模型是好的模型参数优化如何高效的找到最优参数,6,.,”回归“的由来,英国人类学家F.Galton首次在自然遗传一书中,提出并阐明了“相关”和“相关系数”两个概念,为相关论奠定了基础。 其后,他和英国统计学家Karl Pearson对上千个家庭的身高,臂长,拃长(伸开大拇指
3、与中指两端的最大长度)做了测量,发现了一种现象。,7,.,回归问题应用场景,回归分析属于有监督学习,简单有效,应用十分广泛:,8,.,一个简单的例子,9,.,回归分析,回归分析研究的主要是因变量(目标)和自变量(经验)之间的依存关系。按关系类型,又可分为线性回归分析和非线性回归分析。学习过程如下:,10,.,理想的拟合直线,Linear Regression,11,.,最小二乘算法,12,.,最小二乘算法,13,.,选择“最优回归方程”,回归方程中包含的自变量个数越多,回归平方和就越大,残差平方和越小,预测值的置信区间也越小。 既要选择对预测影响显著的自变量,又要使回归的损失很小,这样才有利于
4、预测。选择“最优回归方程”的方法有:最优子选择法(best subset selection)逐步选择法(stepwise selection),14,.,Best subset selection,最优子集选择法(best subset selection),即对n个预测变量的所有可能组合(共有2n-1)分别进行拟合,然后选择出最优模型。,15,.,Stepwise Selection,逐步选择法按选择方式的不同,共分为三种:前向逐步选择法(Forward Stepwise Selection)后向逐步选择法(Backward Stepwise Selection)逐步回归法(Stepwis
5、e Regression) 基于最优子集回归方法的一些缺陷,逐步选择的优点是限制了搜索空间,从而提高了运算效率。,16,.,Forward Stepwise Selection,以零模型为起点,依次往模型中添加变量, 直至加完所有的变量。 但每次优先将能够最大限度地提升模型效果的变量加入模型。 但无法保证找到的模型是所有2n-1个模型中最优的,且可能在前期将后来变得多余的变量纳入模型。,模型个数:n(n+1)/2+1,17,.,Backward Stepwise Selection,以全模型为起点,逐次迭代,每次移除一个对模型拟合结果最不利的变量。 需满足样本量m大于变量个数n(保证全模型被拟
6、合)。而前向逐步选择即时在mn的情况下也可以使用,适应于高维数据。,模型个数:n(n+1)/2+1,18,.,Stepwise Regression,该方法将前向选择与后项进行了结合,试图达到最优子集选择效果的同时也保留了前向和后向逐步选择在计算上的优势。,19,.,损失函数(loss function),损失函数(loss function)度量预测错误的程度,常记作L(Y,f(X)。常见的损失函数有以下几种: 0-1损失函数(0-1 loss function):缺点:无法度量损失的“严重程度”。,20,.,损失函数(loss function),平方损失函数(quadratic loss
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 机器 学习 入门 回归 问题 课件
链接地址:https://www.31ppt.com/p-1801914.html