欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPTX文档下载  

    对Boston数据集的分析统计机器学习期中考试ppt课件.pptx

    • 资源ID:1414761       资源大小:1.90MB        全文页数:21页
    • 资源格式: PPTX        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    对Boston数据集的分析统计机器学习期中考试ppt课件.pptx

    Analysis ofboston datasets,组员:郭晋 郭煜 田甜 刘一诺,Questions:,怎样预测波士顿的犯罪率?怎么预测某市民是否犯罪?,Q1:怎样预测波士顿的犯罪率,下面是我们的解决过程:1、做出每个变量对变量crim的简单线性回归,进行预测2、由简单线性回归的预测,做残差分析,发现预测效果不佳3、以crim为响应变量,其余变量为预测变量,做多元线性回归。4、发现多元线性回归预测效果不佳,进行多元回归分析,不断改变归回模型,最终得到最佳回归模型。,下面是具体操作过程:首先我们画出Boston的散点图矩阵,大致观察图像,之后我们以其中的zn对crim的线性回归为例,向您展示我们的造作过程,首先,我们拟合了zn与crim之间的线性关系,得到相关结果如下:lm.fit0=lm(crimzn,data=Boston1)summary(lm.fit0)Call:lm(formula = crim zn, data = Boston1)Residuals: Min 1Q Median 3Q Max -2.811 -2.652 -1.755 -0.360 86.141 Coefficients: Estimate Std. Error t value Pr(|t|) (Intercept) 2.83564 0.40955 6.924 1.74e-11 *zn -0.04657 0.01415 -3.291 0.00109 * -Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1Residual standard error: 7.197 on 404 degrees of freedomMultiple R-squared: 0.02611,Adjusted R-squared: 0.0237 F-statistic: 10.83 on 1 and 404 DF, p-value: 0.001086发现p值小于0.01,我们有理由认为zn和crim之间存在关联,之后,画出zn对crim的散点图与拟合曲线,我们发现,拟合效果不佳。plot(Boston$zn,Boston$crim) abline(lm.fit0),之后我们又画出真实值和拟合值的残差图,看预测准确度如何,横坐标是测试集的crim预测值,纵坐标是预测值和真实值的残差注:在拟合时,我们用前406个观测当作训练集,后100个观测当作测试集preb=predict(lm.fit0,data.frame(zn=(c(Boston407:506,2),interval=confidence) plot(Boston407:506,1-preb,1)2preb,1),我们发现预测效果十分不好,事实上,所有简单线性回归的预测效果均不是很好,下面我们给出具体操作数据与图像。,下面是各简单线性回归的p值:从中可以看出,和crim有(0.01)线性关系的预测变量有:zn,indus,nox,rm,age,dis,rad,tax,ptratio,black,各简单线性回归的散点图与拟合曲线如下:,各简单线性回归残差图如下:,从中可以看出,预测情况较好的变量有:nox,rm,age,dis,black,lstat,medv,鉴于简单线性回归给出的预测均不好,下面我们对变量进行多元回归分析。,首先直接对其进行多元回归,生成诊断图并分析问题。lm.fit13=lm(crim.,data=Boston1)par(mfrow=c(2,2)plot(lm.fit13),注:图一和图三都用于检查数据的非线性。图一是残差和预测变量的散点图,红线是对残差的一个光滑拟合,目的是更易于识别趋势,残差呈现明显大的U形,说明响应变量和预测变量之间是非线性关系。图三是标准化残差的平方根和预测变量的散点图。拟合红线和图一呈现相近的趋势,说明数据存在异方差性,因此数据有非线性关系。图二用于观察残差是否服从正态分布,是残差平方根和理论分位点的散点图,很显然残差不服从正态分布。图四用于判断高杠杆点:是标准化残差和杠杆值的散点图,红线表示的是cooks距离等高线,我们发现381号样本有较大的影响。(Cooks distance衡量的是一个某样本的改变会使得所有样本的残差改变的幅度,该值越大,说明该样本异常),为使回归模型预测效果更好,我们通过对预测变量做非线性变换来改进模型我们分别作了对数变换、平方变换和开方变换发现对数变换预测性最好,最优拟合是lm.fit13,对应的是多元回归拟合,这个答案是合理的,lmfit13对训练集的数据拟合程度最高,也就导致了它预测性不会比做了非线性变换之后的回归好.具体操作如下:,多元线性:,参数显著性:,残差图:,对数变换,参数显著性,残差图,平方变换,参数显著性,残差图,开方变换,参数显著性,残差图,

    注意事项

    本文(对Boston数据集的分析统计机器学习期中考试ppt课件.pptx)为本站会员(小飞机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开