(第2课时)11回归分析的基本思想及其初步应用ppt课件.ppt
《(第2课时)11回归分析的基本思想及其初步应用ppt课件.ppt》由会员分享,可在线阅读,更多相关《(第2课时)11回归分析的基本思想及其初步应用ppt课件.ppt(25页珍藏版)》请在三一办公上搜索。
1、第一章 统计案例,1.1回归分析的基本思想,(2),例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。,求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重。,案例1:女大学生的身高与体重,解:1、选取身高为自变量x,体重为因变量y,作散点图:,2、由散点图知道身高和体重有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系。,3、从散点图还看到,样本点散布在某一条直线的附近,而不是在一条直线上,所以不能用一次函数y=bx+a描述它们关系。,我们可以用下面的线性回归模型来表示:y=bx+a+e,其中a和b为模型的未知参数,e称
2、为随机误差。,根据最小二乘法估计 和 就是未知参数a和b的最好估计,,于是有b=,所以回归方程是,所以,对于身高为172cm的女大学生,由回归方程可以预报其体重为,探究:身高为172cm的女大学生的体重一定是60.316kg吗?如果不是,你能解析一下原因吗?,函数模型与回归模型之间的差别,函数模型:,回归模型:,线性回归模型y=bx+a+e增加了随机误差项e,因变量y的值由自变量x和随机误差项e共同确定,即自变量x只能解析部分y的变化。,在统计中,我们也把自变量x称为解析变量,因变量y称为预报变量。,思考产生随机误差项e的原因是什么?,随机误差e的来源(可以推广到一般):1、其它因素的影响:影
3、响身高 y 的因素不只是体重 x,可能 还包括遗传基因、饮食习惯、生长环境等因素;2、用线性回归模型近似真实模型所引起的误差;3、身高 y 的观测误差。,探究,在线性回归模型中, e是用 预报真 实值y的误差,它是一个不可观测 的量,那么应该怎么样研究随机 误差?如何衡量预报的精度?,对回归模型进行统计检验,思考:如何刻画预报变量(体重)的变化?这个变化在多大程度上与解析变量(身高)有关?在多大程度上与随机误差有关?,假设身高和随机误差的不同不会对体重产生任何影响,那么所有人的体重将相同。在体重不受任何变量影响的假设下,设8名女大学生的体重都是她们的平均值,即8个人的体重都为54.5kg。,在
4、散点图中,所有的点应该落在同一条水平直线上,但是观测到的数据并非如此。这就意味着预报变量(体重)的值受解析变量(身高)或随机误差的影响。,例如,编号为6的女大学生的体重并没有落在水平直线上,她的体重为61kg。解析变量(身高)和随机误差共同把这名学生的体重从54.5kg“推”到了61kg,相差6.5kg,所以6.5kg是解析变量和随机误差的组合效应。,编号为3的女大学生的体重并也没有落在水平直线上,她的体重为50kg。解析变量(身高)和随机误差共同把这名学生的体重从50kg“推”到了54.5kg,相差-4.5kg,这时解析变量和随机误差的组合效应为-4.5kg。,用这种方法可以对所有预报变量计
5、算组合效应。,在例1中,总偏差平方和为354。,那么,在这个总的效应(总偏差平方和)中,有多少来自于解析变量(身高)?有多少来自于随机误差?,假设随机误差对体重没有影响,也就是说,体重仅受身高的影响,那么散点图中所有的点将完全落在回归直线上。但是,在图中,数据点并没有完全落在回归直线上。这些点散布在回归直线附近,所以一定是随机误差把这些点从回归直线上“推”开了。,在例1中,残差平方和约为128.361。,例如,编号为6的女大学生,计算随机误差的效应(残差)为:,由于解析变量和随机误差的总效应(总偏差平方和)为354,而随机误差的效应为128.361,所以解析变量的效应为,解析变量和随机误差的总
6、效应(总偏差平方和) =解析变量的效应(回归平方和)+随机误差的效应(残差平方和),离差平方和的分解 (三个平方和的意义),总偏差平方和(SST)反映因变量的 n 个观察值与其均值的总离差回归平方和(SSR)反映自变量 x 的变化对因变量 y 取值变化的影响,或者说,是由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和残差平方和(SSE)反映除 x 以外的其他因素对 y 取值的影响,也称为不可解释的平方和或剩余平方和,显然,R2的值越大,说明残差平方和越小,也就是说模型拟合效果越好。,在线性回归模型中,R2表示解析变量对预报变量变化的贡献率。,R2越接近1,表示回归的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 课时 11 回归 分析 基本 思想 及其 初步 应用 ppt 课件

链接地址:https://www.31ppt.com/p-1371464.html