【教学课件】第8章相关和回归分析.ppt
《【教学课件】第8章相关和回归分析.ppt》由会员分享,可在线阅读,更多相关《【教学课件】第8章相关和回归分析.ppt(51页珍藏版)》请在三一办公上搜索。
1、第8章 相关和回归分析,学习目标 7.1 相关与回归分析的基本概念 7.2 一元线性回归分析 7.3多元线性回归分析 7.4 非线性回归 7.5 相关分析,学习重点,1.相关系数的分析方法2.一元线性回归的基本原理和参数的最小二乘估计3.回归直线的拟合优度4.回归方程的显著性检验5.利用回归方程进行估计和预测,7.1 相关与回归分析的基本概念,函数关系,是一一对应的确定关系设有两个变量 x 和 y,变量 y 随变量 x 一起变化,并完全依赖于 x,当变量 x 取某个数值时,y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y=f(x),其中 x 称为自变量,y 称为因变量各观测点落在
2、一条线上,函数关系(几个例子),函数关系的例子某种商品的销售额y与销售量x之间的关系可表示为 y=px(p 为单价)圆的面积S与半径之间的关系可表示为S=R2 企业的原材料消耗额y与产量x1、单位产量消耗x2、原材料价格x3之间的关系可表示为 y=x1 x2 x3,相关关系(correlation),变量间关系不能用函数关系精确表达2.一个变量的取值不能由另一个变量唯一确定3.当变量 x 取某个值时,变量 y 的取值可能有几个4.各观测点分布在直线周围,相关关系(几个例子),相关关系的例子父亲身高y与子女身高x之间的关系收入水平y与受教育程度x之间的关系粮食亩产量y与施肥量x1、降雨量x2、温
3、度x3之间的关系商品的消费量y与居民收入x之间的关系商品销售额y与广告费支出x之间的关系,相关关系(类型),按相关程度划分:完全相关、不完全相关和不相关按相关方向划分:正相关和负相关按相关形式划分:线性相关和非线性相关按变量多少划分 单相关、复相关和偏相关按相关性质划分 真实相关和虚假相关,7.2 一元线性回归,7.2.1 标准的一元线性回归模型 一元线性回归模型的估计 一元线性回归模型的检验 一元线性回归模型的预测,一元线性回归模型,描述因变量 y 如何依赖于自变量 x 和误差项 的方程称为回归模型一元线性回归模型可表示为 y=b0+b1 x+ey 是 x 的线性函数(部分)加上误差项线性部
4、分反映了由于 x 的变化而引起的 y 的变化误差项 是随机变量反映了除 x 和 y 之间的线性关系之外的随机因素对 y 的影响是不能由 x 和 y 之间的线性关系所解释的变异性0 和 1 称为模型的参数,一元线性回归模型(基本假定),误差项的期望值为0,即E()=0。对于一个给定的 x 值,y 的期望值为E(y)=0+1 x对于所有的 x 值,误差项之间不存在序列相关关系,即 自变量是给定的变量,与随机误差项线性无关随机误差项服从正态分布,即 N(0,2),总体回归函数,描述 y 的平均值或期望值如何依赖于 x 的方程称为总体回归函数总体回归函数的数学形式如下 E(y)=0+1 x,函数的图示
5、是一条直线,也称为总体回归直线0是回归直线在 y 轴上的截距,是当 x=0 时 y 的期望值1是直线的斜率,称为回归系数,表示当 x 每变动一个单位时,y 的平均变动值,样本回归函数(估计方程),总体回归参数 和 是未知的,必须利用样本数据去估计,用样本统计量 和 代替回归方程中的未知参数 和,就得到了估计的回归方程,3.一元线性回归中估计的回归方程为,其中:是估计的回归直线在 y 轴上的截距,是直线的斜率,它表示对于一个给定的 x 的值,是 y 的估计值,也表示 x 每变动一个单位时,y 的平均变动值,一元线性回归模型的估计,使因变量的观察值与估计值之间的离差平方和达到最小来求得 和 的方法
6、。即,用最小二乘法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线都小,最小二乘法(和 的计算公式),根据最小二乘法的要求,可得求解 和 的公式如下,估计方程的求法(例题分析),【例7-1】估计食品支出的恩格尔函数,回归方程为:y=9.9872+0.1802 x回归系数=0.1802 表示,收入每增加1亿元,食品支出平均增加0.1802亿元,估计标准误差(standard error of estimate),实际观察值与回归估计值离差平方和的均方根反映实际观察值在回归直线周围的分散状况对误差项的标准差的估计,是在排除了x对y的线性影响后,y随机波动大小的一个估计量反映用估计的回
7、归方程预测y时预测误差的大小 计算公式为,注:例题的计算结果为1.8286,一元线性回归模型的检验,离差,因变量 y 的取值是不同的,y 取值的这种波动称为变差。变差来源于两个方面由于自变量 x 的取值不同造成的除 x 以外的其他因素(如x对y的非线性影响、测量误差等)的影响对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值之差 来表示,离差的分解(图示),离差平方和的分解(三个平方和的关系),离差平方和的分解(三个平方和的意义),总平方和(SST)反映因变量的 n 个观察值与其均值的总离差回归平方和(SSR)反映自变量 x 的变化对因变量 y 取值变化的影响,或者说,是由于 x
8、与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和残差平方和(SSE)反映除 x 以外的其他因素对 y 取值的影响,也称为不可解释的平方和或剩余平方和,可决系数r2,回归平方和占总离差平方和的比例,反映回归直线的拟合程度取值范围在 0,1 之间 R2 1,说明回归方程拟合的越好;R20,说明回归方程拟合的越差判定系数等于相关系数的平方,即R2r2,可决系数r2(例题分析),【例7-2】计算估计食品支出的恩格尔函数回归的可决系数,并解释其意义 可决系数的实际意义是:在食品支出取值的变差中,有88.63%可以由食品支出与家庭收入之间的线性关系来解释,或者说,在食品支出取值的变动中,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教学课件 教学 课件 相关 回归 分析

链接地址:https://www.31ppt.com/p-5659531.html