欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    【教学课件】第8章相关和回归分析.ppt

    • 资源ID:5659531       资源大小:297.50KB        全文页数:51页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    【教学课件】第8章相关和回归分析.ppt

    第8章 相关和回归分析,学习目标 7.1 相关与回归分析的基本概念 7.2 一元线性回归分析 7.3多元线性回归分析 7.4 非线性回归 7.5 相关分析,学习重点,1.相关系数的分析方法2.一元线性回归的基本原理和参数的最小二乘估计3.回归直线的拟合优度4.回归方程的显著性检验5.利用回归方程进行估计和预测,7.1 相关与回归分析的基本概念,函数关系,是一一对应的确定关系设有两个变量 x 和 y,变量 y 随变量 x 一起变化,并完全依赖于 x,当变量 x 取某个数值时,y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y=f(x),其中 x 称为自变量,y 称为因变量各观测点落在一条线上,函数关系(几个例子),函数关系的例子某种商品的销售额y与销售量x之间的关系可表示为 y=px(p 为单价)圆的面积S与半径之间的关系可表示为S=R2 企业的原材料消耗额y与产量x1、单位产量消耗x2、原材料价格x3之间的关系可表示为 y=x1 x2 x3,相关关系(correlation),变量间关系不能用函数关系精确表达2.一个变量的取值不能由另一个变量唯一确定3.当变量 x 取某个值时,变量 y 的取值可能有几个4.各观测点分布在直线周围,相关关系(几个例子),相关关系的例子父亲身高y与子女身高x之间的关系收入水平y与受教育程度x之间的关系粮食亩产量y与施肥量x1、降雨量x2、温度x3之间的关系商品的消费量y与居民收入x之间的关系商品销售额y与广告费支出x之间的关系,相关关系(类型),按相关程度划分:完全相关、不完全相关和不相关按相关方向划分:正相关和负相关按相关形式划分:线性相关和非线性相关按变量多少划分 单相关、复相关和偏相关按相关性质划分 真实相关和虚假相关,7.2 一元线性回归,7.2.1 标准的一元线性回归模型 一元线性回归模型的估计 一元线性回归模型的检验 一元线性回归模型的预测,一元线性回归模型,描述因变量 y 如何依赖于自变量 x 和误差项 的方程称为回归模型一元线性回归模型可表示为 y=b0+b1 x+ey 是 x 的线性函数(部分)加上误差项线性部分反映了由于 x 的变化而引起的 y 的变化误差项 是随机变量反映了除 x 和 y 之间的线性关系之外的随机因素对 y 的影响是不能由 x 和 y 之间的线性关系所解释的变异性0 和 1 称为模型的参数,一元线性回归模型(基本假定),误差项的期望值为0,即E()=0。对于一个给定的 x 值,y 的期望值为E(y)=0+1 x对于所有的 x 值,误差项之间不存在序列相关关系,即 自变量是给定的变量,与随机误差项线性无关随机误差项服从正态分布,即 N(0,2),总体回归函数,描述 y 的平均值或期望值如何依赖于 x 的方程称为总体回归函数总体回归函数的数学形式如下 E(y)=0+1 x,函数的图示是一条直线,也称为总体回归直线0是回归直线在 y 轴上的截距,是当 x=0 时 y 的期望值1是直线的斜率,称为回归系数,表示当 x 每变动一个单位时,y 的平均变动值,样本回归函数(估计方程),总体回归参数 和 是未知的,必须利用样本数据去估计,用样本统计量 和 代替回归方程中的未知参数 和,就得到了估计的回归方程,3.一元线性回归中估计的回归方程为,其中:是估计的回归直线在 y 轴上的截距,是直线的斜率,它表示对于一个给定的 x 的值,是 y 的估计值,也表示 x 每变动一个单位时,y 的平均变动值,一元线性回归模型的估计,使因变量的观察值与估计值之间的离差平方和达到最小来求得 和 的方法。即,用最小二乘法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线都小,最小二乘法(和 的计算公式),根据最小二乘法的要求,可得求解 和 的公式如下,估计方程的求法(例题分析),【例7-1】估计食品支出的恩格尔函数,回归方程为:y=9.9872+0.1802 x回归系数=0.1802 表示,收入每增加1亿元,食品支出平均增加0.1802亿元,估计标准误差(standard error of estimate),实际观察值与回归估计值离差平方和的均方根反映实际观察值在回归直线周围的分散状况对误差项的标准差的估计,是在排除了x对y的线性影响后,y随机波动大小的一个估计量反映用估计的回归方程预测y时预测误差的大小 计算公式为,注:例题的计算结果为1.8286,一元线性回归模型的检验,离差,因变量 y 的取值是不同的,y 取值的这种波动称为变差。变差来源于两个方面由于自变量 x 的取值不同造成的除 x 以外的其他因素(如x对y的非线性影响、测量误差等)的影响对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值之差 来表示,离差的分解(图示),离差平方和的分解(三个平方和的关系),离差平方和的分解(三个平方和的意义),总平方和(SST)反映因变量的 n 个观察值与其均值的总离差回归平方和(SSR)反映自变量 x 的变化对因变量 y 取值变化的影响,或者说,是由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和残差平方和(SSE)反映除 x 以外的其他因素对 y 取值的影响,也称为不可解释的平方和或剩余平方和,可决系数r2,回归平方和占总离差平方和的比例,反映回归直线的拟合程度取值范围在 0,1 之间 R2 1,说明回归方程拟合的越好;R20,说明回归方程拟合的越差判定系数等于相关系数的平方,即R2r2,可决系数r2(例题分析),【例7-2】计算估计食品支出的恩格尔函数回归的可决系数,并解释其意义 可决系数的实际意义是:在食品支出取值的变差中,有88.63%可以由食品支出与家庭收入之间的线性关系来解释,或者说,在食品支出取值的变动中,有88.63%是家庭收入所决定的。可见食品支出与家庭收入之间有较强的线性关系,一元线性回归模型的检验,检验 x 与 y 之间是否具有线性关系,或者说,检验自变量 x 对因变量 y 的影响是否显著,理论基础是回归系数 的抽样分布,在一元线性回归中,等价于线性关系的显著性检验,回归系数的检验(样本统计量 的分布),是根据最小二乘法求出的样本统计量,它有自己的分布 的分布具有如下性质分布形式:正态分布数学期望:标准差:由于 未知,需用其估计量sy来代替得到 的估计的标准差,回归系数的检验(检验步骤),提出假设H0:b1=0(没有线性关系)H1:b1 0(有线性关系)计算检验的统计量,确定显著性水平,并进行决策 tt,拒绝H0;tt,不拒绝H0,回归系数的检验(例题分析),对例题的回归系数进行显著性检验(0.05)提出假设H0:b1=0 H1:b1 0 计算检验的统计量,t=10.07t=2.160,拒绝H0,表明食品支出与家庭收入之间有线性关系,一元线性回归模型的预测,根据自变量 x 的取值估计或预测因变量 y的取值估计或预测的类型点估计y 的个别值的点估计(或预测)区间估计y 的个别值的预测区间估计,y 的个别值的点预测,利用估计的回归方程,对于自变量 x 的一个给定值 x0,求出因变量 y 的一个个别值的估计值,就是个别值的点估计例如,如果我们只是想知道家庭收入为200元的那些家庭的食品支出是多少,则属于个别值的点估计。根据估计的回归方程得,区间预测,点估计不能给出估计的精度,点估计值与实际值之间是有误差的,因此需要进行区间估计对于自变量 x 的一个给定值 x0,根据回归方程得到因变量 y 的一个估计区间本课程讨论的区间估计类型预测区间估计(prediction interval estimate),预测区间估计,利用估计的回归方程,对于自变量 x 的一个给定值 x0,求出因变量 y 的一个个别值的估计区间,这一区间称为预测区间(prediction interval)y0在1-置信水平下的预测区间为,影响区间宽度的因素,置信水平(1-)区间宽度随置信水平的增大而增大数据的离散程度s区间宽度随离散程度的增大而增大3.样本容量区间宽度随样本容量的增大而减小4.用于预测的 xp与x的差异程度区间宽度随 xp与x 的差异程度的增大而增大,置信区间、预测区间、回归方程,7.3多元线性回归分析,多元线性回归模型 7.3.2 多元线性回归模型 的估计7.3.3 多元线性回归模型 的检验和预测,多元回归模型,一个因变量与两个及两个以上自变量的回归描述因变量 y 如何依赖于自变量 x1,x2,xk 和误差项 的方程,称为多元回归模型涉及 p 个自变量的多元回归模型可表示为,b0,b1,b2,bk是参数 是被称为误差项的随机变量 y 是x1,,x2,xk 的线性函数加上误差项 包含在y里面但不能被k个自变量的线性关系所解释的变异性,多元回归模型(基本假定),误差项是一个期望值为0的随机变量,即E()=0对于自变量x1,x2,xp的所有值,的方差 2都相同误差项是一个服从正态分布的随机变量,即N(0,2),且相互独立,多元样本回归函数(方程),用样本统计量 估计回归方程中的 参数 时得到的方程由最小二乘法求得一般形式为,是 估计值 是 y 的估计值,7.3.2 多元线性回归模型 的估计,使因变量的观察值与估计值之间的离差平方和达到最小来求得。即,求解各回归参数的标准方程如下,7.3.3 多元线性回归模型 的检验和预测,回归方程的拟合优度,回归平方和占总平方和的比例计算公式为3.因变量取值的变差中,能被估计的多元回归方程所解释的比例,修正多重可决系数,用样本容量n和自变量的个数p去修正R2得到 计算公式为避免增加自变量而高估 R2意义与 R2类似数值小于R2,显著性检验(回归系数的检验),提出假设H0:bi=0(自变量 xi 与 因变量 y 没有线性关系)H1:bi 0(自变量 xi 与 因变量 y有线性关系)计算检验的统计量 t,确定显著性水平,并进行决策 tt,拒绝H0;tt,不拒绝H0,显著性检验(回归方程的显著性检验),提出假设H0:12p=0 线性关系不显著H1:1,2,p至少有一个不等于0,2.计算检验统计量F,确定显著性水平和分子自由度p、分母自由度n-p-1找出临界值F 4.作出决策:若FF,拒绝H0,7.4 非线性回归,1.因变量 y 与 x 之间不是线性关系2.可通过变量代换转换成线性关系用最小二乘法求出参数的估计值并非所有的非线性模型都可以化为线性模型,双曲线,基本形式:线性化方法令:y=1/y,x=1/x,则有y=+x,指数曲线,基本形式:线性化方法两端取对数得:lny=ln+x令:y=lny,则有y=ln+x,S 型曲线,基本形式:线性化方法令:y=1/y,x=e-x,则有y=+x,7.5 相关分析,相关系数(correlation coefficient),对变量之间关系密切程度的度量对两个变量之间线性相关程度的度量称为简单相关系数若相关系数是根据总体全部数据计算的,称为总体相关系数,记为若是根据样本数据计算的,则称为样本相关系数,记为 r,相关系数(计算公式),样本相关系数的计算公式,或化简为,相关系数(取值及其意义),r 的取值范围是-1,1|r|=1,为完全相关r=1,为完全正相关r=-1,为完全负正相关 r=0,不存在线性相关关系-1r0,为负相关 0r1,为正相关|r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切,相关系数的显著性检验(r 的抽样分布),1.r 的抽样分布随总体相关系数和样本容量的大小而变化当样本数据来自正态总体时,随着n的增大,r 的抽样分布趋于正态分布,尤其是在总体相关系数很小或接近0时,趋于正态分布的趋势非常明显。而当远离0时,除非n非常大,否则r的抽样分布呈现一定的偏态。当为较大的正值时,r 呈现左偏分布;当为较小的负值时,r 呈现右偏分布。只有当接近于0,而样本容量n很大时,才能认为r是接近于正态分布的随机变量,相关系数的显著性检验(检验的步骤),1.检验两个变量之间是否存在线性相关关系等价于对回归系数 b1的检验采用提出的 t 检验检验的步骤为提出假设:H0:;H1:0,计算检验的统计量:,确定显著性水平,并作出决策 若tt,拒绝H0 若tt,不能拒绝H0,End of Chapter 7,休息片刻!,

    注意事项

    本文(【教学课件】第8章相关和回归分析.ppt)为本站会员(牧羊曲112)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开