欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    简单线性回归模型的统计检验.ppt

    • 资源ID:5297235       资源大小:419KB        全文页数:52页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    简单线性回归模型的统计检验.ppt

    第三节 拟合优度的度量,1、拟合优度检验,拟合优度检验:对样本回归直线与样本观测值之间拟合程度的检验。度量拟合优度的指标:判定系数(可决系数)R2,问题:采用普通最小二乘估计方法,已经保证了模型最好地拟合了样本观测值,为什么还要检验拟合程度?,2、总离差平方和的分解,已知由一组样本观测值(Xi,Yi),i=1,2,n得到如下样本回归直线,如果Yi=i 即实际观测值落在样本回归“线”上,则拟合最好。可以认为,“离差”全部来自回归线,而与“残差”无关。,对于所有样本点,则需考虑这些点与样本均值离差的平方和,可以证明:,记,总体平方和(Total Sum of Squares),回归平方和(Explained Sum of Squares),残差平方和(Residual Sum of Squares),TSS=ESS+RSS,Y的观测值围绕其均值的总离差(total variation)可分解为两部分:一部分来自回归线(ESS),另一部分则来自随机势力(RSS)。,在给定样本中,TSS不变,如果实际观测点离样本回归线越近,则ESS在TSS中占的比重越大,因此 拟合优度:回归平方和ESS/Y的总离差TSS,3、可决系数R2统计量,称 R2 为(样本)可决系数/判定系数(coefficient of determination)。,可决系数的取值范围:0,1 R2越接近1,说明实际观测点离样本线越近,拟合优度越高,模型的解释程度越高。,在例2.2收入-消费支出例中,,注:可决系数是一个非负的统计量。它也是随着抽样的不同而不同。为此,对可决系数的统计可靠性也应进行检验,这将在第3章中进行。,第四节 回归系数的区间估计和假设检验,一、OLS估计的分布性质二、回归系数的区间估计三、回归系数的假设检验,是关于样本观测值Yi的线性函数,因为 是关于Y 的线性函数,而Y是关于随机扰动项 ui的线性函数,所以 也是ui的线性函数,且服从正态分布,一、OLS估计的分布性质,(2)在小样本情况下,若用无偏估计 代替 去估计标准误差,则进行标准变化的统计量不再服从正态分布,而是服从自由度为n-2的t分布,假设检验可以通过一次抽样的结果检验总体参数可能的假设值的范围(如是否为零),但它并没有指出在一次抽样中样本参数值到底离总体参数的真值有多“近”。要判断样本参数的估计值在多大程度上可以“近似”地替代总体参数的真值,往往需要通过构造一个以样本参数的估计值为中心的“区间”,来考察它以多大的可能性(概率)包含着真实的参数值。这种方法就是参数检验的置信区间估计。,二、回归系数的区间估计,如果存在这样一个区间,称之为置信区间(confidence interval);1-称为置信系数(置信度)(confidence coefficient),称为显著性水平(level of significance);置信区间的端点称为置信限(confidence limit)或临界值(critical values)。,t分布,假如,接受域,拒绝域,拒绝域,0,举例:一元线性模型中,i(i=1,2)的置信区间:,在变量的显著性检验中已经知道:,意味着,如果给定置信度(1-),从分布表中查得自由度为(n-2)的临界值,那么t值处在(-t/2,t/2)的概率是(1-)。表示为:,即,于是得到:(1-)的置信度下,i的置信区间是,在上述收入-消费支出例中,如果给定=0.05,查表得:,由于,于是,1、2的置信区间分别为:(175.40,528.59)(0.4803,0.5797),Xi,Yi,得,在显著性水平 下,临界值为,则 的估计区间是,回归系数的区间估计:3种情况(1)的方差 已知,与 的区间估计。由,(2)的方差 未知,大样本下 与 的区间估计在大样本下,用 代替,仍可利用正态分布作区间估计,此时 的区间估计分别为:,(3)的方差 未知,在小样本下,与 的区间估计。在小样本下:,在显著性水平下,临界值为,则 的区间估计分别为:,三、回归系数的假设检验,回归分析是要判断解释变量X是否是被解释变量Y的一个显著性的影响因素。在一元线性模型中,就是要判断X是否对Y具有显著的线性性影响。这就需要进行变量的显著性检验。,变量的显著性检验所应用的方法是数理统计学中的假设检验。计量经计学中,主要是针对变量的参数真值是否为零来进行显著性检验的。,1、什么是假设检验,所谓假设检验,就是事先对总体参数或总体分布形式作出一个假设,然后利用样本信息来判断原假设是否合理,即判断样本信息与原假设是否有显著差异,从而决定是否接受或否定原假设。假设检验采用的逻辑推理方法是反证法。先假定原假设正确,然后根据样本信息,观察由此假设而导致的结果是否合理,利用适当的符合某种概率分布的统计量和给定的显著性水平,构造一个小概率事件,如果小概率事件发生,说明原假设不正确,就拒绝原假设。,假设检验的过程(提出假设抽取样本作出决策),2、变量的显著性检验:t检验,为了解释回归模型中解释变量对被解释变量是否有显著影响,在计量检验中通常把回归系数 作为原假设,检验原假设是否成立。,检验步骤:,(1)对总体参数提出假设 H0:1=0,H1:10,(2)以原假设H0构造t统计量,并由样本计算其值,(3)给定显著性水平,查t分布表,得临界值t/2(n-2),(4)比较,判断 若|t|t/2(n-2),则拒绝H0,接受H1;若|t|t/2(n-2),则拒绝H1,接受H0;,t分布,0,接受原假设H0,拒绝原假设H0,假如,接受域,拒绝域,拒绝域,临界点,临界点,小概率事件,小概率事件,举例:对于回归方程 中的1,可构造如下t统计量进行显著性检验:,在上述例2收入-消费支出例中,首先计算2的估计值,t统计量的计算结果分别为:,给定显著性水平=0.05,查t分布表得临界值 t 0.05/2(8)=2.306|t1|2.306,就拒绝原假设,说明家庭可支配收入对消费支出的影响确实是显著的;|t2|2.306,表明在95%的置信度下,拒绝截距项为零(H0:2=0)的原假设,t统计量25.52临界值2.306,就拒绝原假设,说明家庭消费支出对家庭可支配收入的回归系数是显著的,案例分析:中国城市居民消费支出,第五节 回归模型预测,第五节 回归模型预测1、对Y0平均值的点预测,总体回归函数,当人均收入Xi=8000时,人均消费,2、对Y0平均值预测的置信区间,由于,于是,回归分析表解释:,其中,于是,在1-的置信度下,总体均值E(Y|X0)的置信区间为,3、对Y0总体个值的预测区间,由 Y0=0+1X0+知:,于是,式中:,从而在1-的置信度下,Y0的置信区间为,在收入-消费支出例中,得到的样本回归函数为,则在 X0=1000处,0=103.172+0.7771000=673.84,而,因此,总体均值E(Y|X=1000)的95%的置信区间为:61.05 E(Y|X=1000)673.84+2.30661.05 或(533.05,814.62),同样地,对于Y在X=1000的个体值,其95%的置信区间为:673.84-2.306130.87Yx=1000 673.84+2.306130.87或(372.03,975.65),总体回归函数的置信带(域)(confidence band)个体的置信带(域),对于Y的总体均值E(Y|X)与个体值的预测区间(置信区间):,(1)样本容量n越大,预测精度越高,反之预测精度越低;(2)样本容量一定时,置信带的宽度当在X均值处最小,其附近进行预测(插值预测)精度越大;X越远离其均值,置信带越宽,预测可信度下降。,eviews应用软件中的广义差分法,在Eview/TSP软件包下,广义差分采用了科克伦-奥科特(Cochrane-Orcutt)迭代法估计。在解释变量中引入AR(1)、AR(2)、,即可得到参数和1、2、的估计值。其中AR(m)表示随机误差项的m阶自回归。在估计过程中自动完成了1、2、的迭代。,案例2:用回归模型预测木材剩余物,伊春林区位于黑龙江省东北部。全区有森林面积218.9732万公顷,木材蓄积量为2.324602亿m3。森林覆盖率为62.5%,是我国主要的木材工业基地之一。1999年伊春林区木材采伐量为532万m3。按此速度44年之后,1999年的蓄积量将被采伐一空。所以目前亟待调整木材采伐规划与方式,保护森林生态环境。为缓解森林资源危机,并解决部分职工就业问题,除了做好木材的深加工外,还要充分利用木材剩余物生产林业产品,如纸浆、纸袋、纸板等。因此预测林区的年木材剩余物是安排木材剩余物加工生产的一个关键环节。下面,利用一元线性回归模型预测林区每年的木材剩余物。显然引起木材剩余物变化的关键因素是年木材采伐量。,

    注意事项

    本文(简单线性回归模型的统计检验.ppt)为本站会员(小飞机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开