欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    第6章回归分析ppt课件.ppt

    • 资源ID:1354400       资源大小:1.50MB        全文页数:114页
    • 资源格式: PPT        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第6章回归分析ppt课件.ppt

    2022/11/13,统计学第3章参数估计,6-1,统计学,费宇,石磊 主编高等教育出版社,2022/11/13,统计学第3章参数估计,6-2,第6章 回归分析,6.1 相关分析6.2 一元线性回归6.3 多元线性回归6.4 虚拟变量回归6.5 Logistic回归6.6 回归分析的扩展6.7 可化为线性情形的非线性回归,2022/11/13,统计学第3章参数估计,6-3,【引例6.0】,(数据文件为example 6.0)某公司经理想研究公司员工的年薪问题,根据初步分析,他认为员工的当前年薪y(元)与员工的开始年薪x1(元)、在公司的工作时间x2(月)、先前的工作经验x3(月)和受教育年限x4(年)有关系,他随机抽样调查了36个员工,收集到以下数据:,2022/11/13,统计学第3章参数估计,6-4,2022/11/13,统计学第3章参数估计,6-5,问题,经理想根据以上样本数据,构建一个模型来反映y与x1、x2、x3和x4之间关系,并希望利用该模型在给定一个员工的x2、x3和x4的条件下,预测该员工的当前年薪y。此外,经理认为,公司男女员工的薪水结构不同,他想在建立模型的时候能把性别因素考虑进来,这是否可行?,2022/11/13,统计学第3章参数估计,6-6,6.1 相关分析,6.1.1 相关的概念 1. 人的身高与体重有相关关系。2. 居民可支配收入与支出有相关关系。3. 粮食产量与施肥量有相关关系。,2022/11/13,统计学第3章参数估计,6-7,6.1.2 相关的种类,1. 按相关程度划分: 分为完全相关、不完全相关和不相关;如图6.1所示。2. 按相关方向划分: 分为正相关和负相关。如图6.2所示。3. 按相关形式划分: 分为线性相关和非线性相关;如图6.3所示 。 4. 按变量多少划分: 分为简单相关和复相关。,2022/11/13,统计学第3章参数估计,6-8,6.1.3 相关关系的度量,1. 简单线性相关系数,2022/11/13,统计学第3章参数估计,6-9,2022/11/13,统计学第3章参数估计,6-10,2022/11/13,统计学第3章参数估计,6-11,2. 偏相关系数,2022/11/13,统计学第3章参数估计,6-12,【例6.1】,2022/11/13,统计学第3章参数估计,6-13,2022/11/13,统计学第3章参数估计,6-14,2022/11/13,统计学第3章参数估计,6-15,6.2 一元线性回归,6.2.1 回归的含义回归(regression)一词最早由英国生物学家兼统计学家高尔顿(F.Galton)于1886年在论文“Regression towards mediocrity in hereditary stature”中正式提出。回归分析(regression analysis)是通过建立回归模型来研究相关变量的关系并作出相应估计和预测的一种统计方法,,2022/11/13,统计学第3章参数估计,6-16,6.2.2 一元线性回归,2022/11/13,统计学第3章参数估计,6-17,2022/11/13,统计学第3章参数估计,6-18,6.2.3 最小二乘估计,图6.4 x和y的散点图,2022/11/13,统计学第3章参数估计,6-19,2022/11/13,统计学第3章参数估计,6-20,2022/11/13,统计学第3章参数估计,6-21,2022/11/13,统计学第3章参数估计,6-22,2022/11/13,统计学第3章参数估计,6-23,2022/11/13,统计学第3章参数估计,6-24,【例6.2】,(数据文件为example 6.2) 已知我国2007年31个地区城镇居民年人均可支配收入和年人均消费性支出数据如下表(单位:元),试分析城镇居民年人均可支配收入和年人均消费性支出之间的关系,如果有线性相关关系,试建立一元线性回归模型。,2022/11/13,统计学第3章参数估计,6-25,2022/11/13,统计学第3章参数估计,6-26,图6.5人均可支配收入x和人均消费性支出y散点图,2022/11/13,统计学第3章参数估计,6-27,2022/11/13,统计学第3章参数估计,6-28,2022/11/13,统计学第3章参数估计,6-29,2022/11/13,统计学第3章参数估计,6-30,6.2.4 回归方程的检验,2022/11/13,统计学第3章参数估计,6-31,1. F检验,2022/11/13,统计学第3章参数估计,6-32,2022/11/13,统计学第3章参数估计,6-33,2022/11/13,统计学第3章参数估计,6-34,2022/11/13,统计学第3章参数估计,6-35,2. t检验,2022/11/13,统计学第3章参数估计,6-36,3.r检验,2022/11/13,统计学第3章参数估计,6-37,2022/11/13,统计学第3章参数估计,6-38,【例6.3】,给定显著水平,对例6.2的回归方程进行检验。,2022/11/13,统计学第3章参数估计,6-39,2022/11/13,统计学第3章参数估计,6-40,2022/11/13,统计学第3章参数估计,6-41,6.2.5 估计与预测,2022/11/13,统计学第3章参数估计,6-42,2022/11/13,统计学第3章参数估计,6-43,图6.6 回归预测的预测区间,2022/11/13,统计学第3章参数估计,6-44,6.3 多元线性回归,6.3.1 多元线性回归模型,2022/11/13,统计学第3章参数估计,6-45,引入矩阵符号,2022/11/13,统计学第3章参数估计,6-46,2022/11/13,统计学第3章参数估计,6-47,2022/11/13,统计学第3章参数估计,6-48,6.3.2 多元线性回归方程的检验,2022/11/13,统计学第3章参数估计,6-49,2022/11/13,统计学第3章参数估计,6-50,2. 方程显著性检验,2022/11/13,统计学第3章参数估计,6-51,2022/11/13,统计学第3章参数估计,6-52,表6.11 多元回归方程显著性检验的方差分析表,2022/11/13,统计学第3章参数估计,6-53,3. 回归系数显著性检验,2022/11/13,统计学第3章参数估计,6-54,【例6.5】,(数据文件为example 6.0) 沿用本章引例中的资料,建立多元线性回归方程并对回归方程进行检验(给定显著水平=0.05)。解: 1. 先点散点图,用SPSS打开数据文件example 6.0,选择GraphsLegacy DialogsScatter/Dot.Simple Scatter,点Define,将两个变量开始年薪x和当前年薪y分别选入X Axis和Y Axis,点OK。,2022/11/13,统计学第3章参数估计,6-55,图6.7 当前年薪对开始年薪的散点图,2022/11/13,统计学第3章参数估计,6-56,2做多元线性回归:,选择AnalyzeRegressionLinear,将自变量开始年薪、工作时间、先前工作经验和受教育年限选入Independent,再将因变量当前年薪y选入Dependent中,然后选择Method为默认值Enter,点OK即可得3个主要表格 :表6.12至6.14。,2022/11/13,统计学第3章参数估计,6-57,表6.12 员工年薪问题的回归方程的可决系数,2022/11/13,统计学第3章参数估计,6-58,表6.13 员工年薪问题的方差分析表,2022/11/13,统计学第3章参数估计,6-59,表6.14 员工年薪问题的多元回归方程回归系数表,2022/11/13,统计学第3章参数估计,6-60,于是可得如下回归方程:,从回归方程可以看出:当前年薪y与开始年薪x1和受教育年限x4正相关(回归系数为正),这是合理的;但与工作时间x2和先前工作经验x3负相关(回归系数为负),这是不合理的,为什么?,2022/11/13,统计学第3章参数估计,6-61,3对回归方程进行检验。,2022/11/13,统计学第3章参数估计,6-62,6.3.3 估计与预测,1. 均值E(y0)的估计,2022/11/13,统计学第3章参数估计,6-63,2. 个值 y0的预测,2022/11/13,统计学第3章参数估计,6-64,6.4 虚拟变量回归,2022/11/13,统计学第3章参数估计,6-65,【例6.6】,在例6.5中,将性别作为虚拟变量引入回归方程,建立当前年薪y关于受教育年限和性别虚拟变量的线性回归模型。 解: 性别x5是虚拟变量,所以这是虚拟变量回归问题;将性别变量“量化”, x5=0表示男性, x5=1表示女性,统计模型设定为,2022/11/13,统计学第3章参数估计,6-66,用SPSS打开数据文件example 6.0,选择AnalyzeGeneral Linear ModelUnivariate,将因变量当前年薪y选入Dependent Variable中,把定量自变量受教育年限x4选入Covariate中,把虚拟变量性别x5选入Fixed Factor中,在Options中选择Parameter Estimates,点击Model,在Specify Model中选Custom,再把定量自变量x4和虚拟变量x5选入右边,在Building Term中选Main effect,然后点Continue回到主对话框,在Options中的Display中选择Parameter estimates,点ContinueOK即可得参数估计值表表6.15。,2022/11/13,统计学第3章参数估计,6-67,表6.15 引入性别虚拟变量的线性回归模型回归系数表,2022/11/13,统计学第3章参数估计,6-68,由表6.15容易得如下回归方程,显然,这两条线是截距不同的两条平行线,截距的差异表示男女职工年薪的差别。,2022/11/13,统计学第3章参数估计,6-69,6.5 Logistic回归,本节讨论因变量是二值定性变量的回归,即Logistic 回归。,2022/11/13,统计学第3章参数估计,6-70,【例6.7】,为了研究家庭年收入与是否有私家车的关系,随机调查了50个家庭的情况得结果如表6.16,以是否有私家车为因变量(它是一个二值定性变量),年收入为自变量建立回归方程,并估计年收入为12万元的家庭有私家车的可能性。,2022/11/13,统计学第3章参数估计,6-71,表6.15 抽样调查得到的50个家庭的数据资料,2022/11/13,统计学第3章参数估计,6-72,2022/11/13,统计学第3章参数估计,6-73,2022/11/13,统计学第3章参数估计,6-74,利用SPSS软件实现Logistic回归,具体操作如下:打开数据文件example 6.6,选择AnalyzeRegressionBinary Logistic,将因变量y选入Dependent中,把自变量x选入Covariate中,点OK即可得参数估计表表6.17。,2022/11/13,统计学第3章参数估计,6-75,表6.17 Logistic回归方程回归系数表,2022/11/13,统计学第3章参数估计,6-76,如果要估计年收入为12万元的家庭有私家车的可能性,可以打开数据文件example 6.6,在x变量末尾增加一个值12,选择AnalyzeRegressionBinary Logistic,将因变量y选入Dependent中,把自变量x选入Covariate中,点Save在Predicted Values里选 Probabilities,返回主对话框,点OK,在原数据文件里就会得到一列预测值(PRE_1),对应于x=12的PRE值为0.18237,这就是年收入为12万元的家庭有私家车的可能性的估计值。,2022/11/13,统计学第3章参数估计,6-77,6.6 回归分析的扩展,6.6.1 异方差1. 异方差的概念,2022/11/13,统计学第3章参数估计,6-78,异方差的三种类型,(1) 单调递增型:随的增大而增大;(2) 单调递减型:随的增大而减小;(3) 复杂型:随的的变化呈复杂形式变化。,2022/11/13,统计学第3章参数估计,6-79,图6.8 异方差的类型,2022/11/13,统计学第3章参数估计,6-80,2. 异方差的修正,2022/11/13,统计学第3章参数估计,6-81,加权最小二乘(WLS)估计,2022/11/13,统计学第3章参数估计,6-82,2022/11/13,统计学第3章参数估计,6-83,【例6.8】,在例6.5中,求当前年薪y (元)关于开始年薪 x1(元)的线性回归方程。,2022/11/13,统计学第3章参数估计,6-84,解: 用SPSS打开数据文件example 6.0,做的散点图图6.7,容易看出模型存在异方差性,因此先用OLS法求的估计,选择AnalyzeRegressionLinear,将自变量开始年薪x1选入Independent,再将因变量当前年薪y选入Dependent中,然后选择Method为默认值Enter,点Save,在Residuals中选Unstandardized(将回归残差保存到原数据文件中),点ContinueOK即可得3个主要表格:表6.18,6.19和6.20。,2022/11/13,统计学第3章参数估计,6-85,表6.18 普通最小二乘回归方程的可决系数,2022/11/13,统计学第3章参数估计,6-86,表6.19普通最小二乘回归方程的方差分析表,2022/11/13,统计学第3章参数估计,6-87,表6.20普通最小二乘回归方程的回归系数表,2022/11/13,统计学第3章参数估计,6-88,加权最小二乘回归,选择TransformCompute,在Target Variable中输入目标变量名ei,在Numeric Expression中输入表达式ABS(RES_1)求得残差向量的绝对值ei,类似再计算残差向量的绝对值ei的倒数inei:TransformCompute,在Target Variable中输入目标变量名inei,在Numeric Expression中输入表达式1/ei,回到数据窗口可见已经产生了两列新数据:残差向量的绝对值ei和它的倒数inei,最后进行加权最小二乘回归:AnalyzeRegressionLinear,将自变量开始年薪x1选入Independent,将因变量当前年薪y选入Dependent中,将权向量inei选入WLS Weight中,然后选择Method为默认值Enter,点OK即可得3个主要表格:表6.21,6.22和6.23。,2022/11/13,统计学第3章参数估计,6-89,表6.21加权最小二乘回归方程可决系数,2022/11/13,统计学第3章参数估计,6-90,表6.22加权最小二乘回归方程的方差分析表,2022/11/13,统计学第3章参数估计,6-91,表6.23加权最小二乘回归方程的回归系数表,2022/11/13,统计学第3章参数估计,6-92,6.6.2 多重共线,多元回归模型(6.34)的基本假定之一是自变量是互不相关的,如果其中两个或多个自变量之间出现了相关性,则称为存在多重共线性。,2022/11/13,统计学第3章参数估计,6-93,2022/11/13,统计学第3章参数估计,6-94,2022/11/13,统计学第3章参数估计,6-95,2022/11/13,统计学第3章参数估计,6-96,【例6.5(续)】,试建立当前年薪y关于开始年薪x1,工作时间x2 ,先前工作经验x3和受教育年限x4的多元线性回归模型。,2022/11/13,统计学第3章参数估计,6-97,AnalyzeRegressionLinear,将自变量开始年薪x1 ,工作时间x2 ,先前工作经验x3和受教育年限x4选入Independent,再将因变量当前年薪y选入Dependent中,然后选择Method为默认值Enter(全变量回归),点OK即可得表6.12,6.13和6.14。从方差分析表表6.13可以看出,对应的p值,所以回归方程显著;但从回归系数表表6.14可知回归系数对应的t统计量的p值分别为0.793,0.353和0.150,都大于0.05,所以这三个回归系数都不显著,因此估计存在多重共线性。,解:1. 全变量回归,,2022/11/13,统计学第3章参数估计,6-98,2. 逐步回归,,AnalyzeRegressionLinear,将自变量开始年薪x1 ,工作时间x2 ,先前工作经验x3和受教育年限x4选入Independent,再将因变量当前年薪y选入Dependent中,然后选择Method为Stepwise(逐步回归法),点OK即可得以下回归系数表表6.24。,2022/11/13,统计学第3章参数估计,6-99,表6.24逐步回归方程回归系数表,2022/11/13,统计学第3章参数估计,6-100,6.7 可化为线性情形的非线性回归,2022/11/13,统计学第3章参数估计,6-101,2022/11/13,统计学第3章参数估计,6-102,2022/11/13,统计学第3章参数估计,6-103,2022/11/13,统计学第3章参数估计,6-104,【例6.9】,(数据文件为example 6.8) 表6.25给出了1990-2002年某市人均消费性支出x和教育支出y的数据,试建立y关于x的回归模型。,2022/11/13,统计学第3章参数估计,6-105,表6.25人均消费性支出和人均教育支出数据,2022/11/13,统计学第3章参数估计,6-106,解: 1. 先点散点图,,图6.9人均消费性支出x对人均教育支出y的散点图,2022/11/13,统计学第3章参数估计,6-107,2. 再尝试采用二次、三次曲线、幂函数曲线和指数函数曲线拟合数据:AnalyzeRegressionCurve Estimation ,将自变量人均消费性支出x选入Independent,再将因变量人均教育支出y选入Dependent中,在Models中选Linear(线性函数,形如),Quadratic(二次曲线,形如),Cubic(三次曲线,形如),Power(幂函数,形如(6.75)式)和Compound(指数函数,形如(6.79)式),点OK可得如下拟合结果。,2022/11/13,统计学第3章参数估计,6-108,表6.26五种模型的模型小结和回归系数表,2022/11/13,统计学第3章参数估计,6-109,从表6.26可知,拟合优度最高的是指数函数和三次曲线,但从输出的方差分析表和回归系数显著性检验结果(具体表格略)来看,三次曲线中包含回归系数不显著的解释变量,而指数函数的回归系数都显著,所以不采纳三次曲线模型而采纳指数函数模型:,2022/11/13,统计学第3章参数估计,6-110,本章小结,本章介绍了相关分析和回归分析的基本思想,讨论了一元线性回归、多元线性回归、含有虚拟自变量的回归、Logistic回归、可线性化的非线性回归以及存在异方差和多重共线情况的回归分析。,2022/11/13,统计学第3章参数估计,6-111,案例:美国公司高管的高薪酬相关问题,(数据文件为case-study 6)2008年美国金融危机暴露出很多问题,其中高管薪酬过高是其一。当时的民主党总统候选人奥巴马曾评价说:“美国财政部的措施史无前例,用纳税人的钱来挽救两家公司。在这种情况下,绝不允许两家公司的高管再发意外之财。” 美国公司高管不仅薪酬高,而且收入与业绩并不挂钩。以2007年为例,S&P500强公司老总的平均年收入几乎翻了一倍,而公司利润平均只增长了12%,投资圣手巴菲特愤怒地指出:“美国公司高管的年薪与业绩常常严重脱节,而且到了荒谬的地步”。,2022/11/13,统计学第3章参数估计,6-112,问题,美国公司的高管薪酬是否过高?是否与公司业绩相关不大?美国50家公共贸易大公司的首席执行官(CEO)的年薪数据和其它可能与年薪有关的变量数据,如表6.32。,2022/11/13,统计学第3章参数估计,6-113,表6.32 50家公司CEO的年薪数据和其它相关信息,注:表格最后一列是CEO是否有MBA学位的信息,“1”表示有,“0”表示没有。,2022/11/13,统计学第3章参数估计,6-114,要求,1.建立回归模型分析CEO年薪与相关因素(在目前职位年数、前一年股票价格的变化、前一年公司销售额的变化和是否有MBA学位)的关系;2.对回归模型进行检验和评价;3.CEO年薪与公司业绩(前一年股票价格的变化和前一年公司销售额的变化)相关性如何?4.MBA学位对CEO年薪有影响吗?为什么有或者为什么没有?,

    注意事项

    本文(第6章回归分析ppt课件.ppt)为本站会员(小飞机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开