第6章回归分析ppt课件.ppt
《第6章回归分析ppt课件.ppt》由会员分享,可在线阅读,更多相关《第6章回归分析ppt课件.ppt(114页珍藏版)》请在三一办公上搜索。
1、2022/11/13,统计学第3章参数估计,6-1,统计学,费宇,石磊 主编高等教育出版社,2022/11/13,统计学第3章参数估计,6-2,第6章 回归分析,6.1 相关分析6.2 一元线性回归6.3 多元线性回归6.4 虚拟变量回归6.5 Logistic回归6.6 回归分析的扩展6.7 可化为线性情形的非线性回归,2022/11/13,统计学第3章参数估计,6-3,【引例6.0】,(数据文件为example 6.0)某公司经理想研究公司员工的年薪问题,根据初步分析,他认为员工的当前年薪y(元)与员工的开始年薪x1(元)、在公司的工作时间x2(月)、先前的工作经验x3(月)和受教育年限x
2、4(年)有关系,他随机抽样调查了36个员工,收集到以下数据:,2022/11/13,统计学第3章参数估计,6-4,2022/11/13,统计学第3章参数估计,6-5,问题,经理想根据以上样本数据,构建一个模型来反映y与x1、x2、x3和x4之间关系,并希望利用该模型在给定一个员工的x2、x3和x4的条件下,预测该员工的当前年薪y。此外,经理认为,公司男女员工的薪水结构不同,他想在建立模型的时候能把性别因素考虑进来,这是否可行?,2022/11/13,统计学第3章参数估计,6-6,6.1 相关分析,6.1.1 相关的概念 1. 人的身高与体重有相关关系。2. 居民可支配收入与支出有相关关系。3.
3、 粮食产量与施肥量有相关关系。,2022/11/13,统计学第3章参数估计,6-7,6.1.2 相关的种类,1. 按相关程度划分: 分为完全相关、不完全相关和不相关;如图6.1所示。2. 按相关方向划分: 分为正相关和负相关。如图6.2所示。3. 按相关形式划分: 分为线性相关和非线性相关;如图6.3所示 。 4. 按变量多少划分: 分为简单相关和复相关。,2022/11/13,统计学第3章参数估计,6-8,6.1.3 相关关系的度量,1. 简单线性相关系数,2022/11/13,统计学第3章参数估计,6-9,2022/11/13,统计学第3章参数估计,6-10,2022/11/13,统计学第
4、3章参数估计,6-11,2. 偏相关系数,2022/11/13,统计学第3章参数估计,6-12,【例6.1】,2022/11/13,统计学第3章参数估计,6-13,2022/11/13,统计学第3章参数估计,6-14,2022/11/13,统计学第3章参数估计,6-15,6.2 一元线性回归,6.2.1 回归的含义回归(regression)一词最早由英国生物学家兼统计学家高尔顿(F.Galton)于1886年在论文“Regression towards mediocrity in hereditary stature”中正式提出。回归分析(regression analysis)是通过建立回
5、归模型来研究相关变量的关系并作出相应估计和预测的一种统计方法,,2022/11/13,统计学第3章参数估计,6-16,6.2.2 一元线性回归,2022/11/13,统计学第3章参数估计,6-17,2022/11/13,统计学第3章参数估计,6-18,6.2.3 最小二乘估计,图6.4 x和y的散点图,2022/11/13,统计学第3章参数估计,6-19,2022/11/13,统计学第3章参数估计,6-20,2022/11/13,统计学第3章参数估计,6-21,2022/11/13,统计学第3章参数估计,6-22,2022/11/13,统计学第3章参数估计,6-23,2022/11/13,统计
6、学第3章参数估计,6-24,【例6.2】,(数据文件为example 6.2) 已知我国2007年31个地区城镇居民年人均可支配收入和年人均消费性支出数据如下表(单位:元),试分析城镇居民年人均可支配收入和年人均消费性支出之间的关系,如果有线性相关关系,试建立一元线性回归模型。,2022/11/13,统计学第3章参数估计,6-25,2022/11/13,统计学第3章参数估计,6-26,图6.5人均可支配收入x和人均消费性支出y散点图,2022/11/13,统计学第3章参数估计,6-27,2022/11/13,统计学第3章参数估计,6-28,2022/11/13,统计学第3章参数估计,6-29,
7、2022/11/13,统计学第3章参数估计,6-30,6.2.4 回归方程的检验,2022/11/13,统计学第3章参数估计,6-31,1. F检验,2022/11/13,统计学第3章参数估计,6-32,2022/11/13,统计学第3章参数估计,6-33,2022/11/13,统计学第3章参数估计,6-34,2022/11/13,统计学第3章参数估计,6-35,2. t检验,2022/11/13,统计学第3章参数估计,6-36,3.r检验,2022/11/13,统计学第3章参数估计,6-37,2022/11/13,统计学第3章参数估计,6-38,【例6.3】,给定显著水平,对例6.2的回归方
8、程进行检验。,2022/11/13,统计学第3章参数估计,6-39,2022/11/13,统计学第3章参数估计,6-40,2022/11/13,统计学第3章参数估计,6-41,6.2.5 估计与预测,2022/11/13,统计学第3章参数估计,6-42,2022/11/13,统计学第3章参数估计,6-43,图6.6 回归预测的预测区间,2022/11/13,统计学第3章参数估计,6-44,6.3 多元线性回归,6.3.1 多元线性回归模型,2022/11/13,统计学第3章参数估计,6-45,引入矩阵符号,2022/11/13,统计学第3章参数估计,6-46,2022/11/13,统计学第3章
9、参数估计,6-47,2022/11/13,统计学第3章参数估计,6-48,6.3.2 多元线性回归方程的检验,2022/11/13,统计学第3章参数估计,6-49,2022/11/13,统计学第3章参数估计,6-50,2. 方程显著性检验,2022/11/13,统计学第3章参数估计,6-51,2022/11/13,统计学第3章参数估计,6-52,表6.11 多元回归方程显著性检验的方差分析表,2022/11/13,统计学第3章参数估计,6-53,3. 回归系数显著性检验,2022/11/13,统计学第3章参数估计,6-54,【例6.5】,(数据文件为example 6.0) 沿用本章引例中的资
10、料,建立多元线性回归方程并对回归方程进行检验(给定显著水平=0.05)。解: 1. 先点散点图,用SPSS打开数据文件example 6.0,选择GraphsLegacy DialogsScatter/Dot.Simple Scatter,点Define,将两个变量开始年薪x和当前年薪y分别选入X Axis和Y Axis,点OK。,2022/11/13,统计学第3章参数估计,6-55,图6.7 当前年薪对开始年薪的散点图,2022/11/13,统计学第3章参数估计,6-56,2做多元线性回归:,选择AnalyzeRegressionLinear,将自变量开始年薪、工作时间、先前工作经验和受教育
11、年限选入Independent,再将因变量当前年薪y选入Dependent中,然后选择Method为默认值Enter,点OK即可得3个主要表格 :表6.12至6.14。,2022/11/13,统计学第3章参数估计,6-57,表6.12 员工年薪问题的回归方程的可决系数,2022/11/13,统计学第3章参数估计,6-58,表6.13 员工年薪问题的方差分析表,2022/11/13,统计学第3章参数估计,6-59,表6.14 员工年薪问题的多元回归方程回归系数表,2022/11/13,统计学第3章参数估计,6-60,于是可得如下回归方程:,从回归方程可以看出:当前年薪y与开始年薪x1和受教育年限
12、x4正相关(回归系数为正),这是合理的;但与工作时间x2和先前工作经验x3负相关(回归系数为负),这是不合理的,为什么?,2022/11/13,统计学第3章参数估计,6-61,3对回归方程进行检验。,2022/11/13,统计学第3章参数估计,6-62,6.3.3 估计与预测,1. 均值E(y0)的估计,2022/11/13,统计学第3章参数估计,6-63,2. 个值 y0的预测,2022/11/13,统计学第3章参数估计,6-64,6.4 虚拟变量回归,2022/11/13,统计学第3章参数估计,6-65,【例6.6】,在例6.5中,将性别作为虚拟变量引入回归方程,建立当前年薪y关于受教育年
13、限和性别虚拟变量的线性回归模型。 解: 性别x5是虚拟变量,所以这是虚拟变量回归问题;将性别变量“量化”, x5=0表示男性, x5=1表示女性,统计模型设定为,2022/11/13,统计学第3章参数估计,6-66,用SPSS打开数据文件example 6.0,选择AnalyzeGeneral Linear ModelUnivariate,将因变量当前年薪y选入Dependent Variable中,把定量自变量受教育年限x4选入Covariate中,把虚拟变量性别x5选入Fixed Factor中,在Options中选择Parameter Estimates,点击Model,在Specify
14、 Model中选Custom,再把定量自变量x4和虚拟变量x5选入右边,在Building Term中选Main effect,然后点Continue回到主对话框,在Options中的Display中选择Parameter estimates,点ContinueOK即可得参数估计值表表6.15。,2022/11/13,统计学第3章参数估计,6-67,表6.15 引入性别虚拟变量的线性回归模型回归系数表,2022/11/13,统计学第3章参数估计,6-68,由表6.15容易得如下回归方程,显然,这两条线是截距不同的两条平行线,截距的差异表示男女职工年薪的差别。,2022/11/13,统计学第3章
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 章回 分析 ppt 课件

链接地址:https://www.31ppt.com/p-1354400.html