统计学-相关分析与回归分析.ppt
第6章 相关分析与回归分析,第6章 相关分析与回归分析,主要内容:6.1 相关分析概述6.2 相关关系的测度6.3 回归分析的基本问题6.4 简单线性回归分析6.5 多元线性回归分析6.6 非线性回归分析6.7 使用SPSS进行相关分析和回归分析举例,第6章 相关分析与回归分析 6.1 相关分析概述,1.函数关系2.相关关系(1)相关关系是指现象之间确实存在数量上的相互依存关系。(2)现象之间数量依存关系的具体关系值不是固定的。,6.1.1 变量之间的关系,第6章 相关分析与回归分析 6.1 相关分析概述,1、按相关关系的程度划分,可分为完全相关、不完全相关和不相关 2、按相关形式划分,可以分为线性相关和非线性相关3、按相关的方向划分,可分为正相关和负相关4、按相关关系涉及的因素多少划分,分为单相关、复相关和偏相关,6.1.2 相关关系的分类,第6章 相关分析与回归分析 6.1 相关分析概述,6.1.2 相关关系的分类,表6.1 销售额与流通费用相关,第6章 相关分析与回归分析 6.2 相关关系的测度,6.2.1 相关表,第6章 相关分析与回归分析 6.2 相关关系的测度,6.2.2 相关图,相关系数是用来说明变量之间在线性相关条件下相关关系密切程度和方向的统计分析指标。相关程度的大小与计量单位无关,所以相关系数是无量纲的数量。,第6章 相关分析与回归分析 6.2 相关关系的测度,6.2.3 相关系数,设变量x,y的n对观测值为(x1,y1),(xn,yn),皮尔逊相关系数为,6章 相关分析与回归分析 6.2 相关关系的测度 6.2.3 相关系数,1、简单线性相关系数皮尔逊相关系数计算,6章 相关分析与回归分析 6.2 相关关系的测度 6.2.3 相关系数,1、简单线性相关系数皮尔逊相关系数例,6章 相关分析与回归分析 6.2 相关关系的测度 6.2.3 相关系数,1、简单线性相关系数皮尔逊相关系数的意义,6章 相关分析与回归分析 6.2 相关关系的测度 6.2.3 相关系数,1、简单线性相关系数相关系数的显著性检验,6章 相关分析与回归分析 6.2 相关关系的测度 6.2.3 相关系数,1、简单线性相关系数相关系数的显著性检验,提出假设:,计算检验的统计量:,作出决策:,第一步:定等级。将变量x,y的观测值按照顺序定出等级,形成两个序数数列,如果有相等的数值时,则按原有的等级求其平均数,作为这些观测值的等级。例如,某公司6位员工按学历高低排列分别为:硕士、本科、本科、本科、专科、专科。其中3个本科原来应该列为第2、3、4等级,平均数为3,2个专科原来应该列为第5、6等级,平均数为5.5,因此这6个人的学历等级可以定为:1、3、3、3、5.5、5.5。,6章 相关分析与回归分析 6.2 相关关系的测度 6.2.3 相关系数,2、等级相关系数斯皮尔曼相关系数,计算步骤:,第二步:计算x和y两个序数数列的每对观测值的等级之差,记作D,D=x-y;第三步:按下述公式计算相关系数:,6章 相关分析与回归分析 6.2 相关关系的测度 6.2.3 相关系数,2、等级相关系数斯皮尔曼相关系数,计算步骤:,6章 相关分析与回归分析 6.2 相关关系的测度 6.2.3 相关系数,2、等级相关系数斯皮尔曼相关系数,例题:,6.3.1 回归分析的概念与分类 回归分析的特点回归分析的类型 相关分析与回归分析(1)描述的方式不同(2)变量的地位不同(3)描述的内容不同(4)变量的性质不同,第6章 相关分析与回归分析 6.3 回归分析的基本问题,6.3.1 回归分析的概念与分类 回归分析,是指在相关分析的基础上,把变量之间的具体变动关系模型化,求出关系方程式,就是找出一个能够反映变量间变化关系的函数关系式,并据此进行估计和推算。通过回归分析,可以将相关变量之间不确定、不规则的数量关系一般化、规范化。从而可以根据自变量的某一个给定值推断出因变量的可能值(或估计值)。回归分析包括多种类型,可分为简单回归和多元回归,也可分为线性回归和非线性回归。,第6章 相关分析与回归分析 6.3 回归分析的基本问题,6.3.2 相关分析与回归分析,第6章 相关分析与回归分析 6.3 回归分析的基本问题,(1)描述的方式不同(2)变量的地位不同(3)描述的内容不同(4)变量的性质不同,第6章 相关分析与回归分析 6.4 简单线性回归分析,6.4.1 总体回归模型例:某城市某月家庭可支配收入和消费支出数据如下表(元),第6章 相关分析与回归分析 6.4 简单线性回归分析,6.4.1 总体回归模型,某城市某月家庭可支配收入和消费支出数据散点图,第6章 相关分析与回归分析 6.4 简单线性回归分析,6.4.1 总体回归模型,表6.4 不同收入下平均消费支出的数据,第6章 相关分析与回归分析 6.4 简单线性回归分析,6.4.1 总体回归模型,第6章 相关分析与回归分析 6.4 简单线性回归分析,6.4.1 总体回归模型,条件期望表现形式:,个别值表现形式:,6.4.2 样本回归模型和基本假设,第6章 相关分析与回归分析 6.4 简单线性回归分析,样本回归模型:,基本假设:,6.4.2 样本回归模型和基本假设,第6章 相关分析与回归分析 6.4 简单线性回归分析,图6.4 总体回归函数和样本回归函数关系图,6.4.3 回归模型的参数估计,第6章 相关分析与回归分析 6.4 简单线性回归分析,设变量x,y的n对观测值为(x1,y1),(xn,yn).,参数的估计通常采用最小二乘法,6.4.3 回归模型的参数估计,第6章 相关分析与回归分析 6.4 简单线性回归分析,图6.5 回归参数估计中偏差,第6章 相关分析与回归分析 6.4 简单线性回归分析,例下表是家庭收入和消费支出的样本数据,试建立简单线性回归模型。,第6章 相关分析与回归分析 6.4 简单线性回归分析,例中数据散点图,第6章 相关分析与回归分析 6.4 简单线性回归分析,参数估计结果:,第6章 相关分析与回归分析 6.4 简单线性回归分析,一元线性回归模型为:,以上模型表明,家庭收入每增加1千元,消费支出平均增加0.402千元。,第6章 相关分析与回归分析 6.4 简单线性回归分析,6.4.4 回归模型的检验,1、拟合优度的度量 可决系数(判定系数),第6章 相关分析与回归分析 6.4 简单线性回归分析,6.4.4 回归模型的检验,1、拟合优度的度量 可决系数(判定系数),判定系数是指回归离差平方和占总离差平方和的比重,即:,第6章 相关分析与回归分析 6.4 简单线性回归分析,6.4.4 回归模型的检验,2、回归方程的显著性检验,第一步:提出假设,第二步:计算检验统计量F,第三步:确定显著性水平以及临界值F,第四步:做出判断,第6章 相关分析与回归分析 6.4 简单线性回归分析,6.4.4 回归模型的检验,2、回归方程的显著性检验,表6.6 回归方程显著性检验分析表,第6章 相关分析与回归分析 6.4 简单线性回归分析,简单线性回归的应用之一预测,个别值的预测区间为:,第6章 相关分析与回归分析 6.4 简单线性回归分析,简单线性回归的应用之一预测,第6章 相关分析与回归分析 6.多元线性回归分析,6.5.1 总体回归模型和样本回归函数,第6章 相关分析与回归分析 6.多元线性回归分析,6.5.1 总体回归模型和样本回归函数,6.5.2 多元线性回归的基本假设和参数估计,第6章 相关分析与回归分析 6.多元线性回归分析,参数的估计仍采用最小二乘法,具体地:,6.5.2 多元线性回归的基本假设和参数估计,第6章 相关分析与回归分析 6.多元线性回归分析,6.5.3 多元线性回归模型的检验,第6章 相关分析与回归分析 6.多元线性回归分析,1、拟合优度检验,SST=SSE+SSR,可决系数:,调整可决系数:,6.5.3 多元线性回归模型的检验,第6章 相关分析与回归分析 6.多元线性回归分析,2、回归方程的显著性检验F检验,6.5.3 多元线性回归模型的检验,第6章 相关分析与回归分析 6.多元线性回归分析,3.回归参数的显著性检验t检验,是,的主对角线元素,6.5.4 多元线性回归预测模型,第6章 相关分析与回归分析 6.多元线性回归分析,6.5.5 多元线性回归变量的筛选,第6章 相关分析与回归分析 6.多元线性回归分析,1、向前筛选策略2、向后筛选策略3、逐步筛选策略,第6章 相关分析与回归分析 6.6 非线性回归分析,6.6.1 非线性回归分析的一般问题,表示双变量间关系的曲线种类很多,但许多曲线类型都可以通过变量转换化成直线形式,先利用直线回归的方法配合直线回归方程,然后再还原成曲线回归方程。,第6章 相关分析与回归分析 6.6 非线性回归分析,6.6.1 非线性回归分析的一般问题,例双曲线函数:,图6.8 双曲线函数图形,第6章 相关分析与回归分析 6.6 非线性回归分析,6.6.2 举例:,人均消费支出与教育支出数据表,第6章 相关分析与回归分析 6.6 非线性回归分析举例,第6章 相关分析与回归分析 6.6 非线性回归分析举例,选择经验函数为复合函数:,