《《统计学教学课件》j第八章相关分析.ppt》由会员分享,可在线阅读,更多相关《《统计学教学课件》j第八章相关分析.ppt(30页珍藏版)》请在三一办公上搜索。
1、第八章 相关分析与回归分析,经济、管理类技术基础课统计学,第八章 相关分析与回归分析第一节 相关分析第二节 简单线性回归分析第三节 多元线性回归与曲线回归,第一节 相关分析,一、相关分析的概念 相关分析是一个变量和另一个变量或一组变量之间密切程度和相关方向的一种统计分析方法。,(一)函数关系:是现象之间存在的严格的依存关系。【如】:某种商品的销售额(y)与销售量(x)之间的关系可表示为 y=p x(p 为单价);圆的面积(S)与半径之间的关系可表示为S=R2。企业的原材料消耗额(y)与产量(x1)、单位产量消耗(x2)、原材料价格(x3)之间的关系可表示为y=x1 x2 x3,(二)相关关系:
2、现象之间确实存在的,数值关系不确定的相互依存关系。特点:1、现象之间确实存在数量上的依存关系;2、现象之间数量依存关系的数值是不固定的,【如】:商品的消费量(y)与居民收入(x)之间的关系;商品销售额(y)与广告费支出(x)之间的关系;粮食亩产量(y)与施肥量(x1)、降雨量(x2)、温度(x3)之间的关系;收入水平(y)与受教育程度(x)之间的关系;父亲身高(y)与子女身高(x)之间的关系;,(三)相关关系与函数关系的区别与联系 区别:1、函数关系是变量之间的一种完全确定性的关系,而相关关系一般不是完全确定的;2、函数关系通常用数学公式确切表示,相关关系一般不能用数学公式准确地表示出来。联系
3、:由于测量误差等原因,函数关系实际中往往通过相关关系表现出来,相关关系研究中又可能转化为函数关系。,二、相关关系类型,三、相关关系的判断 在进行相关分析之前,首先要对现象之间是否存在依存关系,以及存在什么样的依存关系进行分析、做出判断,即进行定性分析。(一)定性判断法:根据对客观事物的定性认识判断。(二)相关表判断法:将现象之间的相关关系用表格来反映的方法。1、简单相关表:按两列成对的变量数值编制的统计表。【如】表8-1 2、分组相关表:将原始资料分组后得到的相关表。(1)单变量分组表:仅对自变量分组的分组相关表。【如】表8-2,表8-1 产品产量和生产费用相关表,表8-2 400个女大学生身
4、高和体重相关表,(2)双变量分组表:是自变量、因变量都进行分组的分组表。,(三)散点图判断法:也称散布图法,是将现象之间的关系用图像来表示的方法。(参考图8-1)判断的形式:1、强正相关;2、弱正相关 3、强负相关;4、弱负相关,图8-1 相关图,(四)相关系数法:通过计算相关系数判断相关的方法。,1、概念:是直线相关条件下,反映现象之间相关关系密切程度的统计分析指标。常用r表示。2、取值范围:(1)r 的取值范围是-1,1(2)|r|=1,为完全相关;r=1,为完全正相关;r=-1,为完全负正相关(3)r=0,不存在线性相关(不一定无其它相关)(4)-1|r|0,为负相关;0|r|1,为正相
5、关,(5)|r|越趋于1关系越密切;|r|越趋于0表示关系越不密切(6)在实际应用中的标准|r|0.3为无相关;0.3|r|0.5为低度相关;0.5|r|0.8为显著相关;|r|0.8为高度相关。,3、计算方法:用积差法,上式也可简化为:,【例】在研究我国人均消费水平的问题中,把全国人均消费额记为y,把人均国民收入记为x。我们收集到19811993年的样本数据(xi,yi),i=1,2,,13,数据见表8-4,计算相关系数。,解:根据相关系数的计算公式有:,人均国民收入与人均消费金额之间的相关系 数为 0.9987,第二节 简单直线回归分析,一、回归分析(一)回归分析的概念 是指对具有相关关系
6、的现象,根据其关系形态,选择合适的数学模型(称为回归方程式),用来近似地表示变量间的平均变化关系的一种统计分析方法。如用直线模型表示叫线性回归分析,所建立的方程为回归直线;如用曲线模型表示叫曲线回归分析,所建立的方程为曲线回归方程。,(二)回归分析与相关分析的区别与联系 1、区别:(1)相关分析所研究的两个变量是对等关系;回归分析所研究的两个变量不是对等关系。(2)对两个变量x和y来说,相关分析只能计算出一个相关系数;回归分析有时可根据研究目的分别建立两个不同的回归方程。(3)相关分析对资料的要求是,两个变量都必须是随机变量,而回归分析对资料的要求是,自变量是可控变量,因变量是随机变量。2、联
7、系(1)相关分析是回归分析的基础和前提。(2)回归分析是相关分析的深入和继续。,二、直线回归模型(一)简单直线回归模型的概念 有称一元线性回归模型,是根据成对的两种变量的数据,配合直线方程式,根据自变量的变动,来推算因变量发展趋势和水平的方法。一元线性回归方程:yc=a+b x 式中,a是回归直线 轴上的截距;b是直线的斜率,称为回归系数,表示当 x 变动一个单位时,y(x)的平均变动值。,(二)配合最佳回归直线模型的条件 1、两个变量之间确实存在显著的相关关系。2、两种变量之间确实存在着直线相关关系。3、应根据最小平方法(最小二乘法)原理配合一元线性回归模型。(三)简单回归直线模型的配合 根
8、据最小平方法原理,应用下列标准方程组,求解a和b的数值:,解联立方程式得出:,一、多元线性回归模型 用两个或更多的自变量估计因变量叫做多元线性回归分析。分析步骤、方法和简单线性回归分析基本相同,只是计算比较复杂。这里仅介绍二元线性回归方程。二元线性回归方程为:yc=a+b1 x1+b2x2式中,a、b1、b2为三个参数。根据最小平方法原理,使 最小的求解a、b1、b2的标准方程组为:,第三节 多元线性回归和曲线回归,将二元回归模型的配合方法可推广到多元回归方程。,多元回归方程式为:yc=a+b1 x1+b2x2+b3x3+bnxn式中,a,bi(i=1,2,3,n)为参数。根据最小平方法原理求
9、解n+1个参数,应确定个方程式为:,二、曲线回归模型 对于曲线模型(非线性回归模型)可通过变量代换化为线性模型,再按照线性模型的方法处理。,例如,指数模型:yc=a b x 可对方程两边取对数 lgyc=lga+xlgb 令,则得一元线性模型:求解一元线性回归模型即可。三、估计标准误差(一)概念:用来说明回归方程推算结果准确程度的统计分析指标,或反映回归直线代表性大小的统计分析指标。,估计标准误差越大,就表明估计值的代表性越小,也就是相关点的离散程度大;反之越小,则说明估计值的代表性越大,也就是相关点的离散程度越小。如果syx0,说明y与 yc没有差异,所有观测点都落在了直线上,估计完全准确。(二)简单线性回归估计标准误差的测定 1、根据定义公式计算。估计标准误差(syx),是指因变量实际值与理论值离差的平均数。公式为:,(三)多元线性回归估计标准误差的测定 以二元为例,计算公式为:,(四)应用回归分析应注意的问题一、在定性分析基础上进行定量分析二、要注意现象质的界限及相关关系作用的范围注意:回归分析一般只用于内插预测,不宜用于外推预测。三、要具体问题具体分析注意:观察现象必须是大量的。四、要考虑社会经济现象的复杂性 例:价格与销售量的关系。五、对回归估计出来的参数的有效性进行检验,课程结束,再见!,
链接地址:https://www.31ppt.com/p-5903714.html