第8章相关分析和回归分析ppt课件.ppt
《第8章相关分析和回归分析ppt课件.ppt》由会员分享,可在线阅读,更多相关《第8章相关分析和回归分析ppt课件.ppt(86页珍藏版)》请在三一办公上搜索。
1、第八章 相关分析和回归分析,1,第一节 相关分析,一、相关关系与函数关系二、相关关系的种类三、相关分析与回归分析四、相关关系的测度,2,一、相关关系与函数关系函数关系,是一一对应的确定关系设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量各观测点落在一条线上,函数关系(几个例子), 函数关系的例子某种商品的销售额y与销售量x之间的关系可表示为 y = px (p 为单价)圆的面积S与半径之间的关系可表示为S=R2 企业的原
2、材料消耗额y与产量x1 、单位产量消耗x2 、原材料价格x3之间的关系可表示为y = x1 x2 x3,一、相关关系与函数关系相关关系(correlation),变量间关系不能用函数关系精确表达一个变量的取值不能由另一个变量唯一确定当变量 x 取某个值时,变量 y 的取值可能有几个各观测点分布在直线周围,相关关系(几个例子), 相关关系的例子父亲身高y与子女身高x之间的关系收入水平y与受教育程度x之间的关系粮食亩产量y与施肥量x1 、降雨量x2 、温度x3之间的关系商品的消费量y与居民收入x之间的关系商品销售额y与广告费支出x之间的关系,二、相关关系的种类,(一)按变量多少划分1.单相关两个现
3、象的相关,即一个变量对另一个变量的相关关系,称为单相关。2.复相关当所研究的是一个变量对两个或两个以上其他变量的相关关系时,该相关关系称为复相关。3.偏相关在某一现象与多种现象相关的场合,当假定其他变量不变时,其中两个特定变量之间的相关关系。,7,二、相关关系的种类,(二)按相关程度划分1.完全相关当一种现象的数量变化完全由另一个现象的数量变化所确定时,称这两种现象间的关系为完全相关。2.不相关当两个现象彼此互不影响,其数量变化各自独立时,称为不相关现象。3.不完全相关两个现象之间的关系介于完全相关和不相关之间,称为不完全相关,一般的相关现象都是指这种不完全相关。,8,二、相关关系的种类,(三
4、)按相关形式划分1.线性相关当两种相关现象之间的相关关系在直角坐标系中近似地表现为一条直线时,称之为线性相关。2.非线性相关如果两种相关现象之间, 在图上并不表现为直线形式而是表现为某种曲线形式时,则称这种相关关系为非线性相关。,9,二、相关关系的种类,(四)按相关方向划分1.正相关。当一个现象的数量由小变大,另一个现象的数量也相应由小变大,这种相关称为正相关。2.负相关当一个现象的数量由小变大,而另一个现象的数量相反地由大变小,这种相关称为负相关。,10,二、相关关系的种类,(五)按相关性质划分1.真实相关当两种现象之间的相关确实具有内在的联系时,称之为“真实相关”。2.虚假相关当两种现象之
5、间的相关只是表面存在,实质上并没有内在的联系时,称之为“虚假相关”。,11,三、相关分析与回归分析,1.相关分析是指研究一个变量与另一个变量或另一组变量之间相关方向和相关密切程度的统计分析方法。2.回归分析是指根据相关关系的具体形态,选择一个合适的数学模型来近似地表达变量间平均变化关系的统计分析方法。,12,三、相关分析与回归分析,3.相关分析与回归分析的联系(1)相关分析回归分析是研究现象之间相关关系的两种基本方法,两者有着密切的系,它们不仅具有共同的研究对象,而且在具体应用时,常常必须互相补充。(2)相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现
6、象数量变化的相关程 度。(3)只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。,13,三、相关分析与回归分析,4.相关分析与回归分析的区别(1)相关分析中,变量x与变量y处于平等地 位,不需要区分自变量和因变量;回归分析中,变量y称为因变量,处在被解释的特殊地位。变量x称为自变量,可以通过x的变化来解释y的变化,故亦称为解释变量。 (2)相关分析中所涉及的变量y与x全是随机变量。而回归分析中,因变量y是随机变量,自变量x可以是随机变量,也可以是非随机的确定变量。(3)相关分析的研究主要是刻画两类变量间线性相关的密切程度。而回归分析不仅可以揭示变量x对变量y的影响大小,
7、还可以由回归方程进行预测和控制。,14,四、相关关系的测度,15,(一) 相关表和相关图,相关表是一种反映变量之间相关关系的统计表。将某一变量按其取值的大小排列,然后再将与其相关的另一变量的对应值平行排列,便可得到简单的相关表。散点图是以直角坐标系的横轴代表变量x,纵轴代表变量y,将两个变量间相对应的变量值用坐标点的形式描绘出来,用来反映两变量之间的相关关系的图形,又称为相关图。,16,散点图(scatter diagram),散点图(例题分析),【例】一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、国家重点项目建设、固定资产投资等项目的贷款。近年来,该银行的贷款额平稳增长,
8、但不良贷款额也有较大比例的增长,这给银行业务的发展带来较大压力。为弄清楚不良贷款形成的原因,希望利用银行业务的有关数据做些定量分析,以便找出控制不良贷款的办法。下面是该银行所属的25家分行2002年的有关业务数据,散点图(例题分析),散点图(例题分析),(二) 相关系数,1.相关系数概念是反映变量之间线性相关密切程度的统计分析指标。相关系数可依总体数据或样本数据计算,分别定义为总体相关系数 和样本相关系数 。2.相关系数的分类根据线性相关变量的多少、分析问题的角度不同,相关系数可分为简单相关系数、偏相关系数和复相关系数。本章只介绍简单相关系数。,21,(二) 相关系数,3.简单相关系数的计算
9、设 是 的 组样 本观察值,两个变量之间的简单线性相关系数 计算公式如下:,22,相关系数(取值及其意义),r 的取值范围是 -1,1 |r|=1,为完全相关r =1,为完全正相关r =-1,为完全负正相关 r = 0,不存在线性相关关系 -1r0,为负相关 0r1,为正相关 |r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切,相关系数(取值及其意义),r,相关系数(例题分析),用Excel计算相关系数,相关系数的显著性检验,相关系数的显著性检验( r 的抽样分布),1.r 的抽样分布随总体相关系数和样本容量的大小而变化当样本数据来自正态总体时,随着n的增大,r 的抽样分布趋于正态分
10、布,尤其是在总体相关系数很小或接近0时,趋于正态分布的趋势非常明显。而当远离0时,除非n非常大,否则r的抽样分布呈现一定的偏态。当为较大的正值时,r 呈现左偏分布;当为较小的负值时,r 呈现右偏分布。只有当接近于0,而样本容量n很大时,才能认为r是接近于正态分布的随机变量,相关系数的显著性检验(检验的步骤),检验两个变量之间是否存在线性相关关系等价于对回归系数 b1的检验采用R.A.Fisher提出的 t 检验检验的步骤为提出假设:H0: ;H1: 0,计算检验的统计量:,确定显著性水平,并作出决策 若tt,拒绝H0 若tt,不能拒绝H0,相关系数的显著性检验(例题分析), 对不良贷款与贷款余
11、额之间的相关系数进行显著性检(0.05)提出假设:H0: ;H1: 0计算检验的统计量,根据显著性水平0.05,查t分布表得t(n-2)=2.069由于t=7.5344t(25-2)=2.069,拒绝H0,不良贷款与贷款余额之间存在着显著的正线性相关关系,相关系数的显著性检验(例题分析),各相关系数检验的统计量,第二节 一元线性回归分析,一、一元线性回归模型二、一元线性回归模型的估计三、回归方程的显著性检验四、回归模型的应用五、统计软件SPSS应用,31,什么是回归分析?(Regression),从一组样本数据出发,确定变量之间的数学关系式对这些关系式的可信程度进行各种统计检验,并从影响某一特
12、定变量的诸多变量中找出哪些变量的影响显著,哪些不显著利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度,一元线性回归模型,一元线性回归,涉及一个自变量的回归因变量y与自变量x之间为线性关系被预测或被解释的变量称为因变量(dependent variable),用y表示用来预测或用来解释因变量的一个或多个变量称为自变量(independent variable),用x表示 因变量与自变量之间的关系用一个线性方程来表示,一、一元线性回归模型,(一)回归模型的基本形式1.总体回归模型式中: 为因变量(被解释变量), 为自变量(解释变量), 和
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 相关 分析 回归 ppt 课件
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-1429250.html