回归分析和回归方程变量相互关系分析课件.ppt
《回归分析和回归方程变量相互关系分析课件.ppt》由会员分享,可在线阅读,更多相关《回归分析和回归方程变量相互关系分析课件.ppt(96页珍藏版)》请在三一办公上搜索。
1、相关与回归分析,第一节 变量间关系的度量第二节 一元线性回归分析第三节 利用回归方程进行估计和预测,第一节 变量间关系的度量,一、变量间的函数关系与相关关系二、相关关系的描述与测度三、相关系数的显著性检验,一、变量间的函数关系与相关关系,客观现象之间是普遍联系相互依存的。客观现象之间的数量联系可分为两类: 确定性关系(函数关系) 非确定性关系(相关关系),函数关系,一个或几个变量取一定值时另一个变量有确定值与之对应,这种变量间一一对应的确定性关系称为函数关系。例如,设有两个变量 x 和 y ,变量 y 随变量 x 变化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值
2、,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量。,两变量函数关系在图形上表现为各观测点落在一条线上, 函数关系举例,某种商品的销售额(y)与销售量(x)之间的关系可表示为 y = p x (p 为单价)圆的面积(S)与半径(R)之间的关系可表示为S = R2 企业原材料消耗额(y)与产品产量(x1) 、单位产量原材料消耗量(x2) 、原材料价格(x3)之间的关系可表示为y = x1 x2 x3,相关关系,一个或几个相互联系的变量取一定值时,与之对应的另一个变量的值虽然不确定,但它按某种规律在一定范围内变化,这种变量间的不确定性对应关系称为相关关系。例
3、如,设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,但不完全依赖于 x ,当变量 x 取某个值时,变量 y 的取值可能有几个,但取值范围变化有一定规律,则称 y 与 x 之间有相关关系。,两变量相关关系在图形上表现为各观测点分布在线的周围, 相关关系举例,商品的消费量(y)与居民收入(x)之间的关系商品销售额(y)与广告费支出(x)之间的关系粮食亩产量(y)与施肥量(x1) 、降雨量(x2) 、温度(x3)之间的关系收入水平(y)与受教育程度(x)之间的关系父亲身高(y)与子女身高(x)之间的关系,相关关系,相关关系比因果关系包括的范围更广泛。具有相关关系的某些现象的数量可表现为因
4、果关系,即自变量与因变量的关系,但有时不存在明显的因果关系或互为因果关系,如人的身高和体重、商品的供求与价格等。变量间的函数关系与相关关系在一定条件下可以相互转化。当存在测量误差或随机因素的干扰时,函数关系可表现为相关关系;当我们对变量内在联系有规律性认识时,相关关系可能转化为函数关系或用函数关系来描述。,相关分析,现象的函数关系可以用数学分析方法研究和测度,现象的相关关系需用统计学的相关与回归分析方法研究和测度。相关分析是描述和测度变量间相关关系类型和相关程度的分析方法。在相关分析中,所有变量都假定是随机变量,它们之间不存在解释变量和被解释变量的关系,即不考虑因果关系。,相关关系的种类,1按
5、相关因素的多少分 单相关 复相关2按相关关系的形式分 线性相关(直线相关) 非线性相关(曲线相关)3按相关关系的方向分 正相关 负相关4按相关关系的程度分 完全相关 不完全相关 不相关,相关关系的种类,简单相关和多元相关(多重相关、复相关) 简单相关指两个变量之间的相关关系;多元相关指三个或三个以上变量之间的相关关系。 线性相关和非线性相关 如果散点图上的所有的点几乎接近一条直线,可以认为变量之间是线性相关的;如果散点图上的所有点几乎接近一条曲线,可以认为变量之间是非线性相关的。,相关关系的种类,正相关和负相关 如果相关变量之间同增或同减,称这种相关关系是正相关。如果相关变量间一个变量值增加时
6、另一个变量值减少,称这种相关关系是负相关。完全相关、不完全相关和不相关 如果一个变量的变化完全由另一个变量的变化所确定,则称两变量的关系为完全相关,即为函数关系;如果两个变量间的关系很弱或看不出任何关系,则称之为不相关(或零相关)。两变量的关系介于完全相关和不相关之间称为不完全相关。,二、相关关系的描述与测度,判断现象之间有无相关关系,应先进行定性分析,即依据理论知识、实践经验对现象之间是否存在相关关系及相关关系的类型作出判断。然后在此基础上进行定量分析,即运用相关图、相关表和相关系数等方法对现象之间的相关关系进行描述与测度。相关表相关关系的图示相关系数,相关表,简单相关表例:居民消费支出和收
7、入的相关表 (单位:百元) 根据以上资料绘制坐标图便得到相关图,单变量分组表,例:30家企业按产品产量分组的平均单位产品成本,双变量分组表例:30家企业按产品产量和单位产品成本分组,相关关系的图示(散点图scatter diagram),如何制作散点图?Minitab教您怎么制作散点图(scatter diagram)http:/www.pinzhi.org/thread-4292-1-1.html Minitab制作3D散点图(3D Scatterplot)的方法,如何制作3D散点图教程http:/www.pinzhi.org/thread-4639-1-1.html,散点图(例题分析),【
8、例9.1】一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、国家重点项目建设、固定资产投资等项目的贷款。近年该银行贷款额平稳增长,但不良贷款额也有较大提高,给银行业务发展带来较大压力。为弄清不良贷款形成的原因,以便找出控制不良贷款的办法,现利用银行有关业务数据进行相关分析。下面是该银行所属25家分行2002年的有关业务数据。,散点图(例题分析),散点图(例题分析),相关系数,相关系数是对变量之间关系密切程度的度量对两个变量之间线性相关程度的度量称为简单相关系数(简称相关系数)若相关系数是根据总体全部数据计算的,称为总体相关系数,记为若相关系数是根据样本数据计算的,则称为样本相关
9、系数,记为 r在此仅讨论两变量间相关关系问题。对于随机变量x和y,总体相关系数一般是未知的,只能根据样本观测值给出一个估计量即样本相关系数r。,样本相关系数r的计算公式,或化简为,相关系数取值及其意义,r 的取值范围是 -1,1|r|=1,表明x与y完全线性相关r =1,为完全正线性相关r =-1,为完全负线性相关 r = 0,表明x与y不存在线性相关关系-1r0,为负线性相关0r1,为正线性相关|r|越趋于1表示x与y线性关系越密切;|r|越趋于0表示x与y线性关系越不密切,相关系数(取值及其意义),r,样本容量适中时相关关系程度一般判断标准,无相关或微弱相关 低度相关 中度相关(显著相关)
10、 高度相关这种判断必须建立在对相关系数进行显著性检验的基础上。,相关系数计算例,【例9.2】在我国居民消费水平研究中,将人均消费额记为y,人均国民收入记为x。收集到19811993年的样本数据(xi ,yi,i =1,2,,13)见下表,计算相关系数。,相关系数计算例表,例计算结果,相关系数相关系数为 0.9987,显示人均国民收入与人均消费金额之间高度正相关。,相关系数计算例 【例】用例9.1数据计算出该商业银行不良贷款、贷款余额、应收贷款、贷款项目、固定资产投资额之间的相关系数如下:,可以看出,不良贷款与贷款余额的相关系数最大,与固定资产投资额的相关系数最小。,三、相关系数的显著性检验,根
11、据样本计算的相关系数r能否代表总体相关系数,只有对其检验以后才能下结论。因其具有一定的随机性,样本容量越小其可信程度越差。相关系数的显著性检验问题可分为两类:一是对总体相关系数是否等于0进行检验;二是对总体相关系数是否等于某一给定的不为0的数值进行检验。这里只介绍第一类检验。,相关系数的显著性检验(方法与步骤),数学上可以证明,在X与Y都服从正态分布且 的条件下,可以采用t 检验来确定r 的显著性。检验统计量t 服从自由度为n-2的t 分布,即检验的步骤为:提出假设:假设样本是从一个不相关的总体中抽出的,即 H0: ;H1: 0计算检验统计量:根据给定的显著性水平和自由度df=n-2查t分布表
12、得t(n-2)的临界值,并作出决策: 若tt(n-2),拒绝H0,表明r在统计上是显著的,两变量之间存在显著线性关系;若tt(n-2),接受H0,表明r在统计上是不显著的。,相关系数的显著性检验(例题分析),【例】 对前述用例9.2数据计算的人均消费额与人均国民收入相关系数进行显著性检(0.05)提出假设:H0: ;H1: 0计算检验统计量,根据显著性水平0.05,查t分布表得临界值 t(n-2)=t0.025(13-2)=2.201 由于t=64.9809t0.025(13-2)=2.201,所以拒绝H0,接受H1,即说明人均消费金额与人均国民收入之间的相关关系显著。,相关系数的显著性检验(
13、例题分析),【例】对前述用例9.1数据计算的某大型商业银行例不良贷款与贷款余额之间的相关系数进行显著性检(0.05)提出假设:H0: ;H1: 0计算检验的统计量,3.根据显著性水平=0.05和自由度df=n-2=25-2=23查t分布表得t0.025(23)=2.0687由于t=7.5344t0.05(23)=2.0687,所以拒绝H0,说明不良贷款与贷款余额之间存在显著正线性相关关系,相关系数的显著性检验(例题分析),对前述9.1例某大型商业银行各相关系数计算检验统计量数据如下,同学们可以自行检验和分析,第二节 一元线性回归分析,一、回归分析的含义二、一元线性回归模型及其参数的估计三、回归
14、直线拟合程度的评价四、一元线性回归模型的检验,一个用Minitab做的回归方程Regression equation案例: 判断标准P0.05http:/www.pinzhi.org/thread-7745-1-1.html 什么是回归方程(Regression equation)? 如何用Minitab制作回归方程http:/www.pinzhi.org/thread-4643-1-1.html Minitab做回归方程分析时:线性一次Liner, 二次Quadratic, 三次立方Cubic的选择http:/www.pinzhi.org/thread-8238-1-1.html,一、回归分
15、析的含义,什么是回归回归是由英国著名统计学家Francis Galton在19世纪末期研究孩子及其父母的身高时提出来的。Galton发现身材高的父母,他们的孩子也高。但这些孩子平均起来并不像他们父母那样高。比较矮的父母情形也类似:他们的孩子比较矮,但这些孩子的平均身高要比他们父母的平均身高高。 Galton把这种孩子的身高向中间值靠近的趋势称之为一种回归效应,而他发展的研究两个数值变量之间数量关系的方法称为回归分析。什么是回归分析回归分析是对具有相关关系的变量拟合数学方程,通过一个或一些变量的变化解释另一变量变化的方法。,回归分析的内容和步骤,根据理论和对问题的分析判断,区分自变量(即解释变量
16、)和因变量(即被解释变量);从一组样本数据出发,设法确定合适的数学方程式(即回归模型regression model)描述变量间的关系;对数学方程式(回归模型)的可信程度进行统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著;利用数学方程式(回归模型),根据一个或几个自变量的取值来估计或预测因变量的取值,并给出这种估计或预测的精确程度。,回归分析与相关分析的区别,相关分析中,变量 x 与 y 处于平等地位;回归分析中具有相关关系的变量之间地位是非对等的,变量 y 称为因变量,处在被解释的地位,x 称为自变量,用于预测因变量的变化相关分析中所涉及的变量 x 和 y 都是
17、随机变量;回归分析中,因变量 y 是随机变量,自变量 x 可以是随机变量,也可以是非随机的确定变量相关分析主要描述变量之间相关关系的密切程度;回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行估计和预测,回归模型的类型,按涉及变量多少分为:一元回归和多元回归按变量相关的形式分:线性回归和非线性回归(本节仅讨论一元回归分析问题),二、一元线性回归模型及其参数的估计 一元线性回归模型的设定,对于只涉及一个自变量的回归分析,若因变量y与自变量x之间为线性关系,可以用一个线性方程来表示二者之间的关系,此方程为一元线性回归模型。通常先要收集若干(n)组样本数据(xi ,yi,i=
18、1,2,n),然后将数据绘制散点图,若图中显示x和y之间大致呈线性关系,就可以用一元线性回归方程来描述这种关系。,一元线性回归模型(理论模型),一元线性回归模型可表示为 y = b0 + b1 x + e此模型将变量y与x间的关系用两部分描述。一部分是由x的变化引起y线性变化的部分,即: 另一部分是由其他随机因素引起y线性变化的部分,记为。该回归模型表达了变量x与y之间密切相关、但还没有到y由x唯一确定的密切程度的关系。模型中,一般称y为被解释变量(因变量),x为解释变量(自变量)。0和1为模型的参数,又称回归系数。为随机误差项,又称随机干扰项,表示除能用 x 和 y 之间线性关系解释的因素外
19、的其他随机因素对 y 的影响。,一元线性回归模型(理论模型的基本假定),误差项是一个不可观测的且期望值为0的随机变量,即E()=0。对于一个给定的x值,y的期望值为 E ( y ) = 0+ 1 x对于所有的 x 值,的方差2都相同。误差项是一个服从正态分布的随机变量,且相互独立,即N( 0 ,2 )独立性意味着对于一个特定的 x 值,它所对应的与其他 x 值所对应的不相关对于一个特定的 x 值,它所对应的 y 值与其他 x 所对应的 y 值也不相关,一元线性回归模型(应用模型) (估计的回归方程estimated regression equation ),由于为随机因素不可观测,其期望值为
20、0,所以通常用y的数学期望E ( y ) 作为y的估计,即 E( y ) = 0+ 1 x由于总体回归参数0和1是未知的,必须利用样本数据估计,所以用样本统计量 和 代替回归方程中的未知参数0和1,就得到了应用的估计一元线性回归方程 式中: 是y的估计值,表示对于一个给定的x值,估计的y的期望值, 是估计的回归直线在y轴上的截距,是当 x=0 时 y的期望值, 是直线的斜率,表示x每变动一个单位时,y的平均变动值,一元线性回归模型参数的估计,用来估计一元线性回归模型参数0和1的方法是最小二乘法,其要点为:它是使因变量的观察值与估计值之间的离差平方和达到最小来求得 和 的方法。即用此法拟合的直线
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归 分析 方程 变量 相互关系 课件

链接地址:https://www.31ppt.com/p-1486272.html