第八章相关与回归分析ppt课件.ppt
《第八章相关与回归分析ppt课件.ppt》由会员分享,可在线阅读,更多相关《第八章相关与回归分析ppt课件.ppt(114页珍藏版)》请在三一办公上搜索。
1、2023/6/25,版权所有 BY 统计学课程组,1,第八章 相关与回归分析,第一节 相关分析第二节 一元线性回归分析第三节 多元线性回归分析第四节 非线性回归分析,2023/6/25,版权所有 BY 统计学课程组,2,本章重点,相关与回归分析概念、种类、相关关系与函数关系、相关关系与因果关系的联系。相关分析与回归分析的区别与联系。直线相关系数的涵义、计算与分析。直线回归方程的确定与精确度的评价。回归方程的应用。,2023/6/25,版权所有 BY 统计学课程组,3,本章难点,直线相关系数的涵义、计算与分析。直线回归方程的确定与精确度的评价。参数估计的理论方法,如最小二乘法的基本原理等。参数估
2、计的显著性检验及拟合优度的检验的基本理论。非线性回归的转化问题。,2023/6/25,版权所有 BY 统计学课程组,4,学习目标,通过本章的学习,要明确相关与回归分析的概念、意义和种类;了解相关关系与函数关系的区别、相关分析与回归分析的联系与区别;掌握相关分析的特点和方法、进而掌握回归分析的方法;理解进行相关与回归分析应注意的问题。,2023/6/25,版权所有 BY 统计学课程组,5,第一节 相关分析,一、相关关系与函数关系二、相关关系的种类三、相关分析与回归分析四、相关关系的测度,2023/6/25,版权所有 BY 统计学课程组,6,一、相关关系与函数关系,客观现象之间的数量联系可以归纳为
3、两种不同的类型,一种是函数关系,另一种是相关关系。函数关系是指变量之间存在的严格确定的依存关系,即当一个或几个相互联系的自变量取一定的值时,因变量必定有一个且只有一个确定的值与之对应。相关关系是指变量之间客观存在的非严格确定的依存关系,即当一个或几个相互联系的自变量取一定的数值时,与之对应的因变量往往会出现几个不同的值,但这些数值会按某种规律在一定范围内变化。,2023/6/25,版权所有 BY 统计学课程组,7,二、相关关系的种类,(一)按变量多少划分按相关关系涉及变量的多少可分为单相关、复相关和偏相关。两个现象的相关,即一个变量对另一个变量的相关关系,称为单相关。当所研究的是一个变量对两个
4、或两个以上其他变量的相关关系时,称为复相关。,2023/6/25,版权所有 BY 统计学课程组,8,相关关系的种类,(二)按相关程度划分按变量之间相关关系的密切程度不同,可分为完全相关、不完全相关和不相关。当一种现象的数量变化完全由另一个现象的数量变化所确定时,称这两种现象间的关系为完全相关。当两个现象彼此互不影响,其数量变化各自独立时,称为不相关现象。两个现象之间的关系介于完全相关和不相关之间,称为不完全相关,一般的相关现象都是指这种不完全相关。,2023/6/25,版权所有 BY 统计学课程组,9,相关关系的种类,(三)按相关形式划分按相关关系的表现形态不同可分为线性相关和非线性相关。当两
5、种相关现象之间的相关关系在直角坐标系中近似地表现为一条直线时,称之为线性相关。如果两种相关现象之间,在图上并不表现为直线形式而是表现为某种曲线形式时,则称这种相关关系为非线性相关。,2023/6/25,版权所有 BY 统计学课程组,10,相关关系的种类,(四)按相关方向划分线性相关中按相关的方向可分为正相关和负相关。当一个现象的数量由小变大,另一个现象的数量也相应由小变大,这种相关称为正相关。当一个现象的数量由小变大,而另一个现象的数量相反地由大变小,这种相关称为负相关。,2023/6/25,版权所有 BY 统计学课程组,11,相关关系的种类,(五)按相关性质划分按相关的性质可分为“真实相关”
6、和“虚假相关”。当两种现象之间的相关确实具有内在的联系时,称之为“真实相关”。当两种现象之间的相关只是表面存在,实质上并没有内在的联系时,称之为虚假相关。,2023/6/25,版权所有 BY 统计学课程组,12,三、相关分析与回归分析,相关分析是指研究一个变量与另一个变量或另一组变量之间相关方向和相关密切程度的统计分析方法。回归分析是指根据相关关系的具体形态,选择一个合适的数学模型来近似地表达变量间平均变化关系的统计分析方法。,2023/6/25,版权所有 BY 统计学课程组,13,相关分析与回归分析的联系,相关分析和回归分析是研究现象之间相关关系的两种基本方法,两者有着密切的联系,它们不仅具
7、有共同的研究对象,而且在具体应用时,常常必须互相补充。相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度。只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。由于上述原因,回归分析和相关分析在一些统计学的书籍中被合称为相关关系分析或广义的相关分析。,2023/6/25,版权所有 BY 统计学课程组,14,相关分析与回归分析的区别,(1)相关分析中,变量x与变量y处于平等地位,不需要区分自变量和因变量;回归分析中,变量y称为因变量,处在被解释的特殊地位。变量x称为自变量,可以通过x的变化来解释y的变化,故亦称为解释
8、变量。(2)相关分析中所涉及的变量y与x全是随机变量。而回归分析中,因变量y是随机变量,自变量x 可以是随机变量,也可以是非随机的确定变量。(3)相关分析的研究主要是刻画两类变量间线性相关的密切程度。而回归分析不仅可以揭示变量x对变量y的影响大小,还可以由回归方程进行预测和控制。,2023/6/25,版权所有 BY 统计学课程组,15,四、相关关系的测度,测度相关关系的方式有三种,相关表相关图相关系数,2023/6/25,版权所有 BY 统计学课程组,16,(一)相关表和相关图,相关表是一种反映变量之间相关关系的统计表。将某一变量按其取值的大小排列,然后再将与其相关的另一变量的对应值平行排列,
9、便可得到简单的相关表。【例8.1】要求:根据本章案例表8.1中的数据绘制2005年中国城镇居民年人均可支配收入和年人均消费性支出之间的相关图。(P216),2023/6/25,版权所有 BY 统计学课程组,17,从下图可以看出,居民的消费支出和可支配收入之间呈现正线性相关关系,(二)相关系数(P223)(correlation coefficient),1.概念:对变量之间关系密切程度的度量对两个变量之间线性相关程度的度量称为简单相关系数若相关系数是根据总体全部数据计算的,称为总体相关系数,记为若是根据样本数据计算的,则称为样本相关系数,记为 r,2.相关系数的计算公式(记住P223),样本相
10、关系数的计算公式,或化简为,3.相关系数取值及其意义,r 的取值范围是-1,1|r|=1,为完全相关r=1,为完全正相关r=-1,为完全负正相关 r=0,不存在线性相关关系-1r0,为负相关 0r1,为正相关|r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切,相关系数的性质,2023/6/25,版权所有 BY 统计学课程组,21,相关系数取值范围与直观意义,r=1,完全正相关,r=1,完全负相关,2023/6/25,版权所有 BY 统计学课程组,22,相关系数取值范围与直观意义,-1r0,不完全相关,0r1,不完全相关,主要研究对象,2023/6/25,版权所有 BY 统计学课程组,
11、23,相关系数取值范围与直观意义,X和Y 都是相互对称的随机变量;线性相关系数只反映变量间的线性相关程度,不能说明非线性相关关系;样本相关系数是总体相关系数的样本估计值,由于抽样随机性,样本相关系数是个随机变量,其统计显著性有待检验;相关系数只能反映线性相关程度,不能确定因果关系,不能说明相关关系具体接近哪条直线。,使用相关系数时应注意:,相关系数的检验p226,检验两个变量之间是否存在线性相关关系等价于对回归系数 b1的检验采用R.A.Fisher提出的 t 检验检验的步骤为提出假设:H0:;H1:0,计算检验的统计量:,确定显著性水平,并作出决策 若 t t,拒绝H0 若 t t,不能拒绝
12、H0,2023/6/25,版权所有 BY 统计学课程组,26,第二节 一元线性回归分析(P227),一、一元线性回归模型的基本形式二、一元线性回归模型的估计三、回归方程的显著性检验四、回归模型的应用五、统计软件SPSS应用,回归模型的类型,一元线性回归含义,涉及一个自变量的回归因变量y与自变量x之间为线性关系被预测或被解释的变量称为因变量(dependent variable),用y表示用来预测或用来解释因变量的一个或多个变量称为自变量(independent variable),用x表示 因变量与自变量之间的关系用一个线性方程来表示,一.一元线性回归模型的基本形式,描述因变量 y 如何依赖于
13、自变量 x 和误差项 的方程称为理论回归模型一元线性回归模型可表示为 y=b0+b1 x+ey 是 x 的线性函数(部分)加上随机误差项线性部分反映了由于 x 的变化而引起的 y 的变化误差项 是随机变量(未纳入模型但对y有影响的诸多因素的综合影响)反映了除 x 和 y 之间的线性关系之外的随机因对 y 的影响是不能由 x 和 y 之间的线性关系所解释的变异性0 和 1 称为模型的参数,理论回归模型,回归模型的基本假设 p229,假设1:误差项的期望值为0,即对所有的i有假设2:误差项的方差为常数,即对所有的i有假设3:误差项之间不存在自相关关系,其协方差为0,即当 时,有;假设4:自变量是给
14、定的变量,与随机误差项线性无关;假设5:随机误差项服从正态分布。以上这些基本假设是德国数学家高斯最早提出的,故也称为高斯假定或标准假定。,一元线性回归模型基本假定,自变量x 取值是非随机的,y 是随机变量误差项是一个期望值为0的随机变量,即E()=0。对于一个给定的 x 值,y 的期望值为 E(y)=0+1 x对于所有的 x 值,的方差2 都相同误差项是一个服从正态分布的随机变量,且相互独立。即N(0,2)独立性意味着对于一个特定的 x 值,它所对应的与其他 x 值所对应的不相关,2023/6/25,32,.回归方程(regression equation),描述 y 的期望值如何依赖于 x
15、的方程称为回归方程一元线性回归方程的形式如下 E(y)=0+1 x,方程的图示是一条直线,也称为直线回归方程0是回归直线在 y 轴上的截距,是当 x=0 时 y 的期望值1是直线的斜率,称为回归系数,表示当 x 每变动一个单位时,y 的平均变动值,举例:假如已知100个家庭构成的总体,总体回归函数,在抽样中,自变量x的取值是固定的,即x是非随机的;因变量y是随机的。即当解释变量X取某固定值时,Y的值不确定,Y的不同取值形成一定的分布,这是Y的条件分布。回归线,描述的是Y的条件期望E(Y/xi)与之对应xi,代表这些Y的条件期望的点的轨迹所形成的直线或曲线。如注意:由于单个数据点是从y的分布中抽
16、出来的,可能不在这条回归线上,因此必须包含随机误差项e来描述模型数据点,注意:假定,x,E(y)=0+1 x,y,回归线,2023/6/25,35,.估计的回归方程(estimated regression equation),一元线性回归中估计的回归方程为,用样本统计量 代替回归方程中的未知参数 和,就得到了估计的回归方程,总体回归参数 和 是 未知的,必须利用样本数据去估计,其中:是估计的回归直线在 y 轴上的截距,是直线的斜率,它表示对于一个给定的 x 的值,是 y 的估计值,也表示 x 每变动一个单位时,y 的平均变动值,一般情况下,在研究某个实际问题时,对于获得的n组样本观测值来说,
17、如果它们符合总体回归模型,则,二、一元线性回归模型的估计 p229,(一)参数的最小二乘估计,.参数的最小二乘(平方)法的估计(ordinary least squares estimators),使因变量的观察值与估计值之间的离差平方和达到最小来求得 和 的方法。即,用最小平方法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线的误差都小,2023/6/25,版权所有 BY 统计学课程组,39,参数的最小二乘估计,2023/6/25,版权所有 BY 统计学课程组,40,参数的最小二乘估计,记住啦p230,2023/6/25,版权所有 BY 统计学课程组,41,参数的最小二乘估计,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第八 相关 回归 分析 ppt 课件
链接地址:https://www.31ppt.com/p-5315771.html