统计学第九章相关分析.ppt
1,第九章 相关回归分析,教学目的与要求,相关分析是研究变量之间相互关系的密切程度和相互联系方式的重要方法。本章详细讲述了相关分析的概念、相关关系的确定、回归方程的建立和应用等内容。通过本章的学习,要理解相关分析的有关概念,掌握计算相关系数和配合回归方程的方法,并能够结合实际资料对变量进行相关分析。,第九章 相关分析,2,本 章 主 要 内 容,第一节 相关的意义和种类,第二节 相关图表和相关系数,第三节 回归分析,第四节 估计标准误差,第九章 相关分析,3,第一节 相关的意义和种类,一、相关关系的概念,函数关系:函数关系是一种严格的依存关系,这种关系可以用y=f(x)的方程来表现。,相关关系:相关关系是一种不完全确定的随机关系。,函数关系与相关关系的联系:对具有相关关系的现象进行分析时,必须利用相应的函数关系的数学表达式来表明现象之间的相关方程式。,第九章 相关分析,4,二、相 关 的 种 类,1、按相关的程度划分,完全相关,不完全相关,不相关,2、按相关的方向划分,正相关,负相关,3、按相关的形式划分,线性相关,非线性相关,4、按影响因素的多少划分,单相关,复相关,第九章 相关分析,5,三、相关分析的主要内容:,(一)确定现象之间有无关系,以及相关关系的表现形式,(二)确定相关关系的密切程度,(三)选择合适的数学模型,(四)测量变量估计值的可靠程度,(五)对计算出的相关系数进行显著检验,第九章 相关分析,6,第二节 相关图表和相关系数,一、相 关 图 表,相关图表是相关分析的重要方法。通过相关图表可以直观地判断现象之间呈现的相关的形态和方向。,相关表,简单相关表:根据总体单位的原始资料编制的相关表p.308,分组相关表,单变量分组相关表p.309,双变量分组相关表p.310,相关图,利用直角坐标系第一象限,把自变量置于横轴上,因变量置于纵轴上,再将两变量相对应的变量值用坐标点形式描绘出来即可。P.308,第九章 相关分析,7,二、相 关 系 数,相关系数是测定变量之间相关密切程度的统计指标。,1、相关系数的计算方法:,相关系数按“积差法”计算。该方法是通过两变量与各自平均值的离差的乘积来反映两变量之间的相关程度。,积差法公式为:,计算相关系数的简化式:,第九章 相关分析,8,如果定义:,相关系数可以表示为:,第九章 相关分析,9,2、相关系数的性质,(2)相关系数的取值范围在绝对值的 之间。其值大小反映两变量之间相关的密切程度。,(1)相关系数有正负号,分别表示正相关和负 相关。,(3)相关系数,表明两变量完全相关;,表明两变量完全不相关。,(4)当计算相关系数的原始数据较多(如50项以 上)时,认为相关系数在0.3以下为无相关,0.3以上为有相关;为低度相关;为显著相关;0.8以上为高度相关。,第九章 相关分析,10,相关系数计算分析例题,1.44,4.00,9.61,14.44,25.00,17.21,51.84,64.00,207.54,3844,7396,6400,12100,13225,17424,18225,25600,104214,74.4,172.0,248.0,418.0,575.0,805.2,972.0,1280.0,4544.6,第九章 相关分析,根据计算结果可知:,则相关系数为:,说明产量和生产费用之间存在高度正相关。,第九章 相关分析,12,第三节 回 归 分 析,一、回 归 分 析 的 意 义,回归分析是对具有相关关系的两个或两个以上变量之间的数量变化的一般关系进行测定,确立一个相应的数学表达式,以便从一个已知量来推测另一个未知量,为估算预测提供一个重要的方法。,二、回 归 的 种 类,按自变量的个数分,一 元 回 归,多 元 回 归,按回归线的形态分,线 性 回 归,非线性回归,第九章 相关分析,13,三、简单线性回归方程,(一)简单线性方程式的一般形式:,(当两变量的增长比率为常数时,它们之间就呈 现为一种简单线性关系。),(二)利用简单线性回归方程进行回归分析的前提:,所分析的两个变量之间必须存在相关关系,且相关程度在显著相关以上。,(三)对两变量进行简单线性回归分析的任务:,设法在分散的、具有线性关系的相关点之间配合一条最优的直线,这条直线就是估计回归线,它表明两变量之间具体的变动关系。,第九章 相关分析,14,配合估计回归线的方程称为回归方程。,方程式为:,回归系数b的经济涵义:,当自变量变动一个单位时,因变量的平均变动值。,(四)配合直线回归方程的方法,第九章 相关分析,15,用最小平方法配合回归直线的基本思想是:,在所有的相关点中,通过数学方法配合一条较为理想的直线,这条直线必须满足两点:,2、原数列与趋势线的离差平方和为最小值。即,1、原数列与趋势线的离差之和为零。即:,配合直线回归方程的过程就是求解方程系数a、b的过程,求解a、b的方法一般采用最小平方法。,第九章 相关分析,16,通过求a、b的一阶偏导可得到求解a、b的联立方程:,解联立方程得到:,第九章 相关分析,17,根据前面例题资料配合生产费用依产量变化的回归方程:,第九章 相关分析,18,则回归方程为:,回归系数b的涵义:月产量每增加1000吨,生产费用平均增加12.9万元。,计算得到:,第九章 相关分析,19,要求:分析两变量相关密切程度,若为显著相关以上,则对两变量进行回归分析。,有某地区人均年收入与耐用消费品销售额资料如下:,第九章 相关分析,20,答案:相关系数 r=0.98 b=0.24 a=-1.13 yc=-1.13+0.24x,回归系数b的涵义:人均年收入每增加一元,耐用消 费品销售额平均增加0.24万元。,第九章 相关分析,21,四 回归系数与相关系数的关系,因为:,所以:,即:,第九章 相关分析,22,五 回归分析与相关分析的特点,1、回归分析必须区分自变量和因变量,而相关 分析不必区分。,2、回归分析的两个变量一个是自变量,一个是 因变量,通过给定自变量的值来推算因变量 的可能值;而相关分析的两个变量都是随机 变量。,3、回归分析中对于因果关系不甚明确的两个变量,可以建立两个回归方程;而相关分析只能计算 出一个相关系数。,4、一种回归方程只能做一种推算,即只能给出自 变量的值来推算因变量的值,不能逆推。,第九章 相关分析,23,第四节 估 计 标 准 误 差,一、估计标准误的涵义:,根据直线回归方程,在知道了自变量的数值情况下可以推算出因变量的数值,但是,推算出来的因变量的数值不是精确的值,它与实际值之间有差异。,估计标准误差就是用来说明回归方程推算结果的准确程度的统计分析指标,或者说是反映回归直线代表性大小的统计分析指标。,第九章 相关分析,24,二、估计标准误的计算公式:,简化公式:,(一)根据因变量实际值和估计值的离差计算p.325,(二)根据a、b两个参数值计算。称为简化公式p.326,第九章 相关分析,25,三、相关系数与估计标准误差的关系,根据方差分析的一般原理:因变量 y 的实际观察值yi总是围绕其平均数 而上下波动,所以 y 的变动可以由 来反映,称之为总变差。引起总变差的原因可以有两方面:,一个是由于自变量 x 的取值不同,使得与 x 有直线相关关系的 y 值不同。在建立回归方程:yc=a+bx,yc为 y 的估计值,x 通过方程对 y 产生影响,其影响程度可由 来表示,称其为剩余变差。,另一个是随机因素的影响,即除自变量 x 对 y 的影响外,其他随机因素所引起的 y 的变动,这种变动可以由 表示,称之为回归变差。三者关系是:,第九章 相关分析,26,+,=,由此可以推导出:,第九章 相关分析,27,因为:,所以:,第九章 相关分析,28,从这个式子可以看出,如果两个变量之间的直线相关关系十分密切,相关系数的绝对值就接近于1,这时估计标准误差的数值越接近于0,说明回归方程的代表性越高。,所以相关系数与估计标准误差的关系为:,第九章 相关分析,29,或者:,从这个式子可以看出,如果Syx越小,其在总变差中所占的比重也就越小,从而相关系数r的值就会越大,即一个代表性很好的方程,其变量之间的相关关系也一定很高。,第九章 相关分析,30,、不管自变量如何变化,因变量都不变,这种情况称为零相关。,、若两变量完全相关,则这两变量之间的关系是函数关系。,、总变差一定大于回归变差。,、在相关分析中,要求相关的两个变量都是随机变量。,、相关系数的值越大,说明相关的程度越高。,、求解一元线性回归方程中参数的常用方法是最小平方法。,一、判断对错,T,T,T,T,T,T,第九章 相关分析,31,二、单项选择题,1、现象之间相互关系的类型有:函数关系与因果关系 相关关系与函数关系 相关关系与因果关系 回归关系与因果关系,2、相关系数等于1,说明两个变量之间:完全负相关 相关程度很高 完全正相关 相关程度很低,3、估计标准误差是反映:平均数代表性指标 序时平均数代表性指标 现象之间相关关系的指标 回归直线代表性指标,4、相关分析是研究:变量之间的数量关系 变量之间的变动关系 变量之间相互关系的密切程度 变量之间的因果关系,B,C,D,C,第九章 相关分析,32,三、多项选择题,1、在相关关系中各现象之间:一定存在着严格的依存关系 存在着一定的依存关系,但不是确定的关系 存在着不明显的因果关系 存在一一对应的函数关系 存在着明显的因果关系,2、变量x值按一定数量增加时,变量y也近似地按一定数量随之增加,反之亦然。则x和y之间存在:正相关关系 负相关关系 直线相关关系 曲线相关关系 零相关,3、如果两个变量之间的相关系数为1,则这两个变量是:正相关关系 负相关关系 完全相关关系 不完全相关关系 零相关,4、相关系数值的大小是说明:两个变量的相关关系程度的高低 和估计标准误差值成正比 和估计标准误差值成反比和估计标准误差值无关系 和估计标准误差值的关系不确定,BC,AC,AC,AB,第九章 相关分析,33,1、在回归分析中,要求自变量是_,因变量是_。2、相关关系按照性质不同分为_和_。3、若估计标准误差越小,则根据回归方程式计算的估计值就越_。4、在回归方程y=a+bx中,待定参数a是_、b是_。在统计中估计待定参数最常用的方法是_。5、当变量x和y之间存在负相关时,随着变量x值的增加,变量y的值会相应_,随着变量x的减少,变量y的值会_。6、回归系数大于0,表示两变量_方向变化;回归系数小于0,表示两变量_方向变化。,四、填空题,随机的,负相关,精确,最小平方法,增加,反,第九章 相关分析,给定的,正相关,回归系数,直线的截距,减少,同,