统计学-相关与回归分析.ppt
第4章 相关分析与回归分析,第4章 相关分析与回归分析,主要内容:4.1 相关分析的基本问题4.2 相关系数的计算4.3 回归分析的基本问题4.4 简单线性回归分析4.5 多元线性回归分析4.6 非线性回归分析,第4章 相关分析与回归分析 4.1 相关分析的基本问题,1.函数关系2.相关关系(1)相关关系是指现象之间确实存在数量上的相互依存关系。(2)现象之间数量依存关系的具体关系值不是固定的。,4.1.1 变量之间的关系,(1)确定现象之间有无相关关系,以及相关关系的表现形式。(2)确定相关关系的密切程度。(3)选择合适的数学模型。(4)测定变量估计值的可靠程度。(5)对计算出的相关系数,进行显著检验。,第4章 相关分析与回归分析 4.1 相关分析的基本问题,3.相关分析的主要内容,按所研究的变量多少可分为简单(单)相关、复相关和偏相关。(单相关的正相关与负相关)按相关的形式可分为线性相关和非线性相关。按相关的程度可分为完全相关、不完全相关和不相关。,第4章 相关分析与回归分析 4.1 相关分析的基本问题,4.1.2 相关关系的分类,1、相关表和相关图,第4章 相关分析与回归分析 4.1 相关分析的基本问题,4.1.3 相关关系的测度,1、相关表和相关图,第4章 相关分析与回归分析 4.1 相关分析的基本问题,4.1.3 相关关系的测度,相关系数是用来说明变量之间在直线相关条件下相关关系密切程度和方向的统计分析指标。相关程度的大小与计量单位无关,所以相关系数是无量纲的数量。,2、相关系数,第4章 相关分析与回归分析 4.1 相关分析的基本问题,4.1.3 相关关系的测度,设变量x,y的n对观测值为(x1,y1),(xn,yn),皮尔逊相关系数为,第4章 相关分析与回归分析 4.2 相关系数的计算,4.2.1 简单线性相关系数皮尔逊相关系数,第4章 相关分析与回归分析 4.2 相关系数的计算,4.2.1 简单线性相关系数皮尔逊相关系数,第4章 相关分析与回归分析 4.2 相关系数的计算,4.2.1 简单线性相关系数皮尔逊相关系数的意义,1、定等级。将变量x,y的观测值按照顺序定出等级,形成两个序数数列,如果有相等的数值时,则按原有的等级求其平均数,作为这些观测值的等级。例如,某公司6位员工按学历高低排列分别为:硕士、本科、本科、本科、专科、专科。其中3个本科原来应该列为第2、3、4等级,平均数为3,2个专科原来应该列为第5、6等级,平均数为5.5,因此这6个人的学历等级可以定为:1、3、3、3、5.5、5.5。,第4章 相关分析与回归分析 4.2 相关系数的计算,4.2.2 等级相关系数斯皮尔曼相关系数,计算步骤:,2、计算x和y两个序数数列的每对观测值的等级之差,记作D,D=x-y;3、按下述公式计算相关系数:,第4章 相关分析与回归分析 4.2 相关系数的计算,4.2.2 等级相关系数斯皮尔曼相关系数,计算步骤:,第4章 相关分析与回归分析 4.2 相关系数的计算,4.2.2 等级相关系数斯皮尔曼相关系数,例题:,回归分析的概念回归分析的特点回归分析的类型 相关分析与回归分析(1)描述的方式不同(2)变量的地位不同(3)描述的内容不同(4)变量的性质不同,第4章 相关分析与回归分析 4.3 回归分析的基本问题,第4章 相关分析与回归分析 4.4 简单线性回归分析,4.4.1 总体回归模型例:某城市某月家庭可支配收入和消费支出数据(元),第4章 相关分析与回归分析 4.4 简单线性回归分析,4.4.1 总体回归模型,第4章 相关分析与回归分析 4.4 简单线性回归分析,4.4.1 总体回归模型,第4章 相关分析与回归分析 4.4 简单线性回归分析,4.4.1 总体回归模型,第4章 相关分析与回归分析 4.4 简单线性回归分析,4.4.1 总体回归模型,条件期望表现形式:,个别值表现形式:,4.4.2 样本回归模型和基本假设,第4章 相关分析与回归分析 4.4 简单线性回归分析,4.4.3 回归模型的参数估计,第4章 相关分析与回归分析 4.4 简单线性回归分析,设变量x,y的n对观测值为(x1,y1),(xn,yn).,参数的估计通常采用最小二乘法,第4章 相关分析与回归分析 4.4 简单线性回归分析,例1:,第4章 相关分析与回归分析 4.4 简单线性回归分析,例1:,第4章 相关分析与回归分析 4.4 简单线性回归分析,例1:,第4章 相关分析与回归分析 4.4 简单线性回归分析,例1:,一元线性回归模型为:,以上模型表明,家庭收入每增加1千元,消费支出平均增加0.402千元。,第4章 相关分析与回归分析 4.4 简单线性回归分析,4.4.4 回归模型的检验,1、拟合优度的度量 可决系数(判定系数),第4章 相关分析与回归分析 4.4 简单线性回归分析,4.4.4 回归模型的检验,1、拟合优度的度量 可决系数(判定系数),第4章 相关分析与回归分析 4.4 简单线性回归分析,4.4.4 回归模型的检验,2 回归方程的显著性检验,第一步:提出假设,第二步:计算检验统计量F,第三步:确定显著性水平以及临界值F,第四步:做出判断,第4章 相关分析与回归分析 4.4 简单线性回归分析,4.4.4 回归模型的检验,2 回归方程的显著性检验,第4章 相关分析与回归分析 4.4 简单线性回归分析,简单线性回归的应用之一预测,第4章 相关分析与回归分析 4.多元线性回归分析,总体回归模型和样本回归函数,(j=1,2,n),多元线性回归的基本假设和参数估计 多元线性回归模型的检验4.5.4 多元线性回归变量的筛选,第4章 相关分析与回归分析 4.多元线性回归分析,例:铝合金化学铣切工艺中,需要对腐蚀速度进行控制,因此要考察腐蚀温度x1,碱浓度x2,腐蚀液含铝量x3,对腐蚀速度y的影响,一共做了44次试验,所得数据表如下:,第4章 相关分析与回归分析 4.多元线性回归分析,第4章 相关分析与回归分析 4.多元线性回归分析,第4章 相关分析与回归分析 4.非线性回归分析,举例,人均消费支出与教育支出数据表,第4章 相关分析与回归分析 4.非线性回归分析举例,