相关分析与简单回归分析.ppt
2023/8/21,1,庄文忠 副教授世新大学行政管理学系,相关分析与简单回归分析,2023/8/21,2,课程大纲,相关分析(Correlation analysis)1.双变量相关分析(Bivariate correlations)2.偏相关分析(Partial correlations)3.距离(Distances)简单回归分析(Simple regression analysis)1.描述性分析与模型摘要 2.变异数分析表(ANOVA table)与系数 3.残差统计量与偏离值(Outliers)诊断,2023/8/21,3,什么是相关?,线性关系(liner relationship):是指两变项间的关系,大部分可以一条直线准确地来加以说明。Y=a+bX a=截距(当X=0,Y的值)b=斜率=变项的相关包括关系的方向及程度。方向指的是变项间是正向关系或负向关系;关系的程度则是指关系的大小及强度,从关系不存在到完全关系。,2023/8/21,4,双变量相关分析(Bivariate correlations),变项间经常是使用不同的测量单位,相关系数大小及方向计算可能会受到变项间不同单位所影响。但Person相关系数变是使用Z分数而能成功地克服此问题。换言之,改变X或Y的测量单位,不会改变X和Y的相关系数。Persons相关系数公式:,2023/8/21,5,关系的方向与强度,方向 r=1.00,表示完全正相关;r=0.00,表示没有关系(所有的点几乎是随机分布,无法以单一直线链接在一起);r=-1.00,表示完全负相关。强度|r|0.3,表示低度相关;0.3|r|0.7,表示高度相关;|r|0.7,表示高度相关。,例:下图中的X和Y是什么关系?,2023/8/21,7,双变量相关分析,2023/8/21,8,2023/8/21,9,偏相关分析(Partial correlations),意义:X1和Y的关系可能会受到其他变量(如X2、X3)的影响,因此,X1和Y的关系必须控制其他变量对X1和Y的影响后,再计算X1和Y的真正关系。公式:,2023/8/21,10,偏相关分析,2023/8/21,11,2023/8/21,12,距离(Distances),意义:计算两个变量之间的相似性(similarities)或相异性(dissimilarities)。再将这些相似性或距离测量结果,用于因子分析、集群分析、或多元尺度方法之类 的其他程序,以便进一步分析更复杂的数据集。极端值(outliers)对距离计算有很大的影响,必须先决定是否删除这些个案。欧几里得距离(Euclidean distance),2023/8/21,13,距离变量之间,2023/8/21,14,2023/8/21,15,简单回归分析(Simple regression analysis),回归分析和相关分析不同之处在于,回归分析假定自变量(x)是(或)至少某种程度上是依变量(y)的一个原因(cause)或预测因子(predictor)。预测方程式:,变异数分析,总变异量(Total Sum of Squares)总误差量(Sum of Squares Errors)回归解释量(Sum of Squares Regression)自由度(DF)n-1=1+n-2,2023/8/21,17,总变异量(TSS)与总误差量(SSE)的关系,2023/8/21,18,简单回归分析,2023/8/21,19,2023/8/21,20,描述性统计量,2023/8/21,21,模型摘要,2023/8/21,22,变异数分析表与系数,2023/8/21,23,偏离值与残差,2023/8/21,24,相关分析与回归分析的比较,2023/8/21,25,操作练习&提问时间,2023/8/21,26,作业:,自数据文件中找三个数字变量,利用相关分析说明这三个变量之间有何关系?以其中一个变量作为控制变量,比较另两个变量的净相关为何?以其中一个变量为依变量,另两个变量为自变量,执行两个简单回归分析,说明哪一个变量对依变量的解释力比较高?比较相关分析和简单回归分析结果是否有差异?,