相关分析与回归分析(含SPSS)课件.ppt
《相关分析与回归分析(含SPSS)课件.ppt》由会员分享,可在线阅读,更多相关《相关分析与回归分析(含SPSS)课件.ppt(72页珍藏版)》请在三一办公上搜索。
1、.,1,第七章 相关分析与回归分析,.,2,本章内容,第一节 相关分析第二节 线性回归分析 第三节 曲线估计,.,3,第一节 相关分析,一、相关分析的概念与类型(一)相关分析的基本概念 相关关系是指变量之间存在的不确定的依存关系,即当一个变量取一定值时,另一变量无法依确定的函数取唯一确定的值,然而它仍按某种规律在一定的范围内变化。,.,4,(二)相关关系的类型 1、按相关关系的程度,分为完全相关、不完全相关和零相关。 2、按相关变量的变化方向,分为正相关和负相关。 3、按相关关系的表现形式,分为线性相关和曲线相关。 4、按变量多少,分为单相关、复相关和偏相关。 5、按相关性质,分为“真实相关”
2、和“虚假相关” 绘制散点图和计算相关系数是相关分析最常用的工具,它们的相互结合能够达到较为理想的分析效果。,.,5,二、散点图 (一)散点图的特点 绘制散点图是相关分析过程中极为常用且非常直观的分析方法,它将数据以点的形式画在直角平面上。通过观察散点图可以比较直观地看出变量之间的相关关系以及它们的强弱程度和数据的可能走向。通常橄榄球和棒状代表了数据对的主要结构和特征,可以利用曲线将这种主要结构的轮廓描述出来,使数据的主要特征更突显。,.,6,(二)散点图在SPSS中的实现 1、建立或打开数据文件后,进入“Graphs” “Legacy Dialogs”“Scatter/Dot”主对话框,如图7
3、-1所示。图7-1 散点图主对话框,.,7,2、选择散点图的类型。SPSS中提供了四种散点图,分别是简单散点图(Simple)、重叠散点图(Overlay)、矩阵散点图(Matrix)和三维散点图(3-D)。 3、根据所选择的散点图的类型,按Define按钮对散点图作具体定义。不同类型的散点图其具体的定义选项略有差别。,.,8,三、相关系数(一)相关系数的概念和分析步骤 相关系数能够以数字的方式准确描述变量间的线性关系程度和方向。 相关系数的分析步骤: 1、计算样本相关系数 对不同类型的变量应采用不同的相关系数指标,但它们的取值范围和含义都是相同的,即相关系数 没有单位,其值在-1+1 之间。
4、,.,9,2、对样本来自的两总体是否存在显著的线性关系进行推断。 (1)提出原假设:总体中两个变量间的相关系数为0,即两总体无显著的线性相关关系。 (2)选择检验统计量。对不同类型的变量应采用不同的相关系数,对应也应采用不同的检验统计量。 (3)计算检验统计量的观测值和相伴概率 值。 (4)给定显著性水平 ,并作出决策。如果相伴概率值小于或等于给定的显著性水平,则拒绝原假设;如果相伴概率值大于给定的显著性水平,则不能拒绝原假设。,.,10,(二)相关系数的种类 1、Pearson 简单相关系数 Pearson 简单相关系数用来度量定距型变量间的线性相关关系,它的数学定义为: (7.1) Pea
5、rson 简单相关系数的检验统计量为统计量,其数学定义为: (7.2) SPSS将自动计算Pearson 简单相关系数、检验统计量的观察值和对应的概率值。,.,11,2、Spearman等级相关系数 Spearman等级相关系数用来度量定序变量间的线性相关关系,设计思想与Pearson简单相关系数相同,只是数据为非定距的,故计算时并不直接采用原始数据 ,而是利用数据的秩,用两变量的秩 代替 代入Pearson简单相关系数计算公式中,于是其中的 和 的取值范围被限制在1和 之间,且可被简化为:式中:,.,12,如果两变量的正相关性较强,它们秩的变化具有同步性,于是 的值较小,r趋向于1; 如果两
6、变量的正相关性较弱,它们秩的变化不具有同步性,于是 的值较大,r趋向于0; 在小样本下,在零假设成立时, Spearman等级相关系数服从Spearman分布;在大样本下, Spearman等级相关系数的检验统计量为Z统计量,定义为: Z统计量近似服从标准正态分布。 SPSS将自动计算Spearman等级相关系数, 检验统计量的观察值和相伴概率 值。,.,13,3、Kendall 相关系数 Kendall 相关采用非参数检验方法用来度量定序变量间的线性相关关系。它利用变量秩数据计算一致对数目 和非一致对数目 。 Kendall 相关正是要对此进行检验。Kendall 统计量的数学定义为 (7.
7、5) 在小样本下Kendall 服从Kendall分布。在大样本下采用的检验统计量为 (7.6) 在公式(7.6)中, 统计量近似服从标准正态分布。SPSS将自动计算Kendall 相关、 检验统计量的观测值和相伴概率 值。,.,14,(三)相关系数在SPSS中的实现 1、建立或打开数据文件后,进入AnalyzeCorrelateBivariate主对话框,如图7-4所示。图7-4 相关分析主对话框,.,15,2、选择参加计算相关系数的变量到Variables框。 3、Correlation Coefficients分析方法选择项,有三种相关系数,如Pearson复选项、Spearman复选项
8、、Kendalls tau-b 复选项,对应于三种分析方法。 4、Test of Significance选择显著性检验类型。Two tailed 双尾检验选项,One tailed 单尾检验选项。 5、Flag significant Correlations 复选项,如果选中此项,输出结果中除显示统计检验的概率 值以外,还输出星号标记,相关系数右上方使用“*”表示显著水平为5%;用“*”表示其显著水平为1%。,.,16,6、Options 对话框中的选择项 在相关分析主对话框中单击“Options”按钮,展开Options 对话框,如图7-5所示。图7-5 Options 对话框,.,17
9、,(1)Statistics选择项中有两个有关统计量的选择项: Means and standard deviations复选项,要求计算并输出均值与标准差; Cross-product deviations and covariances复选项,要求计算并输出叉积离差阵和协方差阵。 (2)Missing Values选择项中有两个关于缺失值处理方法的选择项: Exclude cases pairwise选项,仅剔除正在参与计算的两个变量值是缺失值的观测量。 Exclude cases listwise选项,剔除带有缺失值的所有观测量。,.,18,四、偏相关分析(一) 偏相关分析和偏相关系数
10、偏相关分析也称净相关分析,它在控制其他变量的线性影响的条件下分析两变量间的线性相关性,所采用的工具是偏相关系数(净相关系数)。 偏相关分析的主要用途是根据观测资料应用偏相关分析计算偏相关系数,可以判断哪些解释变量对被解释变量的影响较大,而选择作为必须考虑的解释变量。这样在计算多元回归分析时,只要保留起主要作用的解释变量,用较少的解释变量描述被解释变量的平均变动量。,.,19,利用偏相关系数进行变量间相关分析通常需要完成以下两大步骤: 1、计算样本的偏相关系数。 在分析变量 和 之间的净相关时,当控制了 的线性作用后, 和 之间的一阶偏相关系数定义为 (7.7)偏相关系数的取值范围及大小含义与相
11、关系数相同。,.,20,2、对样本来自的两总体是否存在显著的偏相关进行推断。 (1)提出原假设:两总体的偏相关系数与零无显著差异。 (2)选择检验统计量。偏相关系数的检验统计量为 统计量。 (3)计算检验统计量的观测值和相伴概率 。 (4)给定显著性水平 ,并作出决策。如果相伴概率值小于或等于给定的显著性水平,则拒绝原假设;如果相伴概率值大于给定的显著性水平,则不能拒绝原假设。,.,21,(二)偏相关系数在SPSS中的实现 1、建立或打开数据文件后,进入Analyze Correlate Partial主对话框,如图7-6所示。图7-6 偏相关分析主对话框,.,22,2、选择分析变量送入Val
12、iables框,选择控制变量进入Controlling for框。 3、在Test of Significance 栏中选择输出偏相关检验的双尾(Two-tailed)概率 值还是单尾(One-tailed)概率 值。 4、选择Display actual significance level复选项,表示显示相关系数的同时,显示实际的显著性概率。不选择此项,其显著性概率使用星号“*”来代替。,.,23,5、在偏相关分析主对话框中单击“Options”按钮,进入Options 对话框,如图7-7所示。图7-7 偏相关分析的选项对话框,.,24,(1)Statistics 统计量选择项,有两个选项
13、: Means and standard deviations 复选项,要求SPSS计算并显示各分析变量的均值和标准差。Zero-order correlations 复选项,要求显示零阶相关矩阵,即Pearson 相关矩阵。 (2)Missing Values 处理缺失值观测量的选择项。,.,25,第二节 线性回归分析,(一)回归分析的概念和一般步骤 1、回归分析的概念 回归分析是指根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的平均变化关系。回归分析不仅可以提供变量之间相关关系的数学表达式,而且还可以利用所得的经验公式,根据一个或几个变量的值,预测或控制另一个变量的值,
14、并且可以知道这种预测和控制可达到什么样的精确程度。另外,还可以进行因素分析。因此,回归分析是一种应用极为广泛的数量分析方法。,.,26,2、回归分析的一般步骤 (1)确定回归方程中的解释变量(自变量)和被解释变量(因变量)。 (2)确定回归模型。 (3)建立回归方程。 (4)对回归方程进行各种检验。 (5)利用回归方程进行预测。 利用SPSS进行回归分析时,应重点关注上述过程中第一步和最后一步,至于中间各步,SPSS会自动进行计算并给出最佳的模型。,.,27,(二)线性回归模型1、一元线性回归模型一元线性回归模型是指只有一个解释变量的线性回归模型,用于揭示被解释变量与另一个解释变量之间的线性关
15、系。数学模型是: (7.9) 式(7.9)中 为解释变量; 为被解释变量; 为截距,即常量; 为回归系数,表明解释变量对被解释变量的影响程度; 为随机误差。公式表明:被解释变量的变化可由两部分来解释,第一部分由解释变量的变化引起的 的线性变化部分;第二部分由其他随机因素引起的 的变化部分。,.,28,用最小二乘法求解方程中的两个参数,得到:,.,29,2、多元线性回归方程多元线性回归方程是指含有多个解释变量的线性回归模式,用于揭示被解释变量与其他多个解释变量之间的线性关系。数学模型为: (7.12) 式(7.12)是一个 元线性回归模型,其中有 个解释变量。 、 、 、 分别称为回归常数和偏回
16、归系数,为随机误差。公式表明:被解释变量的变化可由两部分来解释,第一部分由 个解释变量变化引起的 的线性变化部分;第二部分由其他随机因素引起的 的变化部分。,、,.,30,(三)线性回归方程的假设理论 德国数学家高斯提出5 个假设理论,即正态性假设、等方差假设、独立性假设、无自相关性假设、 与 的不相关性。满足这些假设的线性回归模型称为古典线性模型: (四)线性回归分析的数据要求 1、解释变量与被解释变量应该是数值型变量,分类变量应重新编码为哑变量或其他类型的对比变量。 2、被解释变量的分布必须是正态的,被解释变量的方差分布必须是一个常数。被解释变量和每一个解释变量变量的关系必须是线性关系,所
17、有的观察量必须是相互独立的。,.,31,二、线性回归方程的统计检验(一)回归方程的拟合优度检验 回归方程的拟合优度检验就是要检验样本数据点聚集在回归直线周围的密集程度,从而评价回归方程对样本数据的代表程度。我们知道,被解释变量各个观察值之间的差异主要是由解释变量的不同取值和其他因素造成的。用公式表示为: (7.13) (7.14) 从式(7.14)中可以看出,当所有样本点都落在回归直线上,回归方程的拟合优度一定是最高的。拟合优度的统计量正是基于这种基本思想构造出来的。,.,32,1、一元线性回归方程的拟合优度检验 在判定一个线性回归直线的拟合优度的好坏时,判定系数系数是一个重要的判定指标。判定
18、系数等于回归平方和在总平方和中所占的比率,即体现了回归模型所能解释的被解释变量变异性的百分比。计算公式为: = (7.15),.,33,2、多元线性回归方程的拟合优度检验 在多元线性回归方程中采用调整的 作为拟合优度检验指标,计算公式为:Adjusted = (7.16),.,34,(二)回归方程的显著性检验 回归方程的显著性检验是检验被解释变量与所有解释变量之间的线性关系是否显著,是否可以用线性模型来描述被解释变量和解释变量之间的关系。 回归方程显著性检验的基本出发点与拟合优度检验非常相识。,.,35,1、一元线性回归方程的显著性检验 一元线性回归方程显著性检验的原假设是:回归系数与零无显著
19、差异。 一元线性回归方程显著性检验采用 统计量,计算公式为: (7.17) SPSS将自动计算 统计量及相伴概率 值。如果相伴概率值小于或等于给定的显著性水平 ,则拒绝原假设;如果相伴概率值大于给定的显著性水平,则不能拒绝原假设。,.,36,2、多元线性回归方程的显著性检验多元线性回归方程显著性检验的原假设是:所有偏回归系数同时与零无显著差异。 多元线性回归方程显著性检验采用 统计量,计算公式为: SPSS将自动计算 统计量及相伴概率 值。如果相伴概率值小于或等于给定的显著性水平 ,则拒绝原假设;如果相伴概率值大于给定的显著性水平,则不能拒绝原假设。,.,37,通过上面的分析不难发现,回归方程
20、的显著性检验和回归方程的拟合优度检验有异曲同工之处。回归方程的拟合优度越高,回归方程的显著性检验也会越显著。但应注意的是,回归方程的拟合优度检验实质上并非统计学的统计检验问题,它不涉及统计检验的一系列步骤,因此,回归方程的拟合优度检验本质上仅仅是一种刻画性的描述,不涉及对解释变量和被解释变量总体线性关系的推断,而这恰恰是回归方程显著性检验所要实现的目标。,.,38,(三)回归系数的显著性检验 回归系数的显著性检验的主要目的是研究回归方程中的每个解释变量与被解释变量之间是否存在显著的线性关系,也就是研究每个解释变量能否有效地解释被解释变量的线性关系,它们能否应保留在线性回归方程中。 回归系数显著
21、性检验是围绕回归系数(或偏回归系数)估计值的抽样分布展开的,由此构造服从某种理论分布的检验统计量,并进行检验。,.,39,1、一元线性回归方程的回归系数显著性检验 一元线性回归方程的回归系数显著性检验的原假设是:回归系数与零无显著差异。 回归系数显著性检验一般采用 检验的方法,其计算公式为: (7.19) SPSS在自动计算回归系数的 值后,会给出相伴概率值。如果相伴概率值小于或等于给定的显著性水平 ,则拒绝原假设;如果相伴概率值大于给定的显著性水平,则不能拒绝原假设。,.,40,2、多元线性回归方程的回归系数显著性检验 一元线性回归方程的回归系数显著性检验的原假设是:第 个偏回归系数与零无显
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 相关 分析 回归 SPSS 课件

链接地址:https://www.31ppt.com/p-1823284.html