单因素方差分析(详细版)课件.ppt
《单因素方差分析(详细版)课件.ppt》由会员分享,可在线阅读,更多相关《单因素方差分析(详细版)课件.ppt(75页珍藏版)》请在三一办公上搜索。
1、单因素方差分析,(One-Way ANOVA),1,t课件,1、问题与数据,有研究者认为,体力活动较多的人能更好地应对职场的压力。为了验证这一理论,某研究招募了31名受试者,测量了他们每周进行体力活动的时间(分钟),以及应对职场压力的能力。根据体力活动的时间数,受试者被分为4组:久坐组、低、中、高体力活动组,变量名为group。利用Likert量表调查的总得分来评估应对职场压力的能力,分数越高,表明应对职场压力的能力越强,变量名为coping_stress。应对职场压力的能力,可以简写为CWWS得分。研究者想知道,CWWS得分的高低是否取决于体力活动的时间,即coping_stress变量的平
2、均得分是否随着group变量的不同而不同(部分数据如右图),2,t课件,2、对问题的分析,研究者想分析不同group间的coping_stress得分差异,可以采用单因素方差分析。单因素方差分析适用于2种类型的研究设计:1)判断3个及以上独立的组间均数是否存在差异;2)判断前后变化的差值是否存在差异。使用单因素方差分析时,需要考虑6个假设。假设1:因变量为连续变量;假设2:有一个包含2个及以上分类、且组别间相互独立的自变量;假设3:每组间和组内的观测值相互独立;假设4:每组内没有明显异常值;假设5:每组内因变量符合正态分布;假设6:进行方差齐性检验,观察每组的方差是否相等。那么,进行单因素方差
3、分析时,如何考虑和处理这6项假设呢?,3,t课件,3、思维导图,4,t课件,5,t课件,4、对假设的判断,假设1:因变量为连续变量;假设2:有一个包含2个及以上分类、且组别间相独立的自变量;假设3:每组间及组内的观测值相互独立。和研究设计有关,需根据实际情况判断。,假设4:每组内没有明显异常值。如果某个组别中的某些因变量取值和其他值相比特别大或者特别小,则称之为异常值。异常值会影响该组的均数和标准差,因此会对最终的统计检验结果产生很大的负面影响。对于小样本研究,异常值的影响尤其显著,必须检查每组内是否存在明显异常值。以下将说明如何在SPSS中利用箱线图(Boxplots)检查是否存在异常值,以
4、及存在异常值时的几种处理方法。,6,t课件,(1)在主菜单点击Analyze Descriptive Statistics Explore.: 出现右图Explore对话框:,利用箱线图(Boxplots)检查是否存在异常值,以及存在异常值时的几种处理方法,7,t课件,(2)把因变量coping_stress送入Dependent List框中,把自变量group送入Factor List框中:,(3)点击Plots.,出现Explore: Plots对话框:,8,t课件,(4)在Boxplots模块内保留系统默认选项Factor levels together,在Descriptive模块内
5、取消选择Stem-and-leaf,在下方勾选Normality plots with tests(执行 Shapiro-Wilks检验):,点击Continue,返回Explore对话框。(5)在Display模块内点击Plots:,如果使用偏度和峰度(skewness and kurtosis)进行正态性判断,则保留Display模块内的默认选项Both或者选择Statistics。,(6) 点击OK,输出结果。,9,t课件,根据如下输出的箱线图,判断每个组别内是否存在异常值。,10,t课件,SPSS中将距离箱子边缘超过1.5倍箱身长度的数据点定义为异常值,以圆点表示;将距离箱子边缘超过3
6、倍箱身长度的数据点定义为极端值(极端异常值),以星号(*)表示。为容易识别,在Data View窗口异常值均用其所在行数标出。本例数据箱线图无圆点或星号,因此无异常值。假如数据中存在异常值和极端异常值,其箱线图如右:,箱线图是一种比较简单和流行的异常值检验方法,当然同样存在一些更为复杂的方法,这里不过多介绍。,11,t课件,如何处理数据中存在的异常值,异常值的处理方法分为2种:(1) 保留异常值:1)采用非参数Kruskal-Wallis H检验;2)用非最极端的值来代替极端异常值(如用第二大的值代替);3)因变量转换成其他形式;4)将异常值纳入分析,并坚信其对结果不会产生实质影响。(2) 剔
7、除异常值:直接删除异常值很简单,但却是没有办法的办法。当我们需要删掉异常值时,应报告异常值大小及其对结果的影响,最好分别报告删除异常值前后的结果。而且,应该考虑有异常值的个体是否符合研究的纳入标准。如果其不属于合格的研究对象,应将其剔除,否则会影响结果的推论。,导致数据中存在异常值的原因有3种:(1) 数据录入错误:首先应该考虑异常值是否由于数据录入错误所致。如果是,用正确值进行替换并重新进行检验;(2) 测量误差:如果不是由于数据录入错误,接下来考虑是否因为测量误差导致(如仪器故障或超过量程);(3) 真实的异常值:如果以上两种原因都不是,那最有可能是一种真实的异常数据。这种异常值不好处理,
8、但也没有理由将其当作无效值看待。目前它的处理方法比较有争议,尚没有一种特别推荐的方法。需要注意的是,如果存在多个异常值,应先把最极端的异常值去掉后,重新检查异常值情况。这是因为有时最极端异常值去掉后,其他异常值可能会回归正常。,12,t课件,如果样本量较小(50),并且对正态Q-Q图或其他图形方法的结果诠释不够有把握,推荐采用Shapiro-Wilk检验。每组自变量都会有一个Shapiro-Wilk正态性检验结果。本例结果见如下Tests of Normality表格。,假设5:每组内因变量符合正态分布,正态性检验有很多方法,这里只介绍最常用的一种:Shapiro-Wilk正态性检验(其他还有
9、偏度和峰度值、直方图等)。在假设4的判断中,我们在Explore: Plots对话框中勾选了Normality plots with tests,输出结果中会给出Shapiro-Wilk检验的结果。,如果样本量大于50,推荐使用正态Q-Q图等图形方法进行正态判断,因为当样本量较大时,Shapiro-Wilk检验会把稍稍偏离正态分布的数据也标记为有统计学差异,即数据不服从正态分布。,如果数据符合正态分布,显著性水平(蓝框中的Sig.)应该大于0.05。Shapiro-Wilk检验的无效假设是数据服从正态分布,备择假设是数据不服从正态分布。因此,如果拒绝无效假设(P0.05),表示数据不服从正态分
10、布;如果不能拒绝无效假设,则不能认为数据不服从正态分布。本例中每组正态性检验P值均大于0.05,因此不能认为每组因变量不服从正态分布。,13,t课件,假设6:进行方差齐性检验,观察每组的方差是否相等。在第五部分SPSS操作中进行判断。,如果数据不服从正态分布,可以有如下4种方法进行处理:(1) 数据转换:对转换后呈正态分布的数据进行单因素方差分析。当各组因变量的分布形状相同时,正态转换才有可能成功。对于一些常见的分布,有特定的转换形式,但是对于转换后数据的结果解释可能比较复杂。(2) 使用非参数检验:可以使用Kruskal-Wallis H检验等非参数检验方法,但是要注意Kruskal-Wal
11、lis H检验和单因素方差分析的无效假设和备择假设不太一致。(3) 直接进行分析:由于单因素方差分析对于偏离正态分布比较稳健,尤其是在各组样本量相等或近似相等的情况下,而且非正态分布实质上并不影响犯I型错误的概率。因此可以直接进行检验,但是结果中仍需报告对正态分布的偏离。(4) 检验结果的比较:将转换后和未转换的原始数据分别进行单因素方差分析,如果二者结论相同,则再对未转换的原始数据进行分析。,14,t课件,(1)点击Analyze Compare Means One-Way ANOVA:,5、SPSS操作,出现One-Way ANOVA对话框:,5.1 单因素方差分析(ONEWAY proc
12、edure)事后两两比较(post hoc test),15,t课件,(2)把因变量coping_stress送入Dependent List框中,自变量group送入Factor框中:,(3)点击Options,出现One-Way ANOVA: Options对话框:,16,t课件,(4)在Statistics模块勾选Descriptive,Homogeneity of variance test和Welch,同时勾选Means plot:,(5) 点击Continue,返回One-Way ANOVA对话框。,17,t课件,(6)点击Post Hoc,出现One-Way ANOVA: Pos
13、t Hoc Multiple Comparisons对话框:,对话框根据方差齐性检验的假设是否满足,分为2个主要区域:,18,t课件,(7)在Equal Variances Assumed模块内勾选Tukey,在Equal Variances Not Assumed模块内勾选Games-Howell:,(8) 可以在Significance level框中修改显著性水平的大小(系统默认为0.05,表示当P0.05时差异具有统计学意义,可以将其数值修改为0.01)。,注:在Equal Variances Assumed模块内SPSS提供了许多两两比较的方法。例如,LSD法为“最小显著差数法”,是
14、在无校正的前提下,在不同组间进行多次两个独立样本t检验;Bonferroni法是比较流行的方法,同LSD法类似在多组间进行两个独立样本t检验,但是采用了Bonferroni法进行校正。,(9)点击Continue,返回One-Way ANOVA对话框。,(10)点击OK,输出结果。,19,t课件,出现Univariate对话框:,(1)点击Analyze General Linear Model Univariate.,5.2 一般线性模型(GLM procedure)求效应量(偏2),20,t课件,(2)把因变量coping_stress送入Dependent List框中,自变量group
15、送入Fixed Factor(s)框中,(3)点击Options.,出现 Univariate: Options对话框:,21,t课件,(4)在Display模块内勾选Estimates of effect size:,(6)点击OK,输出结果。,(5)点击Continue,返回Univariate对话框。,22,t课件,(1)点击Analyze General Linear Model Univariate.,5.3 一般线性模型(GLM procedure)自定义组间比较(custom contrasts),如果只关心特定组别间的差异,你需要知道如何进行自定义比较(custom contr
16、asts),以及如何对多重比较结果进行调整,这就要用到SPSS软件中的Syntax Editor窗口编写相应程序语句。当满足方差齐性条件时,推荐采用GLM程序进行自定义组间比较。,23,t课件,(2)把因变量coping_stress送入Dependent List框中,自变量group送入Fixed Factor(s)框中,出现Univariate对话框:,24,t课件,(3)点击Paste,出现IBM SPSS Statistics Syntax Editor窗口:,25,t课件,(4)在 /PRINT 和 /CRITERIA两行中间,输入 /LMATRIX = group -1 1 0
17、0,本例中久坐组系数为-1,“低”体力活动组系数为1,其他组别均为0,则是要比较久坐组和“低”体力活动组的CWWS得分差异,看二者的平均CWWS得分差值是否为0(用“低”体力活动组得分减去久坐组得分,即系数为1的组别减去系数为-1的组别,以系数为-1的组别为参照组,系数赋值的正负与研究设计和研究假设有关)。,注:自定义比较包括了简单比较(simple contrasts)和复合比较(complex contrasts)。简单比较为只比较自变量某两个组别间的差异,需要建立线性比较函数(linear contrast,)。它包含一系列系数和每个组别对应的均数,系数取值只能为1,-1,0。我们把要比
18、较的两组的系数分别赋值为1和-1,其他不比较的组别系数赋值为0。,/LMATRIX= 旨在告诉SPSS我们要做一个自定义假设;group表示将要进行比较的自变量组别;-1 1 0 0表示要进行比较的系数,系数的顺序和SPSS里输入的组别顺序有关:这里从左到右(-1 1 0 0)分别对应着久坐组、“低”、“中”和“高”体力活动组,表示将“低”体力活动组与久坐组进行比较。,26,t课件,(5)用/LMATRIX指令增加另外2种比较: /LMATRIX = group -1 1/3 1/3 1/3 /LMATRIX = group -1/2 -1/2 1/2 1/2,本例中,/LMATRIX = g
19、roup -1 1/3 1/3 1/3表示“低”、“中”和“高”体力活动组的组合整体与久坐组CWWS得分差异的比较,/LMATRIX = group -1/2 -1/2 1/2 1/2表示“中”和“高”体力活动组的组合与“低”体力活动组和久坐组组合的比较。,注:复合比较为比较自变量超过2个组别的组合间的差异,如比较B组与C、D两组的组合间的差异,或C、D两组间的组合与A、D两组间组合的差异。同样采用线性比较函数的方法,某组合的系数赋值为1或-1除以组合内的组数,但是要保证要比较的组间组合与另一组(组合)的所有系数加起来为0,系数赋值的正负与研究设计和研究假设有关。,27,t课件,(6)多重比较
20、的校正,接下来,我们需要校正显著性水平(),通常也可以校正每次比较的P值和可信区间,得到调整后P值和联合可信区间(simultaneous confidence intervals)。我们首先采用Bonferroni方法对显著性水平进行校正,公式如下:调整后=调整前 比较的次数本例中我们需要进行3次比较,则调整后=0.053=0.01667。,(7) 箭头标注处为SPSS软件默认的显著性水平=0.05: /CRITERIA=ALPHA(.05),28,t课件,(8)我们将其改为调整后的显著性水平=0.1667: /CRITERIA=ALPHA(.01667),29,t课件,(9)在菜单栏点击R
21、un All:,30,t课件,(1)点击Analyze Compare Means One-Way ANOVA:,出现One-Way ANOVA对话框:,5.4 单因素方差分析(ONEWAY procedure)自定义组间比较(custom contrasts),31,t课件,(2)把因变量coping_stress送入Dependent List框中,自变量group送入Factor框中:,(3)点击Contrasts,出现 One-Way ANOVA: Contrasts对话框:,32,t课件,(4)在Coefficients模块中输入第一组比较(如-1 1 0 0)的第一个系数,点击Ad
22、d:,(5)在Coefficients模块中输入第一组比较(如-1 1 0 0)的其他系数,点击Add:,33,t课件,(6)点击Next,输入新的自定义比较组,此时下图中红框区域内将变为 Contrast 2 of 2:,(7)按照之前的方式输入第二个比较组(如-1 1/3 1/3 1/3):,注:Coefficients模块中无法输入分数,最多只能输入3位小数的数值来代替。因此本例中输入0.333代替1/3,但是由于最后总和不等于1(0.3333=0.999),因此我们将在后面的第(11)(12)步中进行调整。,34,t课件,(8)继续点击Next,输入新的自定义比较组,此时下图中红框区域
23、内将变为 Contrast 3 of 3:,(9)按照之前的方式输入第三个比较组(如-1/2 -1/2 1/2 1/2):,35,t课件,(10)点击Continue,返回One-Way ANOVA对话框。,(11)点击Paste,进入IBM SPSS Statistics Syntax Editor窗口:,36,t课件,(12)手动增加小数位数,如把小数位数从3位改为10位(0.333改为0.3333333333):,37,t课件,(13)在菜单栏中点击Run All:,38,t课件,6、结果解释,SPSS会给出自变量每个组别的基本情况统计表,以便对数据有个初步的了解:,6.1 基本描述,各
24、列变量含义对应如下:,基本情况统计表中每一行均代表着group(自变量)不同组别的coping_stress(因变量)统计结果。可以由此判断:1)哪两组间例数(N)相同;2)哪些组的平均得分(Mean)较高或较低;3)是否每组的变异情况相同(Std. Deviation)。,39,t课件,本例中,各组的样本量不相等(范围7-9),并且随着体力活动水平的增加(即自变量group),应对职场压力的能力有上升趋势(CWWS得分,即因变量coping_stress)。例如从“久坐组”到“高”体力活动组,平均得分从4.1513增加为7.5054,但是各组标准差明显不同(范围0.77137-1.69131
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 因素 方差分析 详细 课件
链接地址:https://www.31ppt.com/p-1552692.html