SPSS第6章方差分析课件.pptx
6.1 方差分析的基本原理,一、方差分析的目的前面讲的平均数差异的显著性检验,是对两个平均数的比较。然而,在实际工作中,往往还需要对两个以上平均数进行比较。在比较多组平均数的时候,常用方差分析综合性地确定几个平均数差异的显著性。方差分析的基本功能就在于它对多组平均数差异的显著性进行检验的作用。,二、方差分析的逻辑基础 (一) 方差分析的基本原理为研究三种不同教材的质量,抽取三个实验班分别使用其中一种教材,而对其它因素加以控制。经一段实验后进行测试,取得三种实验处理的数据如下表。,表12-1 某校使用三种实验教材后的测验成绩,从上表可知,三种不同实验教材的教学效果不完全一致,表现在三个不同实验处理组的平均数之间存在差异;同时,同一实验组内部的5名样本的反应变量也存在差异。,我们可以将三个实验组的所有15名样本分数的差异分为两部分:实验组间的差异(称为组间差异)和实验组内的差异(称为组内差异)。,图12-1 数据变异图解,65,70,75,80,77,组间差异是由于不同实验组的实验处理不同造成的,而组内差异是由于实验中一些希望加以控制的非实验因素和一些未被有效控制的未知因素造成的,它们统统被认为是误差因素。,如果实验数据的总变异主要是由实验因素造成的,那么在总差异中组间差异将占较大比例,组内差异只占较小比例,这时有充分理由认为不同教材的教学效果不同;反之,如果总变异主要是由误差因素造成的,那么就只能认为三种教材的教学效果无显著差异。,三、以F检验来推断几个平均数差异的显著性(一)总平方和可以分解成组间平方和及组内平方和,例:三组不同学龄的学生识记同一组词汇,见下表。,由于多种因素的影响,学生的分数是参差不齐的,在分析各组平均数差异原因或寻找影响差异的主要因素时,可以将每个分数与总平均数之间的差异分成两部分。,这两部分差异主要是由两类不同的因素所引起,一类是由实验者操纵的已知的实验因素(三种不同学龄)所引起,表现在各小组平均数之间的差异;另一类是由偶然因素所引起,表现在各组内部每个分数与小组平均数之间的差异。,如果组间差异和组内差异都以其相应的离差平方和来表示,则它们的关系为: 总平方和=组间平方和+组内平方和,某个分数与总平均数的离差,等于这个分数与本组平均数的离差加上本组平均数与总平均数的离差。,某一小组中n个分数与总平均数的离差平方和为:,k组的离差平方和为:,总平方和,组内平方和,组间平方和,于是上式的关系为:SSt=SSw+SSb,总离差平方和(实验数据的变异),组内差异由于实验误差造成,记为SSEE表示误差。SSw=SSE,组间离差平方和,组内离差平方和,组间差异由于实验处理效应造成,记为SSAA表示处理SSb=SSA,(二)总自由度可分解成组间自由度及组内自由度,组间自由度: dfb=k-1组内自由度: dfw=N-k 总自由度: dft=N-1dft=dfb+dfw,(三)在方差分析中,应分别求其均方(MS)组间方差又称作组间均方,以MSb表示 MSb =SSb /dfb dfb=k-1组内方差又称作组内均方,以MSw表示 MSw =SSw /dfw dfw=N-k总均方以MSt表示 MSt =SSt /dft dft=N-1,组间与组内方差的F比值为:,(四)在方差分析中,用F检验来检验组间与组内方差是否相等。如果组间与组内方差相等,即F比值等于或接近1,表明各组平均数无显著性差异;如果F值很大,F值大到超过F抽样分布上某种显著性水平的临界值,则应拒绝组间与组内方差无显著性差异的零假设,而接受组间与组内方差有显著性差异的备择假设。这时,只能作出各组平均数有显著性差异的结论。这一结论是说,分组所依据的因素对实验结果有重要影响,或者说,实验者所操纵的实验因素的作用较大。,四、方差分析 (ANOVA)的一些基本概念(一)概念又称变异数分析或F检验,其目的是推断两组或多组资料的总体均数是否相同,检验两个或多个样本均数的差异是否有统计学意义。(二)功能分析实验数据中不同来源的变异对总变异的贡献大小,从而确定实验因素对反应变量是否存在显著影响。(三)种类单因素方差分析两因素方差分析,(四)方差分析中的虚无假设和备译假设方差分析要检验的虚无假设H0: k个处理的效应全部相等并均为0备择假设H1 : k个处理中至少有一个处理的效应不为0。如果MSb显著大于MSw,我们就有充分理由拒绝处理效应为0的H0。,F=MSb /MSw 如果F1,说明数据的总变异中处理效应引起的变异所占比例小于或等于实验误差引起的变异;当F1,且落入F分布的否定域,即当统计量FF(dfl,df2)时,表明实验数据的变异主要由处理效应造成。,(五)方差分析的基本条件1、总体服从正态分布。对不能确定总体是否为正态的样本资料,应进行总体分布的正态性检验(用卡方检验),当检验表明其所来自的总体不是正态时,应对数据进行正态转换,或使用非参数方法。2、变异的可加性。数据的总变异可以被分解成意义明确、彼此相互独立的几个不同来源的部分。3、各处理内的方差一致。各实验处理内的方差彼此无显著性差异,这是方差分析的最为重要的前提。,6.2 单因素方差分析,单因素方差分析也称作一维方差分析。它检验由单一因素影响的一个(或几个相互独立的)因变量,由因素各水平分组的均值之间的差异,是否具有统计意义,并可以进行两两间均值的比较,称做组间均值的多重比较。,研究3个组(分别接受了3种不同的教学方法)在英语成绩上是否有显著性差异。,数据录入,分组变量group,英语成绩,1、2、3代表3种教学方法,应当特别注意,不能把三种教学方法定义为三个变量,而应定义成一个分组变量的三个水平。,菜单,选择分析菜单下的均值比较下单因素方差分析选项,,则打开单因素方差分析对话框。,对话框,2单击按钮,5单击OK按钮,1选择变量英语,3选择分组变量group,4单击按钮,结果,自由度,平方和,均方,F值,P值,组间,组内,总,P= 0.023,小于0.05,大于0.01。,根据输出的P值小于0.05,大于0.01,可以看出,在0.05水平上,否定H0假设,三种教学方法对英语成绩均数有显著性意义。结论是,三种教学方法对英语成绩的变化作用不同。,Options按钮,单击Options按钮,则打开Options对话框。,Options对话框,输出描述性统计量,要求进行方差齐性检验,要求绘制均值分布图,描述性统计量,方差齐性检验,各样本的总体方差相等,即方差齐性。,从显著性概率值(sig.=0.301)知,P0.05,不能否定H0,说明各组的方差没有显著性差异,即方差具有齐性。,方差不齐时,如果结论是否定H0,说明各组的方差有显著性差异,即方差不齐。,两种办法,近似F检验,均值分布图,上图是以自变量“教学方法”为横轴,以因变量“英语”为纵轴而绘制的各组均值的线形图,直观地反映了三种教法的英语成绩差异。,通过上面的步骤,只能判断一个变量的不同水平是否对观测变量产生显著影响。如果想进一步了解究竟是哪个组和其他组有显著的均值差别,就需要在多个样本均数间两两比较。,6.3 多重比较,H0:1=2= k 总体均数全相等。,当F检验的结论为拒绝H0,接受H1时,只说明多个总体均数不全相同。若想进一步了解哪些两个总体均数不等,就需要进行多个样本均数间的两两比较,称为 多重比较。,H1:总体均数不全相等。,注意:不要将H1理解为总体均数全不相等。,注意:不要用两两比较t检验。,Post Hoc 按钮,单击Post Hoc按钮,则打开Post Hoc对话框。,Post Hoc对话框,最常用的有:LSD:最小显著差法;S-N-K 检验,即q检验。,方差齐时,方差不齐时,结果1,结果2,教法1和教法2之间没有显著差异(教法1和教法2的均值在同一列中出现),教法3与教法1、教法3与教法2之间差异显著。,均值资料,6.4 无重复实验的双因素方差分析,问题的提出例:某教育部门决定对英语教学进行测试,分别选择北京、天津、上海、重庆4个直辖巿的班级进行测试对象,应用3种不同的教学方案。经过一个学期的教学,在不同地区使用不同教学方案各个班级的英语平均分如下所示,试分析不同地区、不同教学方案对英语成绩平均分的影响是否有显著差异。,在这个例子中,教学方案有3种,这是一个自变量;另外,地区类型有4种,这是第二个自变量;这两个因素对英语成绩的影响。,数据录入,统计分析过程,打开单因变量多因素方差分析对话框,(1)选择分析菜单下的一般线性模型下单因变量多因素方差分析选项,(2)从左侧列表框中选择因变量,调入右侧的“Dependent Variable:”文本框中。本例选“英语成绩”。,(3)从左侧列表框中选择自变量,调入右侧的“Fixed Factor(s):”文本框中。本例选“地区类型”、“教学方案”。,(4)这是一个无重复实验问题。单击“Model”按钮,弹出“Univariate:Model”对话框。,图中“Specify Model”选项区有两个选项,它们的含义为:Full factorial(全模型,分析所有因素的主效应和交互效应):这是系统的默认值。由于本例题是无重复实验,不存在分析交互效应问题,所以不选择此项。Custom用户自定义模型。,单击Custom,激活“Build Term(s)”选项区,同时,左侧的“Factor & Covariates:”列表框中的变量也被激活,并且在变量名后面注明“(F)”因素变量或“(C)”协变量。,效应选择:单击“Build Term(s)”选项区中的列表框,出现一个下拉列表。,Interaction:交互效应分析;Main effects:主效应分析。,选择所要分析的变量,例如“教学方案”和“地区类型”,将它们调入右侧的“Model:”文本框中。,“Sum of squares:”选项是选择平方和的处理方法。系统的默认值为“TYPE ”,它的适用面比较宽,接受默认值。,“Include intercept in model:”(把截距项包括在模型中)选项系统的默认值,一般接受系统默认值。,单击“Continue”按钮,回到主对话框。,(5)单击“Options”按钮,弹出“Univariate:Options”对话框。,将“Factor(s) and Factor Interactions:”在此列表框中的两个变量调入右侧的列表框中,单击“Continue”按钮,回到主对话框中。,在“Display”选项区中,选择“Homogeneity tests”(做方差齐性检验)选项。,(6)单击“Post Hoc”按钮,弹出“Univariate:Post Hoc”对话框。,在上半部的两个选项中选择要对因素的水平做两两对比的变量。例如,可以依据需要,把两个变量或其中的一个变量,从左侧选项区中调入右侧选项区。这时,下半部的选项区被激活。这表明,必须先选上半部,才能选择下半部。,在“Equal Variances Assumed”选项区中,选择“LSD”选项,用最小显著性差异方法两两检验各水平效果均值是否有显著差异。在“Equal Variances Not Assumed”选项区中选择“Tamhanes T2”(方差不相等的、没有正态分布假设的前提)选项。单击“Continue”按钮回到主对话框。,(7)单击“OK”按钮,输出结果。,结果分析,看地区类型、教学方案这两行。,方差分析结果,地区类型多重比较结果。,教学方案多重比较结果。,