OneWayANOVA单因素方差分析.ppt
当比较的平均值的数目K3时,不能直接应用t测验或u测验的两两之间的假设测验方法 1、当有k个处理平均数时,将有 个差数,要对这诸多差数逐一进行检验,程序繁琐。2、试验误差估计的精确度降低。3、两两测验的方法会随着K的增加而大大增加犯I型错误的概率。,第八章 单因素方差分析,Chapter 8:One-factor Analysis of Variance(One-Way ANOVA),第八章 单因素方差分析,方差分析:从总体上判断多组数据平均数(K3)之间的差异是否显著 方差分析将全部数据看成是一个整体,分析构成变量的变异原因,进而计算不同变异来源的总体方差的估值。然后进行F测验,判断各样本的总体平均数是否有显著差异。若差异显著,再对平均数进行两两之间的比较。(by RA Fisher),Chapter 8:One-factor Analysis of Variance,例 调查5个不同小麦品系株高是否差异显著,因变量(响应变量):连续型的数值变量株高因素(Factor):影响因变量变化的客观条件一个因素:“品系”单因素方差分析水平(Level):因素的不同等级 不同“处理”五个水平:品系I-V重复(Repeat):在特定因素水平下的独立试验五次重复,单因素方差分析的数据形式,X因素的a个不同水平(处理),每个处理下n个重复,方差分析原理,线性统计模型:模型中的xij是在第i次处理下的第j次观测值。是总平均数。i是对应于第i次处理的一个参数,称为第i次处理效应(treatment effect)。ij是随机误差,是服从N(0,2)的独立随机变量。,方差分析原理,固定因素:因素的a个水平是人为特意选择的。方差分析所得结论只适用于所选定的a个水平。固定效应模型:处理固定因素所使用的模型。随机因素:因素的a个水平是从水平总体中随机抽取的。从随机因素的a个水平所得到的结论,可推广到该因素的所有水平上。随机效应模型:处理随机因素所使用的模型。,固定效应模型,其中i是处理平均数与总平均数的离差,因这些离差的正负值相抵,因此 如果不存在处理效应,各i都应当等于0,否则至少有一个i0。因此,零假设为:H0:12 a0 备择假设为:HA:i 0(至少有一个i),固定效应模型,平方和与自由度的分解,固定效应模型,固定效应模型,单因素固定效应模型的方差分析表,处理效应对均方的贡献,固定效应模型,方差分析统计量:,若零假设成立,不存在处理效应,则组内变异和组间变异都只反映随机误差()的大小,此时处理均方()和误差均方()大小相当,F 值则接近1,各组均数间的差异没有统计学意义;反之,如果存在处理效应,则处理变异不仅包含随机误差,还有处理效应引起的变异(),此时F值显著大于1,各组均数间的差异有统计学意义。故依据 F 值的大小可判断各组之间平均数有无显著差别。,固定效应模型,平方和的简易计算,C称为校正项。误差平方和 SSe SSTSSA,减少计算误差利于编程,例 调查5个不同小麦品系株高,结果见下表:,F4,20,0.052.87,F4,20,0.014.43。F F0.01,P0.01。因此,上述5个小麦品系的株高差异极显著。,方差分析表,随机效应模型,其中处理效应i为随机变量,服从=0的独立正态分布,其方差为 在随机效应模型中,对单个i的检验是无意义。若假设不存在处理效应,则i的方差为零,即零假设为:备择假设为:,随机效应模型,单因素随机效应模型的方差分析表,随机效应与固定效应的方差分析的比较程序相同;获得数据的方式不同;假设不同;均方期望不同;适用范围不同。,方差分析应具备的条件,1、可加性(Addictivity):各处理效应与误差效应是可加的。,处理项与随机误差项的交叉乘积和=0,方差分析应具备的条件,2、正态性(Normality)::NID(0,2)应该是随机的、彼此独立的,服从正态分布。正态性不满足:但处理的误差趋向于处理平均数的函数关系。例如,二项分布数据,平均数期望为,方差期望为(1-)/n,方差与平均数有函数关系。如果这种函数关系是已知的,则可对观察值进行反正弦转换或对数转换、平方根值转换,从而使误差转化成近似的正态分布。,方差分析应具备的条件,3、方差齐性(Homogeneity):方差分析中的误差项方差是将各处理的误差合并而获得一个共同的误差方差,因此必须假定资料中有这样一个共同的方差2存在(Bartlett检验法)如果各处理的误差方差不齐,则在假设测验中处理效应得不到正确的反映。,单因素方差分析的SPSS实现,例8.1:小麦株高与品系的关系研究-单因素固定模型的方差分析,SPSS one-way ANOVA output,单因素方差分析的SPSS实现,F4,2042.279,P0.0000.01。因此,上述5个小麦品系的株高差异极显著。,Between Groups:处理间Within Groups:处理内,多重比较,当方差分析拒绝H0,为探究具体是在哪些组对之间存在显著差异,须对各处理平均数之间进行逐对比较,即多重比较(multiple comparison)post-ANOVA analysis(Post Hoc test)。如何进行多重比较?,逐对进行双样本的平均数差的t-检验?,增大了犯I型错误的概率,不可取,多重比较方法:最小显著差数(LSD)检验 Student-Newman-Keuls(SNK)q检验 Duncan 检验 Dunnett t检验 Tukey 检验,多重比较,多重比较,最小显著差数法(Fishers Least significant difference test,LSD)是t检验的变形,在变异和自由度的计算上利用了整个样本信息,而不仅仅是所比较两组的信息。检验的敏感度最高,倾向于得出差异显著的结论,在比较时仍然存在放大1型错误的问题。,多重比较,最小显著差数法(LSD),当 时,,当差异显著时,,当差异不显著时,,多重比较-Duncan multiple range test,梯形列表法显示结果,多重比较的SPSS实现,例8.1:小麦株高与品系的关系研究-多重比较,多重比较的SPSS实现,SPSS Duncans test output(1),结果的解读:除品系1、2之间外,其它各品系间均存在显著差异。,多重比较的SPSS实现,SPSS Duncans test output(2),结果的解读:除品系1、2及3、5之间外,其它各品系间均存在极显著差异。,科学论文中多重比较实例,字母标记法显示结果,各平均数间,凡有一个相同标记字母的即为差异不显著,没有相同标记字母的即为差异显著。字母大写表示极显著水平(=0.01),小写表示显著水平(=0.05),试用字母标记法表示如下多重比较的结果:,结论:处理1、4,3、4,2、3之间差异极显著,A,B,C,