变异数方差分析.ppt
华中科技大学 同济医学院 宇传华制作,2004,10,1,方差分析Analysis of Variance(ANOVA),因素也称为处理因素(factor)(名义分类变量),每一处理因素至少有两个水平(level)(也称“处理组”)。一个因素(水平间独立)单向方差分析(第十章)两个因素(水平间独立或相关)双向方差分析(第十一章)一个个体多个测量值重复测量资料的方差分析 ANOVA与回归分析相结合协方差分析 目的:用这类资料的样本信息来推断各处理组间多个总体均数的差别有无统计学意义。,华中科技大学 同济医学院 宇传华制作,2004,10,2,华中科技大学 同济医学院 宇传华制作,2004,10,3,华中科技大学 同济医学院 宇传华制作,2004,10,4,ANOVA 由英国统计学家首创,为纪念Fisher,以F命名,故方差分析又称 F 检验(F test)。用于推断多个总体均数有无差异,华中科技大学 同济医学院 宇传华制作,2004,10,5,第十章 单向方差分析One-way analysis of variance,第一节 方差分析的基本思想,将所有测量值间的总变异按照其变异的来源分解为多个部份,然后进行比较,评价由某种因素所引起的变异是否具有统计学意义。,华中科技大学 同济医学院 宇传华制作,2004,10,6,一、离均差平方和的分解,组间变异,总变异,组内变异,华中科技大学 同济医学院 宇传华制作,2004,10,7,对于例8-1(完全随机设计)资料,共有三种不同的变异,总变异(Total variation):全部测量值Yij与总均数 间的差异 组间变异(between group variation):各组的均数 与总均数 间的差异组内变异(within group variation):每组的每个测量值Yij与该组均数 的差异,下面用离均差平方和(sum of squares of deviations from mean,SS)反映变异的大小,1.总变异:所有测量值之间总的变异程度,计算公式,校正系数:,2组间变异:各组均数与总均数的离均差平方和,计算公式为,SS组间反映了各组均数 的变异程度组间变异随机误差+处理因素效应,3组内变异:在同一处理组内,虽然每个受试对象接受的处理相同,但测量值仍各不相同,这种变异称为组内变异,也称SS误差。用各组内各测量值Yij与其所在组的均数差值的平方和来表示,反映随机误差的影响。计算公式为,三种“变异”之间的关系离均差平方和分解:,One-Factor ANOVA Partitions of Total Variation,Variation Due to Treatment SSB,Variation Due to Random Sampling SSW,Total Variation SST,Commonly referred to as:Sum of Squares Within,orSum of Squares Error,orWithin Groups Variation,Commonly referred to as:Sum of Squares Among,orSum of Squares Between,orSum of Squares Model,orAmong Groups Variation,=,+,均方差,均方(mean square,MS),二、F 值与F分布,,,15,F 分布曲线,16,F 界值表,附表5 F界值表(方差分析用,单侧界值)上行:P=0.05 下行:P=0.01,5,17,F 分布曲线下面积与概率,18,华中科技大学 同济医学院 宇传华制作,2004,10,19,第二节 实例8.1的方差分析,华中科技大学 同济医学院 宇传华制作,2004,10,20,H0:即4个试验组总体均数相等 H1:4个试验组总体均数不全相等 检验水准,一、建立检验假设,华中科技大学 同济医学院 宇传华制作,2004,10,21,华中科技大学 同济医学院 宇传华制作,2004,10,22,二、计算离均差平方、自由度、均方,华中科技大学 同济医学院 宇传华制作,2004,10,23,三、计算F值,华中科技大学 同济医学院 宇传华制作,2004,10,24,四、下结论,注意:当组数为2时,完全随机设计的方差分析结果与两样本均数比较的t检验结果等价,对同一资料,有:,华中科技大学 同济医学院 宇传华制作,2004,10,25,第三节 平均值之间的多重比较,不拒绝H0,表示拒绝总体均数相等的证据不足 分析终止。拒绝H0,接受H1,表示总体均数不全相等哪两两均数之间相等?哪两两均数之间不等?需要进一步作多重比较。,华中科技大学 同济医学院 宇传华制作,2004,10,26,控制累积类错误概率增大的方法,采用Bonferroni法、SNK法和Tukey法等方法,华中科技大学 同济医学院 宇传华制作,2004,10,27,累积类错误的概率为,当有k个均数需作两两比较时,比较的次数共有c=k!/(2!(k-2)!)=k(k-1)/2设每次检验所用类错误的概率水准为,累积类错误的概率为,则在对同一实验资料进行c次检验时,在样本彼此独立的条件下,根据概率乘法原理,其累积类错误概率与c有下列关系:1(1)c(8.6)例如,设0.05,c=3(即k=3),其累积类错误的概率为1(1-0.05)3=1-(0.95)3=0.143,华中科技大学 同济医学院 宇传华制作,2004,10,28,一、Bonferroni法,方法:采用/c作为下结论时所采用的检验水准。c为两两比较次数,为累积I类错误的概率。,华中科技大学 同济医学院 宇传华制作,2004,10,29,例8-1四个均值的Bonferroni法比较,设/c0.05/6=0.0083,由此t的临界值为t(0.0083/2,20)=2.9271,华中科技大学 同济医学院 宇传华制作,2004,10,30,Bonferroni法的适用性,当比较次数不多时,Bonferroni法的效果较好。但当比较次数较多(例如在10次以上)时,则由于其检验水准选择得过低,结论偏于保守。,华中科技大学 同济医学院 宇传华制作,2004,10,31,二、SNK法,SNK(student-Newman-Keuls)法又称q检验,是根据q值的抽样分布作出统计推论(例8-1)。1将各组的平均值按由大到小的顺序排列:顺序(1)(2)(3)(4)平均值28.018.718.514.8 原组号BCAD2.计算两个平均值之间的差值及组间跨度k,见表8-3第(2)、(3)两列。3.计算统计量q值4.根据计算的q值及查附表6得到的q界值(p286),作出统计推断。,华中科技大学 同济医学院 宇传华制作,2004,10,32,附表6,华中科技大学 同济医学院 宇传华制作,2004,10,33,三、Tukey法,华中科技大学 同济医学院 宇传华制作,2004,10,34,第四节 方差分析的假定条件和数据转换,一、方差分析的假定条件(上述条件与两均数比较的t检验的应用条件相同。)1.各处理组样本来自随机、独立的正态总体(D法、W法、卡方检验);2.各处理组样本的总体方差相等(不等会增加I型错误的概率,影响方差分析结果的判断)二、方差齐性检验1.Bartlett检验法2.Levene等3.最大方差与最小方差之比3,初步认为方差齐同。,华中科技大学 同济医学院 宇传华制作,2004,10,35,1.Bartlett 检验法,华中科技大学 同济医学院 宇传华制作,2004,10,36,2.Levene 检验法,将原样本观察值作离均差变换,或离均差平方变换,然后执行完全随机设计的方差分析,其检验结果用于判断方差是否齐性。因为levene检验对原数据是否为正态不灵敏,所以比较稳健。目前均推荐采用LEVENE方差齐性检验,华中科技大学 同济医学院 宇传华制作,2004,10,37,三、数据变换 改善数据的正态性或方差齐性。使之满足方差分析的假定条件。平方根反正弦变换适用于二项分布率(比例)数据。平方根变换适用于泊松分布的计数资料对数变换适用于对数正态分布资料,华中科技大学 同济医学院 宇传华制作,2004,10,38,第五节 完全随机设计方法简介,将120名高血脂患者完全随机分成4个例数相等的组,1.编号:120名高血脂患者从1开始到120,见下面表第1行;2.取随机数字:从附表15中的任一行任一列开始,如第5行第7列开始,依次读取三位数作为一个随机数录于编号下,见下面表的第2行;,华中科技大学 同济医学院 宇传华制作,2004,10,39,3.排序:按随机数字从小到大(数据相同则按先后顺序)编序号,见下面表的第3行。4.事先规定:序号1-30为甲组,序号31-60为乙组,序号61-90为丙组,序号91-120为丁组,见下面表的第4行。,华中科技大学 同济医学院 宇传华制作,2004,10,40,宇传华 制作,