多组资料均数的比较.ppt
临床医学医学统计学,方差分析 多组资料均数的比较,医学院预防医学教研室,多组资料均数的比较,完全随机设计资料的方差分析(单因素)随机区组设计资料的方差分析(双因素)析因设计资料的方差分析(多因素),医学院预防医学教研室,多组资料均数的比较,一、方差分析的基本思想及应用条件二、完全随机设计资料的方差分析三、均数间的多重比较,医学院预防医学教研室,将所研究的对象分为多个处理组,施加不同的干预,施加的干预称为处理因素(factor),处理因素至少有两个水平(level)。用这类资料的样本信息来推断各处理组间多个总体均数是否存在差别,常采用的统计分析方法为方差分析(analysis of variance,ANOVA)。由英国统计学家首创,为纪念Fisher,以F命名,故方差分析又称F检验(F test)。,一、方差分析的基本思想及应用条件,医学院预防医学教研室,i为组的编号:1,2,3 j为组内为个体编号:1,2,11,医学院预防医学教研室,1.总变异(Total variation):全部测量值 Xij 与总均数 间的差别(以SS总表示)2.组间变异(between group variation):各组的均数 与总均数 间的差异(以SS组间表示)3.组内变异(within group variation)每组的各个原始数据 与该组均数 的差异(以SS组内表示),试验数据有三种不同的变异,用离均差平方和(sum of squares of deviations from mean,SS)表示变异的大小,医学院预防医学教研室,1.总变异(SS总),SS总反映了所有测量值之间总的变异程度SS总=各测量值Xij与总均数 差值的平方和,医学院预防医学教研室,SS组间反映了各组均数 间的变异程度组间变异随机误差+处理因素效应,2.组间变异(SS组间),医学院预防医学教研室,在同一处理组内,虽然每个受试对象接受的处理相同,但测量值仍各不相同,这种变异称为组内变异。SS组内仅仅反映了随机误差的影响。也称SS误差,3.组内变异(SS组内),m i,医学院预防医学教研室,三种“变异”之间的关系,医学院预防医学教研室,医学院预防医学教研室,均方(mean square,MS),医学院预防医学教研室,均方之比F value,医学院预防医学教研室,F 分布,F分布概率密度函数:,F分布表示:F(v1,v),医学院预防医学教研室,F 分布曲线,医学院预防医学教研室,F 界值表,附表 F界值表(方差分析用,单侧界值)上行:P=0.05 下行:P=0.01,医学院预防医学教研室,方差分析的基本思想,首先将总变异分解为组间变异和误差(组内)变异;然后比较两者的均方,即计算F 值;若F值大于某个临界值,表示处理组间的效应不同,若F值接近甚至小于某个临界值,表示处理组间效应相同(差异仅仅由随机原因所致)。对于不同设计的方差分析,其思想都一样,即均将处理间平均变异与误差平均变异比较。不同之处在于变异分解的项目因设计不同而异。,医学院预防医学教研室,方差分析的应用条件,各样本是相互独立的随机样本;各样本来自正态总体;各处理组总体方差相等,即方差齐性或齐同(homogeneity of variance)。,上述条件与两均数比较的t检验的应用条件相同。当组数为2时,方差分析与两均数比较的t检验是等价的,对同一资料,有,医学院预防医学教研室,二、完全随机设计的单因素方差分析,完全随机设计(completely random design)也叫单因素方差分析(oneway ANOVA)。将受试对象随机地分配到各个处理组的设计。随机分组方法:1.编号,确定分组方案(如较少11个随机数为A,中间 11个数为B,较大11个随机数为C)2.产生随机数字(统计书,或电脑),排序 3.按方案分组,医学院预防医学教研室,i为组的编号:1,2,3 j为组内为个体编号:1,2,11,医学院预防医学教研室,方差分析的步骤,H0:m1=m2=m3=.=mk,m1=m2 m3,H1:not all the mi are equal,m1 m2 m3,k个总体均数全相等,k个总体均数不等或不全相等,医学院预防医学教研室,计算F值(方差分析表),医学院预防医学教研室,计算F值(方差分析表),医学院预防医学教研室,下结论,医学院预防医学教研室,三、均数间的多重比较,当方差分析的结果拒绝H0,接受H1 时,只说明k个总体均数不全相等。若想进一步了解哪些两个总体均数不等,需进行多个样本均数间的两两比较或称多重比较。(multiple comparison),医学院预防医学教研室,若用两样本均数比较的 t 检验进行多重比较 类错误(把本无差别的两个总体均数判 为有差别)的概率。例如,有4个样本均数,两两组合数为,若用 t 检验做6次比较,且每次比较的检验水准 选为,则每次比较不犯类错误的概率 为(1 0.05),6次均不犯类错误的概率为 这时,总的检验水准变为,1.为什么一般t检验作多重比较是错误的?,医学院预防医学教研室,(1)SNKq检验(多个均数间全面比较)(2)LSDt检验(有专业意义的均数间比较)(3)Dunnett检验(多个实验组与对照组比较)还有TUKEY、DUNCAN、SCHEFFE、WALLER、BON等比较方法,2.“多重比较”的几种方法,医学院预防医学教研室,SNK(Student-Newman-Keuls)检验,3.SNKq检验,医学院预防医学教研室,现将上表栏目自左至右一一说明如下:第(2)栏为两对比组均数之差;第(4)栏是按式(6.19)计算的统计量q值;第(5)栏为3个样本均数按大小排列时,A、B 两对比组范围内所包含的组数a。如第一行“1与3”范围内包含3个组,故a=3 第(6)栏 是根据误差自由度v与组数a查 q 界值表所得的 q 界值。第(7)栏 是按下表判定的P值。,|q|值、P值与统计结论|q值|P值 统 计 结 论0.05 q 0.05(v1.V2)0.05 不拒绝H0,差别无统计学意义0.05 q 0.05(v1.V2)0.05 拒绝H0,接受H1,差别有统计学意义0.01 q 0.01(v1.V2)0.01 拒绝H0,接受H1,差别有非常统计学意义,关于查附表9中的q值,一方面根据该表上端横行a的数字,另方面根据表左侧直行的,也即方差分析表中组内(或误差)的自由度来查。表内q值有上、下两行数:若定为0.05,查上行,为0.01则查下行。,