多组数值变量比较.ppt
卫生统计学教研室,第八章 方差分析-多组均数的比较,例8-1 某大学营养与食品卫生研究所将800只条件一致的雌性果蝇随机分配到4种不同浓度的某受试物培养基组,各组200只。经2至3月的培养试验,得各组寿命最高的10只果蝇的生存天数,如下:,浓度 0组:61 63 64 64 65 65 66 66 68 680.022组:62 63 64 64 65 66 67 69 70 70 0.067组:63 64 64 65 67 68 68 69 70 70 0.600组:65 66 66 67 68 68 70 72 74 76试比较不同浓度最高寿命组的平均生存天数。,3个及3个以上的样本均数比较,要用ANOVA如用t检验,将增大一类错误,即将本来无差别的结论说成有差别,K个组比较次数:,犯一类错误的概率:,方差分析(ANOVA)又称F检验,其目的是通过检验两个或多个样本均数的差异是由抽样误差引起还是本质的差异引起,从而推断两组或多组资料的总体均数是否相同。,一、方差分析的基本思想,第一节 完全随机设计多组均数比较 的方差分析,表8-1 某受试物不同浓度组高寿命果蝇生存天数,各样本均数之间存在差异的原因:,1=2=3=4 随机因素引起的差异,1、2、3、4均不等或不全等 各总体间可能 存在本质差异,即处理因素有作用,判断哪一种情况所引起的,统计学采用假设检验的方法。,1.总变异,40只果蝇的生存天数,这种变异称为总变异(total variation)。,大小各不相等,,=N-1,变异分解:,2.组间变异,不同浓度培养基的四组果蝇生存天数的样本均数,大小不等,这种变异称为组间变异(variation between groups)。如果处理因素确有效应,它反映了处理因素的影响和随机误差;反之,则仅反映随机误差。,=k-1,3.组内变异,各组内观察值xij大小不等,这种变异称为组内变异(variation within groups)。组内变异仅反映随机误差,故又称误差变异。,=N-k,三种变异的关系:SS总=SS组间+SS组内 v总=v组间+v组内,均方(即自由度v去除离均差平方和的商),离均差平方和,方差分析就是用组内均方去除组间均方的商(即F值),代 替,则,消除各组样本数不同的影响,以,如 果,实际应用中检验假设成立条件下F值大于特定值的概率可通过查阅F界值表(方差分析用)获得。,方差分析(即F值)与1相比较,若F值接近1则说明各组均数间的差异没有统计学意义,若F值远大于1则说明各组均数间的差异有统计学意义,二、方差分析的应用条件,数据满足以下三个条件:,各观察值相互独立每一水平下的观察值均服从正态分布;,3.各总体方差相等,即具有方差齐性(homogeneity of variance)。,方差齐性检验:,1.简单法:最大方差与最小方差之比3,方差不齐。,2.Bartlett法,3.Levene 法,1.,2.,正态性检验:W1=0.956,P=0.7344W2=0.922,P=0.3374W3=0.906,P=0.2538W4=0.908,P=0.2713,方差齐性检验:F=1.68,P=0.1896,成组设计方差分析的计算公式,变异来源 SS MS F 组间 k-1 SS组间/组间 MS组间/MS组内组内SS总-SS组间N-k SS组内/组内总 N-1,(1)建立检验假设 H0:多个样本的总体均数相等。H1:多个样本的总体均数不相等或不全等。检验水准为0.05。(2)计算检验统计量F值(3)确定P值并作出推断结果,三、整个方差分析的基本步骤如下:,表8-1 某受试物不同浓度组高寿命果蝇生存天数,查附表(方差分析用)F界值表,3.81,P0.05,可认为4处理组总体平均生存天数不全等或全不等,表8-2 例8-1的方差分析表,当检验结果P0.05后,可进一步对多个均数作两两比较。,四、多个均数间的两两比较,进行均数间两两比较的方法很多:SNK(Student-Newman-Keuls)检验,DUNCAN检验,Tukey检验,Scheffe检验,等。如只须几个实验组和一个对照组比较,实验组之间不比较:LSD(最小显著差)检验,DUNNETT检验,DUNCAN新法,等,多个实验组与一个对照组均数间两两比较,新复极差法(Duncans new multiple range method)Duncan新法,多个样本均数间的任两个比较q检验(SNK)法,第二节随机区组设计多个样本均数比较的方差分析,随机区组设计方差分析的应用条件为:各处理组、各区组资料均服从正态分布;各处理组间方差齐性,各区组间方差齐性。,将研究对象按某些条件配伍,再随机分配到各个处理组。,随机区组设计(randomized block design),两因素:处理因素和区组因素。,例8-2 为研究氯化镉CdCl2对细胞的毒性作用,分别以V79(中国仓鼠肺成纤维细胞)、WI38(人肺细胞株)、L929(小鼠成纤维细胞)、CHO(中国仓鼠卵巢成纤维细胞)、SHE(叙利亚地鼠胚胎细胞株)5种不同细胞作为5个区组,以3种不同的染毒时间作为3个处理组,观察细胞的克隆率,资料如表8-3。试比较不同染毒时间组的细胞克隆率。,表8-3 不同染毒时间5种细胞克隆率()的比较,n:区组个数g:处理组个数,:j区组内第i处理组的数据,:j区组全部数据的和,:第j区组的样本均数,二、变异来源及计算公式:,一、区组设计方差分析中变异的分解:,总变异处理间变异区组间变异误差变异,区组设计方差分析的计算公式,三、分 析 步 骤 H0:各时间组总体克隆率(均数)均相同 H1:各时间组总体克隆率不全 等或全不等,0.05,SS总=8.14084-8.02565=0.11519,SS处理,C=10.9722/158.02565,MS处理=0.0187/2=0.0094,3.查表 得F0.01(2,8)=8.6510.44,P0.010.05,可认为各染毒时间组总体克隆率不全等或全不等;F0.01(4,8)=7.0124.89,P0.010.05,可认为各染毒浓度组总体克隆率不全等或全不等。,表8-4 例8-2的方差分析表,方差分析的正确应用,1.方差分析对数据的要求与t检验相同:独立性、正态性、方差齐性。,2.当原始数据不满足方差分析的条件,可以进行适当的变化,如对数变换、平方根变换等。,3.两两比较 只有当方差分析拒绝H0时,才有必要进行两两比较。样本1和样本2无差别,样本2和样本3无差别,并不表示1和3无差别,误差不具有传递性。,4.F值、t值、q值和q值的关系在两样本均数比较时,此时如用q或q检验,亦可得到同样的结论。,data li8_1;do c=1 to 4;do i=1 to 10;input x;output;end;end;cards;61 63 64 64 65 65 66 66 68 6862 63 64 64 65 66 67 69 70 7063 64 64 65 67 68 68 69 70 7065 66 66 67 68 68 70 72 74 76;proc univariate normal;var x;by c;run;proc anova;class c;model x=c;means c/hovtest=bartlett snk dunnett;run;,data li8_2;do a=1 to 5;do b=1 to 3;input x;x1=x/100;output;end;end;cards;88.0 82.3 77.482.3 79.0 76.576.3 74.8 70.771.1 70.1 67.066.9 64.3 50.5;proc univariate normal;var x1;class b;run;proc anova;class a b;model x1=a b;means b/hovtest;means a b/snk;run;,