多组均数间比较的方差分析.ppt
第三章 多组均数间比较的方差分析,第一节 方差分析(一):单向方差分析,一、方差分析(analysis of variance,ANOVA)的基本思想,把全部数据关于总均数的离均差平方和分解成几个部分,每一部分表示某一影响因素或诸影响因素之间的交互作用所产生的效应,将各部分均方与误差均方相比较,依据F分布作出统计推断,从而确认或否认某些因素或交互作用的重要性。,二、完全随机设计的单因素方差分析,完全随机化设计(completely random design):在实验研究中,将全部观察对象随机分入k个组,每个组给予不同的处理,然后观察实验效应。在调查研究中,按某个因素的不同水平分组,比较该因素的效应。,第1组 第2组 第k组,X11X12,X21X22,Xk1Xk2,X1 n1 X2 n2 Xk nk,n1,n2,nk,X,N,X ij为第i个处理组的第j个观察值,i=1,2,g,j=1,2,nk;为第i个处理组的均数 为总均数,,1.总变异,总=N-12.组间变异,组间=k-1 均方 MS组间=SS组间/组间3.组内变异,组内=N-k MS组内=SS组内/组内4.三种变异的关系:,=0,总=N-1=(k-1)+(N-k)=组间+组内 H0:1=2=k F=MS组间/MS组内 F服从自由度组间=k-1,组内=N-k 的F分布,表示为FF(组间,组内)若F F(组间,组内),P,不拒绝H0;若F F(组间,组内),P,拒绝H0,接受H1。,注1:H0:1=2=k H1:1,2,k不全相等,不能用12 k表示。注2:优点(1)不受比较的组数限制;(2)可以同时比较多个因素的作用,以及因素间的 交互作用。注3:条件(1)各组样本是互相独立的;(2)各样本来自于正态总体;(3)方差齐性。,例8.1 有3种解毒药:A,B,C,同时设一个空白对照D.受试大白鼠共24只,用完全随机化方法将它们等分成4组,每组接受一种药物.试比较不同解毒药的解毒效果.应用不同解毒药的大白鼠血中胆碱酯酶含量,组号 胆碱酯酶含量(X ij)ni,1 23 12 18 16 28 14 6 111 18.5 2233.0 2 28 31 23 24 28 34 6 168 28.0 4790.0 3 14 24 17 19 16 22 6 112 18.7 2162.0 4 8 12 21 19 14 15 6 89 14.8 1431.0,合计 24 480 20.0 10616.0,(1)建立检验假设,确定检验水准。H0:各组大白鼠血中胆碱酯酶含量的总体均数相等H1:各组大白鼠血中胆碱酯酶含量的总体均数不全相等=0.05(2)选定检验方法,计算检验统计量。,=,=,=,SS组间(SS处理),SS组内(SS误差),=,=,=,=,10616-4802/24,=,1016.0,=,SS总-SS组间,=,=,447.67,=,1112/6+1682/6+1122/6+892/6-4802/24,=,568.33,总=N-1=24-1=23 组间=k-1=4-1=3 组内=N-k=24-4=20MS组间=SS组间/组间=568.33/3=189.44MS组内=SS组内/组内=447.67/20=22.38F=MS组间/MS组内=189.44/22.38=8.46 方差分析结果,变异来源 SS MS F P,组间组内总,568.33447.671016.00,32023,189.4422.38,8.46,0.05,(3)确定P值和作出推断结论:F0.05(3,20)=3.10,F=8.46 F0.05(3,20),P0.05。在=0.05水准上拒绝H0,接受H1,可以认为各组大白鼠血中胆碱酯酶含量的总体均数不全相等.,三、多个样本均数间的多重比较,(一)LSD-t检验,最小显著差异t检验(least significant difference t test),适合于某几个特定的总体均数间的比较。,按算得的t值,以及误差和检验水准查t界值表,作出推断结论。如tt/2,则在水准上拒绝H0。与一般t检验的不同:1)MS误差代替Sc2;2)自由度为N-k,比成组比较中的n1+n2-2大得多,易于检出均数之差的显著性。当各处理组例数相等时,,最小显著差数,当|XA-XB|LSD时,则P,则可认为被比较的两组总体均数之间有显著性差别。,(二)Dunnett-t检验,适用于k-1个试验组与一个对照组均数差别的多重比较。查Dunnett-t界值表。,当各组例数相等时,(三)SNK-q检验,用于多个样本均数间每两个均数的比较。,当各组例数相等时,,在比较时,将均数从大到小或从小到大依次排列,根据计算所得q值,组间跨度a,误差自由度误差和检验水准查q界值表,如qq(a,),则在水准上拒绝无效假设。,四、方差分析的假定条件,1.观察值X ij独立来自正态分布的总体;2.方差齐性。,方差齐性检验,1.提出检验假设;2.计算每一组的中位观察值mdi;3.计算各组内个体观察值与中位观察值之差的绝对值dij;dij=|Xij-mdi|4.用dij作单向方差分析。,五、SPSS演示,完全随机设计资料的方差分析,例8.1 View Variable:,View Data:,Analyze Compare Means One-Way ANOVADependent list:xFactor:gPost Hoc Equal Variances Assumed:S-N-KContinueOptions Statistics:Homogeneity of variances testContinueOK,第二节 方差分析(二):双向方差分析,一、随机区组设计的两因素方差分析,随机化区组设计(randomized block design):将全部受试对象按某一个重要的属性(即区组因素)分组,把条件最接近的a个受试对象分在同一个区组内,然后用完全随机的方法,将每个区组中的全部受试对象分配到a个组中去。,例9.1 采用随机区组设计方案,以窝作为区组标志,给断奶后的小鼠喂以三种不同的营养素A、B和C。四周后检查各种营养素组的小鼠所增体重(g)。资料见下表,试比较不同营养素对小鼠体重增加的差别。,三种营养素喂养四周后各小鼠所增体重(g),营养素分组(i)按区组求和 1(A)2(B)3(C)nj 1 57.0 64.8 76.0 3 197.8 2 55.0 66.6 74.5 3 196.1 3 62.1 69.5 76.5 3 208.1 4 74.5 61.1 86.6 3 222.2 5 86.7 91.8 94.7 3 273.2 6 42.0 51.8 43.2 3 137.0 7 71.9 69.2 61.1 3 202.2 8 51.5 48.6 54.4 3 154.5 ni 8 8 8 24 500.7 523.4 567.0 1591.1 62.6 65.3 70.9 66.3 32783.4 35459.1 42205.0 110447.5,区组(j),1.变异的分解,=,=,=,SS处理 SS区组 SS误差,其中:,N=n a,i=1,2,a,j=1,2,n总=N-1=(a-1)+(n-1)+(a-1)(n-1),=,=,=,处理 区组 误差,2.分析计算步骤(1)建立检验假设和确定检验水准H0:三种营养素喂养的小鼠体重增量相等H1:三种营养素喂养的小鼠体重增量不全相等=0.05(2)计算F值,=(197.82+196.1+154.52)/3-1591.12/24=3990.31,SS误差=SS总-SS处理-SS区组=4964.21-283.83-3990.31=690.07,总=N-1=24-1=23处理=a-1=3-1=2区组=n-1=8-1=7误差=(a-1)(n-1)=2 7=14 MS处理=SS处理/处理=283.83/2=141.92 MS误差=SS误差/误差=690.07/14=49.29 F=MS处理/MS误差=141.92/49.29=2.88(3)确定P值和作出推断结论:F0.05(2,14)=3.74,F=2.88 0.05。在=0.05水准上不拒绝H0,尚不能认为三种营养素喂养的小鼠体重增量有差别。,区组间差别的检验:H0:8个区组的小白鼠体重增量相等H1:8个区组的小白鼠体重增量不全相等=0.05MS区组=SS区组/区组=3990.31/7=570.04F=MS区组/MS误差=570.04/49.29=11.56F0.05(7,14)=2.77,F0.01(7,14)=4.28,F=11.56 F0.01(7,14),P0.01。在=0.05水准上拒绝H0,接受H1,可以认为8个区组的小白鼠体重增量不全相等。,SPSS演示,随机区组设计资料的方差分析:例9.1 View Variable:,View Data:,Analyze General Linear Model UnivariateDependent Variable:xFixed Factors:a bModel Specify Model:Custom Build Terms:Main effects Model:a b ContinuePost Hoc Post Hoc Tests for:a Equal Variances Assumed:S-N-KContinueOK,Univariate Analysis of Variance,二、数据变换,(一)对数变换(logarithm transformation),Y=lgX常用于:1)使服从对数正态分布的数据正态化。如生长率、变化速度、抗体滴度等。2)使数据达到方差齐性,特别是各样本的标准差与均数成比例时。,例:为了诊断某种疾病需要测量一项指标,现用4种不同的方式来测量这一指标,以增加诊断的可靠性。表1是对4名健康人测得的数据。试检验4种测量方式有无差异?,表1 用4种方式对4人测得的某指标值,测 量 方 式,A1 A2 A3 A4,对象,1234,4 000 0001 500 00010 000 000100 000,22 00013 00030 0008 500,6 0003 40016 0005 200,7807201 900550,均数标准差,3 900 0004 374 928.6,18 3759 568.8,7 6505 671.9,987.5616.1,表2 表1资料的方差分析,变异来源 SS MS F 临界值,测量方式间测量对象间误差,总,4.54 10131.4510134.29101310.281013,33915,1.51 10134.8310124.771012,3.171.01,F0.05=3.50,表3 经对数变换后的数据,测 量 方 式,A1 A2 A3 A4,对象,1234,6.606.187.005.006.200.86,4.344.114.483.934.220.24,3.783.534.203.723.810.28,2.892.863.282.742.940.23,均数标准差,表4 表2资料的方差分析,变异来源 SS MS F 临界值,测量方式间测量对象间误差,总 25.56,22.731.701.13,33915,7.580.570.13,58.314.38,F0.01=6.99F0.05=3.86,(二)平方根变换(square root transformation),Y=,常用于:1)使服从Poisson分布的计数资料正态化,如水中细菌数的分布、放射性物质在单位时间内放射的次数等。2)当各样本的方差与均数呈正相关时,可使数据达到方差齐性。,例:下面的表1资料是3组小白鼠在注射某种同位素24h后脾脏蛋白质中放射性强度的测定,试问芥子气和电离辐射对同位素进入脾蛋白质是否起抑制作用?,表1 小白鼠注射某种同位素后脾脏蛋白质中放射性的测定,窝别,X Y=,对照组 芥子气中毒组 电离辐射组,对照组 芥子气中毒组 电离辐射组,12345678910Xs2,3817671181076.88.8,16053476634.15.4,13031254522.62.9,1.732.831.002.652.452.653.322.833.162.652.530.470,1.002.450.002.241.732.002.652.452.451.731.870.674,1.001.730.001.731.001.412.242.002.241.411.480.468,表2 方差分析结果,变异来源 自由度 SS MS F F0.01 P,处理间窝别间误差总的,291829,5.63814.0200.48720.146,2.8191.5580.027,104.4157.70,6.013.60,0.010.01,用LSD法进行多重比较:,表3 处理组均数与对照组均数比较,处理 均数 与对照组的差异 P 反变换为平方,对照组芥子气中毒组电离辐射组,2.531.871.48,0.661.05,0.010.01,6.403.502.19,(三)倒数变换,Y=,X,常用于数据两端波动较大的资料。,1,(四)平方根反正弦变换(arcsine square root transformation),常用于服从二项分布的率或百分比的资料,如发病率、治愈率、病死率、有效率等。,表1 不同温度对玫瑰花瓣形成率(%)的影响,病员编号,低温(4-6C)室温(20-25C)高温(30-37C),P,P,P,12345总和均数,40.034.034.034.534.5,39.2335.6735.6735.9735.97182.5136.50,48.058.049.065.555.5,43.8549.6044.4354.0348.16240.0748.01,49.036.040.016.015.0,44.4336.8739.2323.5822.79166.9033.38,例:某医学院病理生理教研组研究不同温度对淋巴细胞玫瑰花瓣形成率的影响,结果见表1,试作方差分析和多重比较。,表2 方差分析结果,变异来源 自由度 SS MS F F0.05 P,温度间病人间误差总的,24814,594.04583.866371.1331049.044,297.0220.9746.39,6.400.45,4.463.84,0.05,用q检验法对各温度的形成率进行两两比较:,将3个样本均数从大到小依次排列,组次 1 2 3均数 48.01 36.50 33.38组别 室温 低温 高温 表3 两两比较计算表,对比组 两均数之差 标准误 q值 组数 q界值 P A与B=0.05=0.01,1与31与22与3,14.6311.513.12,3.0463.0463.046,4.8033.7791.024,322,4.043.263.26,5.644.754.75,0.05,三、析因设计的方差分析,如果试验所涉及的处理因素的个数2,当各因素在试验中所处的地位基本平等,而且因素之间存在交互作用时,需选用析因设计(factorial design)。,(一)22析因设计,例 用A、B两药治疗12名贫血病人,性别、年龄一致,随机分成4组,治疗后1个月测得血中红细胞增加数(1012/L),结果如表,问A、B两药的治疗效果如何?两药是否存在交互效应?,A、B两药治疗后病人红细胞增加数(1012/L),A 药,B药 用 不用,用不用,2.1 2.2 2.0 0.9 1.1 1.01.3 1.2 1.1 0.8 0.9 0.7,(1)建立检验假设和确定检验水准 对于有重复的两因素设计资料方差分析,可以作3个原假设。H0:A药无效;或 H0:B药无效;或 H0:A、B两药无交互作用。=0.05(2)计算F值 1)列表计算各种 X、X2。,A 药,B 药 用(i=1)不用(i=2)合计,用(j=1)不用(j=2)合计,X=6.3 X2=13.25X=3.6 X2=4.34X=9.9 X2=17.59,X=3.0 X2=3.02X=2.4 X2=1.94X=5.4 X2=4.96,X=9.3 X2=16.27X=6.0 X2=6.28X=15.3 X2=22.55,2)校正数C=(X)2/n=15.32/12=19.513)总的离均差平方和 SS总=X2-C=22.55-19.51=3.044)总的处理离均差平方和 SS总处=6.32/3+3.02/3+3.62/3+2.42/3-19.51=2.965)A药的离均差平方和 SSA=,(X)i j2,nij,-C,(X)i2,ni,i j,i,-C,=9.92/6+5.42/6-19.51=1.696)B药的离均差平方和 SSB=,(X)j2,nj,j,-C,=9.32/6+6.02/6-19.51=0.917)A药和B药的交互作用 SSAB=SS总处-SSA-SSB=2.96-1.69-0.91=0.36,8)误差离均差平方和 SS误差=SS总-SS总处=3.04-2.96=0.089)计算与上述各种离均差平方和相对应的自由度总=n-1=12-1=11总处=(A的水平数B的水平数)-1=2 2-1=3A=A的水平数-1=2-1=1B=B的水平数-1=2-1=1AB=总处-A-B=3-1-1=1误差=总-总处=11-3=8,10)列方差分析表,变异来源 SS MS F 临界值,总处理ABAB误差总,2.961.690.910.360.083.04,3111811,1.690.910.360.01,36,11.3,(3)确定P值并作出推断结论本例分析交互作用时,P 0.01,认为交互作用有统计学意义。表明A因素处于不同水平时,B因素的作用是不同的,反之亦然。因此,不能笼统地分析A因素和B因素的作用。,四种处理的样本均数,A 药,B药 用 不用,用不用,2.11.2,1.00.8,由此算出,在不用B药时,A1-A2=1.2-0.8=0.4;用B药时,A1-A2=2.1-1.0=1.1。即B药能加强A药的作用。同理,A药能加强B药的作用。本例中A、B两药的交互作用有统计学意义,实际上就是说A、B两药同时用的效果更好,有协同作用。,SPSS演示,两因素析因设计的方差分析:View Variable:,View Data:,Analyze General Linear Model UnivariateDependent Variable:xFixed Factors:a bModel Specify Model:Full factorialOK,两因素析因设计的方差分析:例9.2 View Variable:,View Data:,Analyze General Linear Model UnivariateDependent Variable:xFixed Factors:a bModel Specify Model:Full factorialOK,(二)三因素析因试验分析,例 某病理生理教研室研究三种因素(小鼠种别、体重及性别)对皮下移植SRS瘤细胞生长特性影响的结果如表所示,试作方差分析。皮下移植SRS瘤细胞生长特性研究,组别 种别(A)体重(B)性别(C)第8天肿瘤体积,12345678,昆明昆明昆明昆明沪白一号沪白一号沪白一号沪白一号,大大小小大大小小,雄雌雄雌雄雌雄雌,0.7069 0.7845 0.35810.0785 0.1885 0.34031.0838 0.9425 0.33350.5027 0.9550 0.92150.0628 0.0942 0.04710.0126 0.0126 0.00940.4712 0.0880 0.17590.2246 0.2513 0.3676,SPSS演示,三因素析因设计的方差分析:View Variable:,View Data:,Analyze General Linear Model UnivariateDependent Variable:xFixed Factors:a b cModel Specify Model:Full factorialOK,四、定量资料假设检验方法概述,定量资料的假设检验,t检验,(单因素两水平设计和单组设计的定量资料的均值检验场合),方差分析,(单因素k水平(k3)或两个及两个以上因素的各种实验设计的定量资料的均值检验场合),秩和检验,(要求正态性、方差齐性),参数检验,非参数检验,(适用于分布类型不明确,或不满足参数检验的条件),单组设计配对设计成组设计,完全随机设计随机区组设计析因设计裂区设计交叉设计正交设计拉丁方设计,