生物统计学课件方差分析㈡.ppt
第六章 方差分析(二),(针对复因素试验结果进行的分析)第一节 正交试验数据第二节 完全随机试验数据第三节 系统分组试验数据第四节 裂区试验数据*,第六章要点提示,本章讲授复因素试验数据的方差分析,是本课程的难点,它与正交表的联系非同小可。学习时要求掌握正交设计和系统分组设计的试验数据的平方和、自由度分解原理和随机单位组设计(交叉分组)的联系和区别;学会在有表可套的情况下利用正交表实现处理平方和SSt、自由度DFt再分解结果的“自动检校”;牢记各因素不同水平之间以及各处理之间的平均数进行多重比较时标准误SE的计算方法。涉及教材内容:第六章第三节,第十二章第八节。作业布置:教材P152-153 T17、T18、T19;P269 T9。,第一节 正交试验数据,6.1 在进行矿物质对架子猪的补饲试验中,考察补饲配方(A)、用量(B)、食盐(C)三个因素,每个因素各有3个水平(a=3,b=3,c=3);按L 9(3 4)进行正交试验,将A、B、C依次安排到该正交表的第、列构造正交组合(k=9);试验实施时,重复2次(n=2),随机单位组设计。所得试验结果套用该正交表整理后列表如下,试予分析。一、数据整理 本例有因素水平及试验方案安排表,见教材P251、P252(数据单位:kg)C=T 2/nk=1347.4 2/18=100860.3756 dfT=nk 1=2 9 1=17 SST=Y 2 C=63.4 2+68.9 2+92.82 100860.3756=1978.5444 SST=区组 SS r 处理 SS t 剩余 SS 分解层次 SS SS SS SS 再分解层次 dfT=区组 df r 处理 df t 剩余 df 分解层次 df df df df 再分解层次,第一节 正交试验数据,第一节 正交试验数据,二、SST的分解及SS t的再分解 SS r Tr 2/k C 843.2355(612.1 2+735.3 2)/9 100860.3756 SS t Tt 2/n C 819.6244(130.8 2+156.12+166.5 2)/2 100860.3756 SS T2/(nk/a)C 416.3344 SS T2/(nk/b)C 185.2077 SS T2/(nk/c)C 202.8811 SS T2/(nk/3)C 15.2011 剩余 SS SST SS r SS t 315.6845 用空列的SS实现“自动检校”:SS 15.2011 SS t SS SS SS 15.2022,三、列ANOVA表,进行F-testSOV DF SS MS F F 0.05区组 1 843.2355 处理 8 819.6244 102.45 3.10ns 3.97 2 416.3344 208.17 6.29*4.10 2 185.2077 92.60 2.80ns 4.10 2 202.8811 101.44 3.07ns 4.10 2 15.2011 模型误差剩余 8 315.6845 33.09 试验误差 总 17 843.2355注:F 空列S 2/剩余S 2 0.1926(15.20112)/(315.68438)F 0.05,2,8 4.46 于是再分解得到的空列SS和分解层次的剩余SS一样,都要视为误差SSe而予以合并。Se 2(15.2011315.6843)/(28)33.09,第一节 正交试验数据,四、多重比较、A因素三个水平间的比较 SE=MSe/6=33.096=2.35按dfe=10查SSR临界值后比较如下:k LSR 顺序 A 0.05 0.01 0.05 0.01 A3 81.26 a A2 7.40 10.53 A2 73.62 b AB3 7.76 11.12 A1 69.68 b B、F-test已知,B因素三水平无显著差异;(SE=MSe/6=33.096=2.35)、F-test已知,C因素三水平差异不显著;(SE=MSe/6=33.096=2.35)、F-test已知,各正交组合间差异不显著。(SE=MSe/2=33.092=4.07),三、列ANOVA表,进行F-testSOV DF SS MS F F 0.05区组 1 843.2355 处理 8 819.6244 102.45 3.10ns 3.97 2 416.3344 208.17 6.29*4.10 2 185.2077 92.60 2.80ns 4.10 2 202.8811 101.44 3.07ns 4.10 2 15.2011 模型误差剩余 8 315.6845 33.09 试验误差 总 17 843.2355注:F 空列S 2/剩余S 2 0.1926(15.20112)/(315.68438)F 0.05,2,8 4.46 于是再分解得到的空列SS和分解层次的剩余SS一样,都要视为误差SSe而予以合并。Se 2(15.2011315.6843)/(28)33.09,第二节 完全随机试验数据,例6.2 为了从三种不同原料(a=3)和三种不同温度(b=3)中选择使酒精产量最高的水平组合,设计了两因素完全随机试验,每一水平组合重复4次(n=4),其产量结果套L9(34)进行整理后列表如右,试予分析。一、数据整理 本例数据源自教材P133习题17C=T 2/nab=1170 2/36=38025 dfT=nab 1=4 9 1=35 SST=Y 2 C=7989=412+49 2+19 2 38025SST=SS t SS e(分解)SSA SS B SS AB(再分解)SS SS,第二节 完全随机试验数据,二、SST的分解及SS t的再分解SS t Tt 2/n C 6164.5(138 2+722+108 2)/4 C SS A TA2/nb C 1913.17(2752+408 2+4872)/12 38025 SS B TB2/na C 3633.5(5292+4062+235 2)/12 38025 SS T2/12 C 52.67(3842+376 2+410 2)/12 38025 SS T2/12 C 565.17(3962+329 2+4452)/12 38025SSe SST SS t 1824.5 用空列的SSAB实现“自动检校”:SS SS 52.67+565.17 617.84 SS t SSA SS B 617.83,第二节 完全随机试验数据,正交表在经典试验设计的复因素试验结果的方差分析过程中的作用:只要复因素试验方案“有表可套”,则不论因素多少,所有数据的整理都可用相应的正交表一表完成,无需另外单列两向表计算主效应SS和互作效应SS;用正交表算得的空列SS、DF或其累加值就是相应的互作效应SS、DF值,这一优点使得按SSt 再分解原理算得的剩余SS、DF值可与之“相互佐证”,类似会计记帐时的“逼角”,是正交表在经典试验统计中所能起到的十分独特的功用;用正交表参与复因素试验结果的方差分析过程体现了正交表与复因素试验的内在联系,认识这种必然性对正确理解正交表在建立多元统计模型中的作用非常重要,即:正交试验设计回归正交设计回归旋转设计(旋转组合设计);有正交表参与方差分析过程时,处理平方和SSt 的再分解步骤异常简洁、直观,本来烦琐的复因素试验结果的平方和再分解运算变成用几乎是同一个算式循环操作,其程序无须专业人员就可编制,个人电脑应用起来十分方便。后续章节内容将告诉我们,不仅是完全随机试验,其它经典试验设计如随机单位组设计、裂区设计、系统分组设计等得到的数据结果,只要在方案设计时稍加考虑,使得SSt 的再分解“有表可套”,同样可发挥正交表的功用。这里再将一完全随机试验结果(教材P109)套正交表整理如下。,第二节 完全随机试验数据,二、SST的分解及SS t的再分解SS t Tt 2/n C 6164.5(138 2+722+108 2)/4 CSS A TA2/nb C 1913.17(2752+408 2+4872)/12 38025 SS B TB2/na C 3633.5(5292+4062+235 2)/12 38025 SS T2/9 C 52.67(3842+376 2+410 2)/12 38025SS T2/9 C 565.17(3962+329 2+4452)/12 38025SSe SST SS t 1824.5 用空列的SSAB实现“自动检校”:SS SS 52.67+565.17 617.84 SS t SSA SS B 617.83,第二节 完全随机试验数据,三、列ANOVA表,进行F-testSOV DF SS MS F F 0.01处理 8 6164.50 770.56 11.403*3.29 A 2 1913.17 956.59 14.156*5.53 B 2 3633.50 1816.75 26.885*5.53 AB 4 617.83 154.46 2.286 4.14 误差 27 1824.5 67.574 总 35 7989,四、多重比较、原料三个水平间的比较;SE=MSe/nb=67.57412=2.373、温度三个水平间的比较;SE=MSe/na=67.57412=2.373 按dfe=27查得SSR临界值后比较如下:k SSR LSR 0.05 0.01 0.05 0.01 2 2.91 3.06 6.91 9.33 3.93 4.11 7.26 9.75 A 0.05 0.01 B 0.05 0.01 A3 40.6 a A B1 44.1 a AA2 34.0 a A B2 33.8 b BA1 22.9 b B B3 19.6 c C、各水平组合间的比较 SE=MSe/n=67.5744=4.11按dfe=27查SSR临界值后比较如左:,第三节 系统分组数据,例6.3 为了测定三种不同来源(l=3)的鱼粉蛋白质的消化率,在不含蛋白质的饲料里按一定比例分别加入这3种不同的鱼粉A1、A2、A3 配制成饲料,各喂给三头试验动物(b=lm=9),分别收集其排泄物风干、粉碎、混合均匀,然后每头动物的排泄物各取两份样品作化学分析(n=2),得lmn=18型两级分组数据(%)如下,试予分析。鱼粉 A1 A2 A3.动物 B1 B2 B3 B4 B5 B6 B7 B8 B9消化率 82.5 87.1 84.0 86.6 86.2 87.0 82.0 80.0 79.5(%)82.4 86.5 83.9 85.8 85.7 87.6 81.5 80.5 80.3 这是两因素单向分组的数据结构,鱼粉是一级因素,动物个体是二级因素;它们的效应值SS分别叫做组间变异量和亚组间变异量;与前述随机区组试验、完全随机试验以及裂区试验的数据结构相比较,区别在于二级因素各水平之间的差别已不再独立,它包含了上一级因素各水平之间的差别。因此其平方和、自由度的(再)分解过程很特别,要从下一级也就是亚组间的平方和、自由度的分解过程着手反弹琵琶。或者就叫“倒骑毛驴”,即:SST SSB SS e2(分解)dfT dfB df e2 SSA SS e1(再分解)dfA df e1,第三节 系统分组数据,一、数据整理 C=T 2/nb=1509.1 2/18=126521.27 dfT=nb 1=2 9 1=17 SST=Y 2 C=132.34 二、SST的分解及SSB的再分解SSB TB 2/n C 130.97(164.92+173.62+159.8 2)/2 C SS A TA2/nm C 105.50(506.42+518.9 2+483.8 2)/6 C SS T2/nm C 2.39(500.82+506.0 2+502.3 2)/6 C SS T2/nm C 2.82(500.0 2+505.8 2+503.3 2)/6C SS T2/nm C 20.25(496.62+511.7 2+500.8 2)/6 CSSe2 SST SS B 1.37 用空列的SSe1实现“自动检校”:SS SS SS 25.46 SS B SSA 130.96105.5 25.47,第三节 系统分组数据,三、列ANOVA表,进行F-testSOV DF SS MS F F 0.01 B 8 130.97 16.37 107.56*5.47 A 2 105.50 52.75 12.43*10.92 e1 6 25.47 4.245e2 9 1.37 0.1522 总 17 132.34四、多重比较、鱼粉三个水平间的比较SE=MSe1/nm=4.2456=0.841 按dfe1=6查得SSR临界值后比较如下:P LSR 顺序 A 0.05 0.01 0.05 0.01 A2 86.5 a A2 2.91 4.41 A1 84.4 a AB3 3.01 4.63 A3 80.6 b B,、各动物个体间的比较 SE=MSe2/n=0.15222=0.2774 按dfe2=9 查得SSR临界值后比较如下:,第四节 裂区试验数据,例6.4 有一小麦裂区试验,主区因素分A1(深耕)、A2(浅耕)两水平;副区因素分B1(多肥)、B2(少肥)两水平。重复3次,其田间排列和15m2小区(计产面积)产量如下图,试予分析。A1 A2 A2 A1 A2 A1一、数据整理 本例可套正交表L4(23)整理如右:C=T 2/nab=70 2/12=408.3 SST=Y 2 C=129.7 dfT=nab 1=2 4 1=11,SST SS t SS r SS e 分解 SSA SS BSS AB SSE a SS E b 再分解SSm SS A SS r SSE a 分解,第四节 裂区试验数据,二、SST的分解及SS t的再分解SS r Tr 2/ab C 0.2(24 2+23 2+33 2)/4 408.3 SS t Tt 2/n C 118.3(32 2+14 2+18 2+6 2)/3 408.3 SS A TA2/nb C 40.3(46 2+24 2)/6 408.3 SS B TB2/na C 75.0(50 2+20 2)/6 408.3 SS AB T2/6 C 3.0(382+32 2)/6 408.3 SS e SST SS r SS t 11.2SS m Tm 2/b C 41.7(15 2+9 2+7 2)/2 408.3SSEa SS m SS r SS A 1.2SSEb SS e SS Ea 10 用空列的SSAB实现“自动检校”:SS SS AB 3.0 SS t SSA SS B 3.0,SST SS t SS r SS e 分解 SSA SS BSS AB SSE a SS E b 再分解SSm SS A SS r SSE a 分解,第四节 裂区试验数据,三、列ANOVA表,进行F-testSOV DF SS MS F F 0.01主区 5 41.7 区组 2 0.2 A 1 40.3 40.3 67.2*98.49 Ea 2 1.2 0.6 B 1 75.0 75.0 30.0*21.2AB 1 3.0 3.0 1.2 21.2 Eb 4 10 2.5 总 11 129.7四、多重比较主区因素A的两个水平间差异显著;SE MSEa/nb 0.66副区因素B的两个水平间差异极显著;SE MSEb/na 2.56,、各水平组合间的比较 Se 2(b1)MSEbMSEa/b(21)2.50.6/2 1.55 SE MSe/n 1.553 0.72 k S2Ea/(S2Ea(b1)S2Eb)0.6 3.1 0.194 1-k 0.8061 k2/1(1-k)2/2 1(0.1942/20.8062/4)5.5按5.5以内插法查算SSR值后再比较:P LSR 顺序 t 0.05 0.01 0.05 0.01 A1B1 10.67 a A2 2.56 3.94 A2B1 6.00 b B3 2.64 4.13 A1B2 4.67 bc B4 2.68 4.23 A2B2 2.00 c B 本例试验方案不能模仿!因为主、副区自由度太小,实际应用不利于发现真实差异。,本章内容小结,关于复因素试验数据的方差分析原理:将所有观察值按不同的处理(水平组合),分组数即水平组合数,各组观察值个数即重复次数。则算得的组间平方和(自由度)加上组内平方和(自由度)必定等于全试验的总平方和(自由度);对完全随机试验结果而言:SST 组间 SS t 组内SSe dfT 组间df t 组内dfe 对其它不完全随机试验的结果而言,由于观察值还可按其它系统因素如不同的区组来进行分组,所以就可算出多个组间平方和(自由度),此时的误差平方和(自由度)即剩余平方和(自由度),以随机区组试验为例:SSe SST SSt SSr dfe df T df t dfr 将各处理包含的 n 个观察值求和,所得Tt 值又可按每个试验因素的不同水平进行分组,有几个试验因素,就有几种分组方式,也就可算出几个组间平方和(自由度),那就是各因素主效应的平方和(自由度);用其处理平方和(自由度)减去这些组间平方和(自由度)得到的剩余平方和(自由度)就是各种互作效应平方和(自由度)的累加值,这是“可加性”的第三层含义。对两因素试验数据而言:SS t SSA SS B 剩余SS SSAB dft df A dfB 剩余 df dfAB 对三因素试验数据而言:SS t SSA SS B SS C剩余SS(SSAB SSAC SSBC SSABC)df t df A df B df C剩余df(df AB df AC df BC df ABC)四因素及其以上的试验数据的SSt 再分解过程类推。,本章内容小结,关于正交表在经典试验统计中的功用:(即正交表在经典试验设计的复因素试验结果的方差分析过程中的作用)只要复因素试验方案“有表可套”,则不论因素多少,所有数据的整理都可用相应的正交表一表完成,无需另外单列两向表计算主效应SS和互作效应SS;用正交表算得的空列SS、DF或其累加值就是相应的互作效应SS、DF值,这一优点使得按SSt 再分解原理算得的剩余SS、DF值可与之“相互佐证”,类似会计记帐时的“逼角”,是正交表在经典试验统计中所能起到的十分独特的功用;用正交表参与复因素试验结果的方差分析过程体现了正交表与复因素试验的内在联系,认识这种必然性对正确理解正交表在建立多元统计模型中的作用非常重要,即:正交试验设计回归正交设计回归旋转设计(旋转组合设计);有正交表参与方差分析过程时,处理平方和SSt 的再分解步骤异常简洁、直观,本来烦琐的复因素试验结果的平方和再分解运算变成用几乎是同一个算式循环操作,其程序无须专业人员就可编制,个人电脑应用起来十分方便。不仅是随机区组试验,其它经典试验设计如裂区设计、系统分组设计等得到的数据结果,只要设计方案时稍加考虑,使得SSt 的再分解“有表可套”,同样可发挥正交表的功用。,