《方差分析㈠》PPT课件.ppt
《《方差分析㈠》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《方差分析㈠》PPT课件.ppt(33页珍藏版)》请在三一办公上搜索。
1、第五章 方差分析(一),第一节 方差分析原理(一个性质、两个分布、三个假定)第二节 单向分组数据(各组观察值个数有相同和不相同之分)第三节 多向分组数据(含两向分组、三向分组实例)第四节 三个假定与数据转换*(正态性、可加性、同质性),第五章要点提示,方差分析是本课程的重点,它与试验研究联系最为密切。学习时要从完全随机设计(单向分组)的试验数据着手,结合显著性检验的知识,深刻理解方差分析原理的全部内涵,即一个性质、两个分布和 三个假定(某些情况下作数据转换的必要性);区分LSR法多重比较与t-test的异同点;重点掌握单因素随机区组和拉丁方试验结果的方差分析法,能熟练地运用字母法标记多重比较结
2、果。涉及教材内容:第六章第一、二、五节,第十二章第五、六、七节。作业布置:教材第六章第四节内容自习;教材P150 T1、T3、T4、T12、T13、T14、T21、T22、T23,教材P325 T7、T8、T13。,第一节 方差分析原理,方差分析(analysis of variance),缩写词原为ANOVA,现在也用AOV。它是对多个样本平均数进行假设测验的方法,因为对三个以上的平均数差异进行比较时,采用只能就一个或两个样本平均数差异进行显著性测验的方法已不敷应用,例如:例5.1 某水产研究所为了比较 k=4种不同配合饲料对鱼的饲喂效果,选取了条件基本相同的鱼20尾,随机分成4组,投喂不同
3、饲料,一个月后每个处理各得n=5个增重观察值,且T=550.8,=27.54,试予分析。解 本例需要分析两个方面的问题:鱼经不同饲料投喂后增重是否 有显著差异(即存在本质差别)?若有显著差异的话,在哪些饲料之间?,如果按第三章的方法,直接进行显著性检验,就要孤立地对以下6个两两差数做t-test,即:顺序 t t24.74 t26.28 t27.96 A1 31.18 6.44 4.9 3.22 A4 27.96 3.22 1.68 A2 26.28 1.54 A3 24.74,第一节 方差分析原理,把一份完整的原始数据部分地撇开,孤立地对两两差数进行t-test,其消极后果佛克伦这样描述过:
4、从同一总体中抽样,每次抽两个样本得1和2后求算 t 值,若指定它超过某值的概率为5%的话,该值就是两尾表中查得的临界值 t0.05 再以相同的样本容量每次抽三个样本,用最大的样本和最小的样本求算 t 值,此时它超过“t0.05”的概率上升到14.3%(即“t0.05”=t0.143)继续以相同的容量每次抽四个样本,仍以最大的和最小的求算t 值,则上升到26.5%(即“t0.05”=t0.265)以此类推5个样本40%以上。,比如本例针对药剂A1与药剂A3的两两差数6.44(最大 最小)进行的t-test:F=S大2/S小2=41.67/415.97/4 F0.05 Se2=(SS1+SS2)/
5、(1+2)=57.64/8 S 1-2=Se2(1/n1+1/n2)=1.70 t=(1-2)(1-2)S1-2=6.44 1.70=3.8“t0.05”=2.306 由于撇开A、B孤立地进行,否定HO的把握不到80%。,第一节 方差分析原理,一、数据整理 根据方差分析的先决条件,在“三个假定”成立的前提下,对右表继续整理:C=T 2/nk=550.8 2/20=15169.03SST=(Y)2=Y 2 C=31.92+28.52 15169=199.67dfT=nk 1=5 4 1=19二、平方和、自由度的分解Y=(Yt)+(t)两边同时平方,得:(Y)2=(Y t)2+(t)2+2(Y t
6、)(t)由同一处理重复观察值的累加:(Y)2=(Yt)2+(t)2+2(t)(Y t)=0(Y)2=(Y t)2+n(t)2,再把全部处理观察值的累加,得:(Y)2=(Yt)2+n(t)2即:SST=(组内)SSe+(组间)SSt 其中 SSt=n(t)2=Tt 2/n C=(155.9 2+131.4 2+123.7 2+139.8 2)/5 15169.03=114.27于是SSe=SST SSt=199.67 114.27=85.4=SS1+SS2+SS3+SS4=41.67+5.43+15.97+22.33 dft=k 1=3 dfe=dfT dft=193=df1+df2+df3+d
7、f4=4+4+4+4=16,第一节 方差分析原理,三、列ANOVA表,进行F-test 变异来源 DF SS MS F F 0.01 处理 3 114.27 38.09 7.13*5.29 误差 16 85.4 5.34 总 19 199.67(F值右上角标一个*达到0.05,标两个*达到0.01)这里进行的F-test与第三章(Ho:大2 小2)的相同之处是都做右尾测验,查的是同一张F临界值表;不同之处是固定用误差方差Se 2作分母(Ho:t2 e2),而不论其相对大小。显然,F值越大,说明处理效应引起的数据变异不仅在量的方面所占比重较大,而且相对于误差引起的变异来讲显得越重要、越突出;本例
8、F-test结果显示极显著,表明原始数据的总变异主要由不同的饲料种类引起,各处理之间至少有两个存在着(极)显著差异。,以上一、二、三就是创建的方差分析法,其原理归纳如下:平方和与自由度的可加性;SST 综合了全部观察值的变异量,它汇总了各变异来源(SOV)导致原始数据和全试验平均数()出现差异的分量,包括可控因素分量和误差分量两类;“可加性”证实前者就是观察值按可控因素分组后算得的组间平方和(可控因素可以是试验因素,也可以是象单位组那样的其它系统因素)。试验设计有几个可控因素,数据就会有几种可能的分组方式,也就可以算出几个组间SS,而本属于组内SS的误差分量在平方和分解时总是由SST 减去所有
9、可控因素SS得到,因此它又被称为“剩余平方和”。自由度的剖分与平方和的剖分一一对应。依据F分布进行整体测验;只确定可控因素分量和误差分量的相对重要程度是否达到显著水平。,第一节 方差分析原理,四、多重比较 R.A.Fisher 创建的方差分析法并没有明确(极)显著差异究竟存在于哪些“组平均数”之间,F值(极)显著所包含的信息只有通过对C2n=k(k-1)/2个两两差数进行多次连续性测验才能完全揭露出来,这就是多重比较。多重比较不论用哪一种方法,区别于多 次孤立的 t-test 或者说体现其“连续性”特征之处有两个,一是必须使用同一个共用的标准误,记为“SE”),本例SEMSe/n 5.345=
10、1.033(10g);二是所依据的抽样分布由计算MSe即Se2的自由度dfe决定,并根据两两差数秩次距“k”的不同而有所修正。如本例k=2、3、4,测验时依据dfe=16的 t 分布并在k=3和4时修正为SSR分布如右。,顺序 t t24.74 t26.28 t27.96 A1 31.18 6.44 4.9 3.22 A4 27.96 3.22 1.68 A2 26.28 1.54 A3 24.74,=16,k=2 SSR=t2,=16,k=3,=16,k=4,3.23 3.15 3.00,第一节 方差分析原理,附表6 列出了各自由度对应的t 分布曲线再按9 种秩次距修正出来的SSR分布当两尾
11、概率取0.05和0.01时临界值,记为SSR0.05和SSR0.01,其中k=2的那一条因为实际就是 t分布曲线压缩横坐标刻度所得,所以表中列出的SSR0.05和SSR0.01就分别等于附表3所列t0.05 和t0.01的2 倍;其它k3的SSR分布随着P的递增,对 t 分布的修正幅度加大,因此表中列出的SSR0.05和SSR0.01也就随之递增。多重比较测验两两差数的显著性时不是将它除以SE转换成SSR(也是标准化变量!)后再与SSR0.05 和SSR0.01 比大小,而是先将SSR0.05和SSR0.01乘以SE算出“显著尺”LSR,再将它们直接和相应秩次距的两两差数比大小,超过LSR0.
12、05标*,超过LSR0.01 标*。,顺序 t t24.74 t26.28 t27.96 A1 31.18 6.44*4.9*3.22*A4 27.96 3.22 ns 1.68 ns A2 26.28 1.54 ns A3 24.74,=16,k=2 SSR=t2,=16,k=3,=16,k=4,3.23 3.15 3.00,第一节 方差分析原理,按照两两差数在三角梯形表中的排列规律,本例多重比较过程列表如下:LSR0.05=SE SSR0.05 LSR0.01=SE SSR0.01 顺序 t t24.74 t26.28 t27.96 A1 31.18 6.44*4.9*3.22*A4 27
13、.96 3.22 ns 1.68 ns A2 26.28 1.54 ns A3 24.74 SE=1.033,综合包括多重比较在内的方差分析全过程,其原理可归纳为:一个性质(SS、DF的可加性)两个分布(F分布和SSR分布)本例根据SSR分布进行的多重比较叫新复极差测验,简称SSR-test。因为不能缺少 F-test 显著的前提,属于Fishers protected multipe comparisons.此前产生的复极差测验(简称q-test、又称SNK测验)却可以不经过F-test,原因是q-test算LSR时要改查q 值表(附表7),所依据的q分布是按极差抽样分布原理要保证各比较都是
14、同一显著水平,因而对 t 分布修正幅度随秩次距k的递增而加大的速度要比SSR分布快,所以秩次距k3 时q0.05和q0.01 比相应的SSR0.05和SSR0.01大。,第二节 单向分组数据,单向分组数据指观察值仅按一个方向分组的数据。如例5.1中将全部供试单位(试验材料)随机地分成若干组,然后各组给以不同处理,即同组供试单位受相同处理,不同组受不同处理,这样所得的全部观察值在设计上称为完全随机试验数据,而实际研究中下例5.2那样的调查结果也属此类。一、各组观察值个数相等 例5.2 抽测 5个不同品种(k=5)各5头母猪(n=5)的窝产仔数,结果如右表所示,T=265,试检验不同品种的母猪平均
15、窝产仔数差异是否显著。,1、数据整理 C=T 2/nk=265 2/25=2809SST=(Y)2=Y 2 C=82+132+132 2809=136dfT=nk 1=5 5 1=24,第二节 单向分组数据,2、平方和、自由度的分解SSt=n(t)2=Tt 2/n C=73.2=(51 2+41 2+60 2+48 2+65 2)/5 2809于是 SSe=SST SSt=13673.2=62.8 dft=k 1=4 dfe=dfT dft=244=203、列ANOVA表,进行F-test 假设是Ho:t2 e2 而不是Ho:t2=e2(和 Ho:1=2=3=4=5效果一样)SOV DF SS
16、 MS F F 0.01 品种 4 73.2 18.3 5.83*4.43 误差 20 62.8 3.14 总 24 1364、多重比较 SE=MSe/n=3.145=0.793,再根据附表6的SSR进而算得显著尺:K SSR0.05 SSR0.01 LSR0.05 LSR0.012.95 4.02 2.339 3.1883.10 4.22 2.458 3.3463.18 4.33 2.522 3.4345 3.25 4.40 2.577 3.489,第二节 单向分组数据,本例的多重比较结果以三角梯形表表述如下:t 0.01 t 8.2 t 9.6 t 10.2 t 12.013.0 A 4.
17、8*3.4*2.8*1.012.0 A 3.8*2.4 1.8 10.2 AB 2.0 0.6 9.6 AB 1.4 8.2 B,t 13.0 12.0 10.2 9.6 8.2,第二节 单向分组数据,本例的多重比较结果以三角梯形表表述如下:t 0.05 t 8.2 t 9.6 t 10.2 t 12.013.0 a 4.8*3.4*2.8*1.012.0 ab 3.8*2.4 1.8 10.2 bc 2.0 0.6 9.6 bc 1.4 8.2 c,t 13.0 12.0 10.2 9.6 8.2,第二节 单向分组数据,单向分组数据的观察值也可以是交叉试验的数据。即在同一试验中给试验单位安排
18、处理时分期进行、交叉反复两次以上所获得的试验结果。这种试验设计方法能较好地消除试验动物个体(即试验单位)以及试验时期间的差异对试验数据影响,特别是能够利用较少的试验动物获得尽可能多的观察值个数。由于系同一批试验动物分期安排不同处理,所得观察值个数必然相等。例5.3 研究新配方饲料对奶牛产奶量(kg)的影响,设置对照饲料A1和和新配方饲料A2两个处理,采用 2 2交叉设计,用条件相近的10头奶牛分两期获得了20个原始数据,并算得二水平差值 d如右表,试完成其方差分析过程。,第二节 单向分组数据,1、数据整理 C=(d)2/nk=1.8 2/10=0.324 SST=d 2C=75.116=(1.
19、7)2+(2.2)2+1.0 20.324 dfT=nk 1=5 2 1=92、平方和、自由度的分解SSt=Tt 2/n C=60.516=(11.4)2+13.2 2/5 0.324SSe=SST SSt=75.11660.516=14.6 dft=k 1=1 dfe=dfT dft=91=83、列ANOVA表,进行F-testSOV DF SS MS F F 0.01 处理 1 60.516 60.52 33.16*4.43 误差 8 14.600 1.83 总 9 75.116,第二节 单向分组数据,例5.4 研究饲喂尿素对奶牛产奶量(kg)的影响,设置尿素配合饲料A1和和对照饲料A2两
20、个处理,采用 2 3交叉设计,用条件相近的6头奶牛分三期获得了18个原始数据,并算得二水平差值 d如右表,完成其方差分析的结果如下。(和例5.3一样,无需多重比较)ANOVA表:SOV DF SS MS F F 0.01 处理 1 1.6748 1.6748 1.60ns 7.71 误差 4 4.1727 1.0432 总 5 17.72,第二节 单向分组数据,二、各组观察值个数不相等 例5.5 5个不同品种猪的育肥试验,后期30天增重(kg)分别得到6、6、5、4、4个共25头猪的观察值(如下表),试比较不同品种间的增重有无显著性差异。1、数据整理 k=5 T=460.5 ni=25 C=T
21、 2/ni=460.5 2/25=8482.41,SST=(Y)2=Y 2 C=21.52+16.02 8482.41=85.34 dfT=ni 1=25 1=24可加性原理与前面例5.1、例5.2一样:SST=组间 SS t+组内 SS e dfT=组间 df t+组内 df e 由于各组观察值个数 ni 不全相等,方差分析过程部分计算公式随之改变,须注意其与前面例5.1、例5.2的区别!,第二节 单向分组数据,2、平方和、自由度的分解SSt=(Tt 2/ni)C=46.5=(1212/6+103 2/6+91.5 2/5+78.5 2/4+66.5 2/4)8482.41于是 SSe=SS
22、T SSt=85.3446.5=38.84 dft=k 1=4 dfe=dfT dft=244=203、列ANOVA表,进行F-test 假设是Ho:t2 e2 而不是Ho:t2=e2(和 Ho:1=2=3=4=5效果一样)SOV DF SS MS F F 0.01 品种 4 46.5 11.63 5.99*4.43 误差 20 38.84 1.94 总 24 85.344、多重比较 SE=MSe/no=1.944.96=0.625,按dfe=20查得SSR临界值后比较如下:P LSR 顺序 t 0.05 0.01 0.05 0.01 B1 20.2 a A2.95 4.02 B4 19.6
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 方差分析 方差分析 PPT 课件
链接地址:https://www.31ppt.com/p-5522611.html