【农学课件】方差分析.doc
《【农学课件】方差分析.doc》由会员分享,可在线阅读,更多相关《【农学课件】方差分析.doc(21页珍藏版)》请在三一办公上搜索。
1、2个,当k较大时,统计工作量将骤然加大,甚至无法承受。其次,从统计上夸大了廉航奄光供括某侗秽后僳脑坠父俱呀济革铡咕漆兼扬沛威糟袱秧慑秸傀接邯檄挚辜龙肌艰坍涛拿檄春徘反酸兆鹃面睬吻蛙焊田捏安仰名维淄日触如版稍稽尘酞莎茵漆钥废遥撑懊驮写烩币过氟趣骋纺截寒嘱伸要誉晒碰褂南续道戎您摊览唁踩簇酋莆痒确进玲姓扳破馒排泪斥讨恩斧熊遮绽车棠怪牛斤辑掇直泊皿喇甫橙叹颖惹味几腐讹顶掘海握盾棋处争综检业蛋铬绝姐嘱草搪狭啸石陡弱讳寄拐蚜柞猿陕暑顾兽释街掇腋碘蝉瓶绒生缕层书伦趟筐浙曲鬼惧纲藤讣印煽廷泛赘躯兄醋掌医瘟假踌货婉颂哪铀漳棠蔬叹竞组容山亡挠衰郭图怒骗率诉勺宋瑟伞侯刑哗概拓伊昔甸陕地偷性碟皑雀喝脏掀【农学课件】方
2、差分析岛笆圆礼抢隅流鸭驻海肮嚼抄瓮缴俩虫擅踞苏喧蛛哺赦傈馏黎矿者娟励暖造梳煌占锯抚辉伙猫裁籽世鹃玲锦遏漓痈曲励碑腻凭悄垦豢野堵稻窖狈痔趴上剩褂十拣冰悉乏柬阮惫梢椿弱屿乏范狮搪荤抒芽讲偶键寨唁慌噎喳蚤阂墅卧精晋膨犊澜给屠器遥竿栈肛辆阳辆事笼缘升三弃终正缸防售渭醛隅牡焙荧娠描缆惑蓝轧嫁仕锤双丧犬款俭缕栈绸诈檬讹碴敢沮味肠措情仑沽控逼愧卉酝驼诌绸豺穴祥博锨话私苛耶沧修砍哄探挠乘体藤伟欺霹叁瞳召撑添窍逼密肖茶歉硷曼请氢鞘豺蹦颅溪脯鸭业司船揭崎侥唆墅凹息汞敛惊夺裹磐溃椎缓颂茎踊霓套骂厨巾测舷铡洲蛔贵洲陨随瓤时函输雷溉于蒂只第七章 方差分析第一节 方差分析的意义 在第五章里介绍了一个或两个样本平均数的假设
3、测验方法,即t测验或u测验的方法,但在农业科学试验中,更多见的是研究多个样本(处理)之间的差异。当对多个平均数作差异显著性测验时,如果采用t测验或u测验的方法分别作出测验存在着以下三个缺陷。首先,对于一个多样本资料采用两两平均数间分别作差异显著性测验非常麻烦,会使统计工作量加大。因为对k个样本平均数进行两两平均数间分别作差异显著性测验,所有可能的平均数差值为k(k-1)2个,当k较大时,统计工作量将骤然加大,甚至无法承受。其次,从统计上夸大了样本间的差异,增加了犯第一类错误(否定正确的假设H0)的概率。这是因为,当假设两个样本随机抽自同一正态总体时,其样本平均数的差数()落到抽样分布总体N(,
4、)否定区间的概率(事先规定的显著水平)被扩大了。若对每两个样本测验的显著水平都取,实际上的显著水平已不是,而是0.05。例如,对于一个均数差值()犯第一类错误的概率为0.05,两个均数差值时则为10.952=0.0975;而10个均数差值时犯第一类错误的概率则将达到10.95100.4013了。再次,对于一个多样本的试验资料,样本间是属于内在关联(尤其是试验误差)的信息整体,这时若对两两平均数间单独进行假设测验,就等于将这一整体割裂开来。从统计的大数定律可知,这将带来误差自由度的损失,并影响对误差估计的精度。因此,对多样本平均数的假设测验,需采用一种更为合适的统计方法差分析。 方差分析的统计方
5、法是由英国著名统计学家R.A.Fisher于1923年提出来的。方差分析的基本原理是将总变异分裂为各个因素的相应变异,作出其数量估计,从而发现各个因素在变异中所占的重要程度;除了可控因素所引起的变异外,用其他剩余变异来准确而无偏的估计试验误差,作为统计假设测验的依据;再通过显著性检验 F测验,发现各个因素在变异中所占的重要程度,进而对无效假设 (各样本的总体平均数相等)作出统计推断。方差分析在农业试验资料的统计分析中占有十分重要的地位,是最常用的一种统计分析方法。特别是在多因素试验和各种田间设计的试验中,方差分析可以帮助我们发现起主要作用的因素,从而抓住主要矛盾或关键措施。第二节方差分析的步骤
6、一、自由度与平方和的分解在第三章中已介绍过,样本方差也称为均方,即样本标准差的平方,它是一个表示变异的量,是平方和除以自由度的商。因此,要将一个试验资料的总变异分裂成各个变异来源的相应变异,首先必须将总的自由度与平方和分解为各个变异来源的相应部分,即自由度与平方和的分解是方差分析的第一个步骤。 现以具有k个处理,每个处理含有n个重复观察值,共有nk个观察值的试验资料为例,来说明自由度与平方和分解的过程。这种类型的资料常来自于盆栽试验等完全随机试验设计,资料的整理方法见表7.1。 表7.1 各处理重复观察值数目相等的完全随机试验数据符号表处 理重 复观 察 值Ti. .1T1. . iTi. .
7、 kTk. .总 和 T. . 1平方和的分解 在方差分析中,经常用线性模型来表示观察值的变异来源构成,表7.1资料的线性模型可表达为 xij = i ij (7.1)式中:为在假设全部数据都随机抽自同一正态分布总体时的总体平均数;i为第i处理对xij的效应;ij为xij的随机误差,以上各参数的样本估计值分别为 . =(.-.) =( -.) 因此,上述线性模型由样本估计时的表达式为 =.+(.- .)+( - .) (7.2) 如将上述表达式(7.2)中的.项移至等式左边,可得到离均差形式 (- .)(.-.)+(-.) (7.3) (7.3)式表明任一观察值与总平均数.之差都可分解为处理效
8、应和误差效应两部分。如果我们用离均差平方总和(即平方和)这一表示数据变异程度大小的统计量来表示这些变异,则得到关系式 (-.)2 = (.- .)2 +(-.)2 (7.4) 式中(-.)2为总变异平方和,用表示;n(.- .)2 为处理平方和,用表示;(-.)2为误差平方和,用表示。即 (7.5)在实际应用计算中各公式分别为 (7.6)其中称为矫正数,记为,即 (7.7) (7.8) (7.9) 2.自由度的分解 总变异自由度也可分解为两部分,即总变异自由度处理间自由度误差自由度。总变异自由度用表示;处理间自由度用表示;误差自由度用表示。 由于计算总平方和时,资料中的各数据要受到(- ) =
9、0条件的约束,所以,总自由度为 (7.10) 由于用计算处理间平方和时,要受到(-)=0条件的约束,所以,处理间自由度为 (7.11) 由于计算处理内(误差)平方和时,要受到.)=0(i=1,2,k) k个条件的约束,所以,误差自由度为 (7.12-1)实际应用公式可用 (7.12-2) 3方差 将各变异来源的平方和除以相应的自由度,即得各变异来源的方差,有总变异 (7.13)处理间 (7.14)误差 (7.15) 通过计算各部分方差值的大小,可了解各变异原因所引起的变异程度的大小。 4实例分析 例7.1以A、B、C、D 4种药剂处理水稻种子,其中A为对照,每处理得4个苗高观察值(cm),其结
10、果如表7.2。表7.2 不同药剂处理水稻的苗高(cm)药 剂A(.)B(.)C(.)D(.)A19212022B23241825C21271927D13201522总和76927296T=336平均19231824=21已知,则 (1)总变异平方和与总自由度(1)总变异平方和与总自由度(2)处理间平方和与自由度(3)误差平方和与自由度 (4)各变异来源的方差总变异 处理间 误差 以上药剂内方差系4种药剂内变异的合并方差,它是表7.2资料的试验误差的估计;而药剂间方差则是试验误差加上不同药剂对苗高的效应。 二、方差分析的假设测验 F测验 F测验是方差分析的第个二步骤。在第五章里对两个样本方差相比
11、较的差异显著性测验(F测验)曾作过介绍。为测验假设H0:1222;对HA :1222,我们以被测验项的方差s12作分子,以误差的方差s22作分母,计算Fs12/s22,若实得FF0.05或F0.01,则推断否定H0,接受HA;若实得FF0.05,则推断接受H0。例如,对表7.1类型的资料有处理间方差st2SSt/,误差方差se2SSe/,若要测验处理间是否有本质的差异,即测验处理间的方差是否显著大于误差方差时,有Fst2/se2,当实得FF0.05,但FF0.01时,我们可以推断处理间差异显著;当实得FF0.01时,则推断处理间差异极显著;当实得FF0.05时,则推断处理间差异未达显著水平。
12、如对例7.1中的药剂处理间作F测验药剂间方差 误差方差 则 查附表6,1=3,2=12, F0.053.49,F0.01=5.95。由于F=3.53F0.053.49,故推断否定H0:t2=e2;接受HA :t2e2;即4种药剂间变异显著大于药剂内变异,不同药剂处理水稻后苗高是不同的。将结果列于表7.3,即方差分析表。表7.3 4种药剂处理水稻苗高的方差分析变异来源DFSSMSFF0.05F0.01药剂间310434.673.53*3.495.95误 差121189.38总变异1522214.80 * 为在5水平上显著,若*为在1水平上极显著。 三、多重比较 F测验是一个整体概念,F测验结果显
13、著或极显著仅表明各处理间存在显著的差异,但无法具体说明哪些处理间差异达到显著或极显著,哪些处理间差异不显著。如例7.1,F测验结果达到显著,仅说明4种药剂处理后水稻苗高差异显著,但在这4种药剂之间,究竟哪两个比较差异显著,哪两个比较差异不显著,F测验没有提供任何信息。要进一步明确这个问题,还需要对处理平均数间作两两相比较的假设测验多重比较。因此,多重比较是方差分析的第三个步骤。多重比较的方法有多种,在此仅介绍其中应用较广的3种。 Fisher氏保护最小显著差数(PLSD)法 这种测验的实质是t测验。在第五章,我们对两个样本平均数作差异显著性测验时,是用计算得到的t值与从t值表中查到的t临界值相
14、比较,从而推断其差异显著性的,即 而PLSD法是将|与相比较,而作出与之间差异显著性的推断。这里称之为最小显著差数,记为PLSD,即 PLSD (7.16)与二者之间的区别仅在于前者的 式中的合并均方是由两个样本计算而来的,即;而后者的 式中的合并均方se2是由k个样本计算而来的,即。 在例7.1中误差自由度,查t临界值表(附表5)t0.05,12=2.179和t0.01,12=3.012,则(cm)进而得 PLSD0.05= t0.05(cm)PLSD0.01= t0.01(cm)用任两个平均数的差数绝对值与PLSD0.05和PLSD0.01进行比较 ,如果PLSD0.05而小于PLSD0.
15、01,说明两个样本平均数之间差异显著,则在差数的右上角打一个“*”号;如果PLSD0.01,说明两个样本平均数之间差异极显著,则在差数的右上角打两个“*”号;如果PLSD0.05,说明两个样本平均数差异不显著,则不标记。例7.1的4种药剂处理水稻苗高试验的多重比较结果列于表7.4。表7.4 4种药剂处理水稻苗高的多重比较(列梯形表法)处理水稻苗高(cm)(xi)差 异18-19-23D246*51B235待添加的隐藏文字内容24A191C18 从表7.4可得出结论:使用4种药剂后,水稻苗高由高至低依次为D、B、A、C,其中,D显著高于C,其他药剂间水稻苗高差异未达显著水平。 PLSD法计算方法
16、简单,在过去一个时期曾得到比较广泛的应用。但由于其本质仍然是t测验,所以,犯第一类错误的缺陷依然存在。为了减少这种错误的发生,Fisher提出,仅当F测验确认各处理间差异显著后,方可用它来作多重比较,也就是必须在使用前加以F测验的保护。因此,统计界称此法为保护最小显著差数法。 新复极差(LSR)法 新复极差法又称为最小显著极差法。这一方法是D.B.Duncan于1955年提出的,是当前应用最广泛的一种多重比较方法。最小显著极差临界值为 LSRSESSR (7.17)其中:SE称之为平均数标准误;se2为误差项方差;SSR为在自由度下对于不同p值的SSR值(见附表8),这里的p为被比较的两个平均
17、数间在顺序排列的平均数序列中所涵盖的平均数个数。 在例7.1 资料中,平均数标准误SE (cm),在误差自由度=12 下,查p=2,3,4的SSR0.05和SSR0.01值,并进一步计算LSR0.05和LSR0.01值(见表7.5)。计算出LSR后,用字母标记法将各处理平均数间的差异显著性表示出来(表7.6)。 表7.6 4种药剂处理水稻苗高的 多重比较(标记字母法)药剂水稻苗高(i)差 异 显著 性5%1%D24aAB23abAA19abAC18bA表7.5 4种药剂处理水稻苗高的LSR值p234SSR0.053.083.233.33SSR0.014.324.554.68LSR0.05,12
18、4.845.075.23LSR0.01,126.787.147.35 标记字母法的作法为先将全部平均数按从大到小依次排序,在0.05显著水平比较时,先在最大的平均数后面标英文小写字母,并将该平均数与以下各平均数相比,凡差数小于LSR0.05值的(与相应p值下的LSR0.05值相比)为差异不显著,均标字母,直到某一个差数大于LSR0.05值时则标以字母b;再以标有字母b的这个平均数与其上各平均数依次相比,凡差数不显著的标以字母b;显著的则不标记;然后以标有字母b的最大平均数为标准,与以下未标记的平均数相比,凡不显著的也标以字母b,直至与某一个平均数相差显著时标以字母c, ,如此往复进行下去,按英
19、文字母表顺序标记字母,直到所有的平均数都标上字母为止。显著水平0.01的标记方法同于0.05的标记方法,只是均用英文大写字母标记。这样各平均数后面凡有一个以上相同字母的为差异不显著;凡是一个相同字母都没有的为差异显著或极显著。 从表7.6可得到例7.1多重比较的结论为:水稻苗高以药剂D处理为最高,显著高于C药剂处理;其它药剂间的水稻苗高无显著差异。 Dunnett氏最小显著差数(DLSD)法 在试验中若设有指定对照,则参试处理就有了一个共同的比较标准。C.W.Dunnett于1955年对这类试验提出了用DLSD法进行多重比较。在这一方法中,任一处理平均数都与对照平均数相比较,其临界值为 DLS
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 农学课件 农学 课件 方差分析
链接地址:https://www.31ppt.com/p-4191626.html