两因素完全随机设计.ppt
第三节 两因素完全随机设计 试验资料的方差分析,设试验考察A、B两个因素,A因素分a个水平,B因素分b个水平。所谓交叉分组是指A因素每个水平与 B因素的每个水平都要碰到,两者交叉搭配形成ab个水平组合即处理,试验因素 A、B在试验中处于平等地位。,一、两因素交叉分组试验资料的方差分析,(一)两因素单个观测值试验资料的 方差分析,对于A、B 两个试验因素的全部ab个水平组合,每个水平组合只有一个观测值,全试验共有 ab 个观测值,其数据模式如 表5-21 所示。,下一张,主 页,退 出,上一张,下一张,主 页,退 出,上一张,两因素单个观测值试验的数学模型为:,下一张,主 页,退 出,上一张,式中 为总平均数;i,j分别为Ai、Bj的效应:i=i-,j=j-i、j分别为Ai、Bj观测值总体平均数,且i=0,j=0;ij 为随机误差,相互独立,且服从N(0,2)。,下一张,主 页,退 出,上一张,两因素交叉分组单个观测值的试验资料,A因素的每个水平有b次重复,B 因素的每个水平有a次重复,每个观测值同时受到A、B 两因素及随机误差的作用。因此全部ab 个观测值的总变异可以分解为 A 因素水平间变异、B因素水平间变异及试验误差三部分。,下一张,主 页,退 出,上一张,平方和与自由度的分解式如下:,下一张,主 页,退 出,上一张,总平方和,下一张,主 页,退 出,上一张,各项平方和与自由度的计算公式为,矫正数,误差平方和 SSe=SST-SSA-SSB,B因素平方和,A因素平方和,总自由度 dfT=ab-1A因素自由度 dfA=a-1B因素自由度 dfB=b-1误差自由度 dfe=dfT-dfA dfB=(a-1)(b-1),下一张,主 页,退 出,上一张,【例5-5】为了研究不同的田间管理方法对草莓产量的影响,选择了 6个不同的地块,每个地块分成 3 个小区,随机安排 3 种田间管理方法,所得结果见 表5-22,试作方差分析。,下一张,主 页,退 出,上一张,这是个两因素单个观测值试验结果。A因素有 6 个水平,即 a=6;B 因素有3个水平,即b=3;共有ab=63=18个观测值。,下一张,主 页,退 出,上一张,1、计算各项平方和与自由度,下一张,主 页,退 出,上一张,2、列出方差分析表,进行F 检验,下一张,主 页,退 出,上一张,F捡验结果表明:不同地块和不同田间管理方法对草莓的产量均有显著或极显著影响,有必要进一步对 A、B 两因素不同水平的平均产量进行多重比较。,3、多重比较,(1)不同地块的草莓平均产量比较,采用q法(见表5-24)。在两因素单个观测值试验情况下,A因素每一水平的重复数恰为B因素的水平数b。,下一张,主 页,退 出,上一张,根据dfe=10,秩次距k=2,3,4,5,6从附表5中查出=0.05和=0.01的临界q值,与标准误相乘,计算出最小显著极差LSR,q值及LSR值列于表5-25。,下一张,主 页,退 出,上一张,(2)不同田间管理方法的草莓平均产量比较,B因素各水平平均数比较表见表5-26。在两因素单独观测值试验情况下,B 因素(本例为田间管理方法)每一水平的重复数恰为A因素的水平数a。,B 因素的标准误 根据dfe=10,秩次距k=2,3,查临界 q 值并与 相乘,求得LSR,见表5-27。,在进行两因素或多因素的试验时,除了研究每一因素对试验指标的影响外,往往更希望研究因素之间的交互作用。例如,通过对播种期、播种密度、施氮量、施钾量、施磷量对作物生长发育的影响有无交互作用的研究,对最终确定有利于作物生产的最佳栽培技术体系是有重要意义的。,下一张,主 页,退 出,上一张,前面介绍的两因素单个观测值试验只适用于两个因素间无交互作用的情况。若两因素间有交互作用,则每个水平组合中只设一个试验单位(观察单位)的试验设计是不正确的或不完善的。这是因为:,下一张,主 页,退 出,上一张,(1)在这种情况下,SSe,dfe 实际上是A、B 两因素交互作用平方和与自由度,所算得的MSe是交互作用均方,主要反映由交互作用引起的变异。(2)这时若仍按【例5-5】所采用的方法进行方差分析,由于误差均方值大(包含交互作用在内),有可能掩盖试验因素的显著性,从而增大犯型错误的概率。,因此,进行两因素或多因素试验时,一般应设置重复,以便正确估计试验误差,深入研究因素间的交互作用。,下一张,主 页,退 出,上一张,(3)因为每个水平组合只有一个观测值,所以无法估计真正的试验误差,因而不可能对因素的交互作用进行研究。,(二)两因素有重复观测值试验资料的方差分析,对两因素和多因素有重复观测值试验结果的分析,能研究因素的简单效应、主效应和因素间的交互作用(互作)效应。,下一张,主 页,退 出,上一张,1、简单效应 在某因素同一水平上,另一因素不同水平对试验指标的影响称为简单效应。如在表5-28中,在A1(不追肥)上,B2-B 1=480-470=10 在A2(追肥)上,B2-B1=512-472=40 在B1(不除草)上,A2-A1=472-470=2 在B2(除草)上,A2-A1=512-480=32就是简单效应。简单效应实际上是特殊水平组合间的差数。,下一张,主 页,退 出,上一张,2、主效应 由于因素水平的改变而引起的平均数的改变量称为主效应。如在表5-28中,当A因素由A1水平变到A2水平时,A因素的主效应为A2水平的平均数减去A1水平的平均数,即 A因素的主效应=492-475=17同理 B因素的主效应=496-471=25 主效应也就是简单效应的平均,如(32+2)2=17,(40+10)2=25。,下一张,主 页,退 出,上一张,3、交互作用(互作)在 多因素试验中,一个因素的作用要受到另一个因素的影响,表现为某一因素在另一因素的不同水平上所产生的效应不同,这种现象称为该两因素存在交互作用。如在表5-28中:A在B1水平上的效应=472-470=2 A在B2水平上的效应=512-480=32 B在A1水平上的效应=480-470=10 B在A2水平上的效应=512-472=40,下一张,主 页,退 出,上一张,A的效应随着B因素水平的不同而不同,反之亦然,此时称A、B两因素间存在交互作用,记为AB。或者说,某一因素的简单效应随着另一因素水平的变化而变化时,则称该两因素间存在 交互作用。互作效应可由(A1B1+A2B2-A1B2-A2B1)/2来估计。表5-28中的互作效应为:(470+512-480-472)/2=15,下一张,主 页,退 出,上一张,互作效应实际指的就是由于两个或两个以上试验因素的相互作用而产生的效应。如在表5-28中:A2B1-A1B1=472-470=2,这是追肥单独作用的效应;A1B2-A1B1=480-470=10,这是除草单独作用的效应;两者单独作用的效应总和是2+10=12。,下一张,主 页,退 出,上一张,但是,A2B2-A1B1=512-470=42,而不是12。这就是说,同时追肥、除草产生的效应不是单独某田间管理措施所产生效应的和,而另外多增加了30,这个30 是两种田间管理措施共同作用的结果。若将其平均分到每种田间管理头上,则各为15,即估计的互作效应。,下一张,主 页,退 出,上一张,设A与B两因素分别具有a与b个水平,共有ab个水平组合,每个水平组合有n次重复,则全试验共有abn个观测值。这类试验结果方差分析的数据模式如表5-29(P129)所示。,下一张,主 页,退 出,上一张,两因素有重复观测值试验资料的方差分析法,下一张,主 页,退 出,上一张,两因素有重复观测值试验的数学模型为:,其中,为总平均数;i为Ai的效应;j为Bj的效应;()ij为Ai与Bj的互作效应;ijl 为随机误差,相互独立,且都服从N(0,2)。,下一张,主 页,退 出,上一张,分别为Ai、Bj、AiBj观测值总体平均数;且,下一张,主 页,退 出,上一张,()ij为Ai与Bj的互作效应,因试验资料的总变异可分解为水平组合间变异与水平组合内变异 即 误差两部分,若 记A、B 水平组合间的平方和与自由度为 SSAB,dfAB,则两因素有重复观测值试验资料方差分析平方和与自由度的分解式可表示为:,因 A、B 水平组合间变异可再分解为A 因素,B因素,A因素与B因素交互作用变异三部分,于是SSAB、dfAB可再分解为:,其中,SSAB,dfAB为A因素与B因素交互作用平方和与自由度。,下一张,主 页,退 出,上一张,两因素有重复观测值试验结果方差分析平方和与自由度的分解式为:,各项平方和、自由度的计算公式如下:,总平方和与自由度,矫正数,水平组合平方和与自由度,A因素平方和与自由度,B因素平方和与自由度,交互作用平方和与自由度,误差平方和与自由度,【例5-6】为了研究不同的种植密度和商业化肥对大麦产量的影响,将种植密度(A)设置3个水平、施用的商业化肥(B)设置 5个水平,交叉分组,重复4次,完全随机设计。产量结果(kg/小区)列于表5-30(P131),试分析种植密度和施用的商业化肥对大麦产量的影响。,下一张,主 页,退 出,上一张,方差分析如下:,1、计算各项平方和与自由度,下一张,主 页,退 出,上一张,下一张,主 页,退 出,上一张,F捡验结果表明:种植密度、商业化肥及其互作对大麦的产量均有极显著影响。应进一步进行种植密度各水平平均数间、商业化肥各水平平均数间、种植密度与商业化肥水平组合平均数间的多重比较和进行简单效应的检验。,2、列出方差分析表,进行F 检验,3、多重比较,(1)种植密度(A)各水平平均数间的比较 不同种植密度平均数多重比较表见表5-32。因为 A 因素各水平的重复数为bn,故 A 因素各水平的标准误(记为)的计算公式为:,下一张,主 页,退 出,上一张,由dfe=45,秩次距k=2、3,从附表5中查出=0.05与=0.01的临界q值,乘以即得各LSR值,所得结果列于表5-33。,此例,(2)商业化肥(B)各水平平均数间的比较 不同商业化肥平均数多重比较表见表5-34。因为 A 因素各水平的重复数为an,故 B 因素各水平的标准误(记为)的计算公式为:,下一张,主 页,退 出,上一张,由dfe=45,秩次距k=2,3,4,5,从附表5中查出=0.05与=0.01的临界q值,乘以 即得各LSR值,所得结果列于表5-35。,此例,以上所进行的两项多重比较,实际上是A、B两因素主效应的检验。结果表明,种植密度以 A3 的产量最高;商业化肥以B4 的产量最高。若A、B 因素交互作用不显著,则可从主效应检验中分别选出 A、B 因素的最优水平相组合,得到最优水平组合;若 A、B 因素交互作用显著,则应进行水平组合平均数间的多重比较,以选出最优水平组合,同时可进行简单效应的检验。,下一张,主 页,退 出,上一张,(3)各水平组合平均数间的比较,一般推荐使用LSD法来进行各水平组合平均数的多重比较和简单效应检验。也就是说,用相同的检验尺度进行各水平组合平均数间的比较和简单效应检验。,下一张,主 页,退 出,上一张,水平组合的重复数为n,水平组合平均数差数标准误(记为)的计算公式为:,下一张,主 页,退 出,上一张,此例,由dfe=45,从 附表3 中查出=0.05、=0.01的临界t值,乘以,得各LSD值,即 以上述LSD值去检验各水平组合平均数间的差数,结果列于表5-36(P135)。,各水平组合平均数的多重比较结果表明,最优水平组合(即产量最高的组合)是A3B3。当A、B 因素的交互作用显著时,一般不必进行两个因素主效应的显著性检验(因为这时主效应的显著性在实用意义上并不重要),而直接进行各水平组合平均数的多重比较,选出最优水平组合。,下一张,主 页,退 出,上一张,(4)简单效应的检验 简单效应实际上是特定水平组合平均数间的差数,检验尺度仍为 LSD0.05=1.574 LSD0.01=2.103,A因素各水平上B因素各水平平均数间的比较,A1水平,平均数,A2水平,平均数,A3水平,平均数,B因素各水平上A因素各水平平均数间的比较,平均数,B2水平,B1水平,平均数,平均数,平均数,B3水平,B4水平,B5水平,平均数,简单效应检验结果表明:,当种植密度为A1时,施用商业化肥B3、B4的产量极显著或显著高于施用B1、B2、B5的产量,施用商业化肥B1的产量显著高于施用B5的产量;,当种植密度为A2时,施用商业化肥B4的产量极显著或显著高于施用B3、B1、B5、B2的产量,施用商业化肥B3的产量极显著或显著高于施用B5、B2、B1的产量,施用商业化肥B1的产量极显著高于施用B2的产量;,当种植密度为A3时,施用商业化肥B3、B4、B2、B1 的产量极显著高于施用 B5 的产量,施用商业化肥B3的产量显著高于施用B1的产量;,无论施用哪种商业化肥,都以种植密度A3的产量最高。,综观全试验,以水平组合A3B3的大麦产量最高。,三、系统分组资料的方差分析,在安排多因素试验方案时,将A因素分为a个水平,在A因素每个水平下又将B因素分成b个水平,再在B因素每个水平下将C因素分c个水平,这样得到各因素水平组合的方式称为系统分组。由系统分组方式安排的多因素试验而得到的资料称为系统分组资料。,例如土样分析,随机取若干地块,每地块取若干个样点,每一样点的土样又作了数次分析的所获得的资料;又如调查某种果树病害,随机取若干株,每株取不同部位枝条,每枝条取若干叶片,查各叶片病斑数所获得的资料等都属于系统分组资料。,在系统分组中,首先划分水平的因素(如上述的地块、果树)叫一级因素,其次划分水平的因素(如上述的样点、枝条)叫二级因素,类此有三级因素。在系统分组中,二级因素的各水平套在一级因素的每个水平下,它们之间是从属关系而不是平等关系,分析侧重于一级因素。,最简单的系统分组资料是二级系统分组资料。如果A因素有a个水平;A因素每个水平Ai下B因素分b个水平;B因素每个水平有n个观测值,则共有abn 个观测值,其数据模式如表5-37所示。,数学模型:,其中,为全部观测值的总体平均数;,为Ai的效应,,;,为Ai内Bij的效应,,;,、,分别为Ai、Bij观测值总体平均数;,为随机误差、相互独立、且都服从 N(0,2)。,表5-37资料的总变异可分解为A因素各水平(Ai)间的变异,A因素各水平(Ai)内B因素各水平(Bij)间的变异 和试验误差 三部分。,平方和与自由度的分解式为,其中SSB(A)、dfB(A)表示A因素内B因素的平方和与自由度。,各项平方和与自由度计算公式如下:,各项均方如下:,误差均方,A因素内B因素的均方,A因素的均方,F 检验时 F 值的计算:检验A因素时:检验A因素内B因素时:,【例5-7】随机选取3株植物,在每一株内随机选取两片叶子,用取样器从每一片叶子上选取同样面积的两个样本,称取湿重(g),结果见表5-38。分析不同植株和同一植株上的不同叶片间湿重差异是否显著。,矫正数,总平方和及其自由度,1、计算各项平方和与自由度,植株间平方和及其自由度,植株内叶片间的平方和及其自由度,误差 平方和及其自由度,2、列出方差分析表,进行F检验,表5-39,F 检验结果表明:不同植株的叶片湿重差异显著;同一植株的不同叶片的湿重差异极显著。,3、三株植株平均湿重的多重比较(SSR法),因为对一级因素(植株)进行F 检验时是以植株内叶片间均方作为分母,植株的重复数为bn,所以植株的标准误为:,由 dfB(A)=3,k=2、3,查附表 6,得SSR0.05和SSR0.01值并与 相乘,求出相应的LSR0.05和LSR0.01的值:LSR0.05,2=6.82,LSR0.01,2=12.52 LSR0.05,3=6.82,LSR0.01,3=12.88 三株植株叶片平均湿重的多重比较表。,多重比较结果表明:植株A3的叶片平均湿重极显著高于植株A1、显著高于植株A2;植株A2与A1的叶片平均湿重差异不显著。,对于植株内叶片间的差异问题,由于不是我们研究的重点,故可以不进行多重比较。若要比较时,应由 计算标准误,以自由度dfe=6查SSR值或q值。,