随机区组试验设计与分析.ppt
第三章 随机区组试验设计及分析,本章学习目的与要求,掌握完全随机试验设计方法,能熟练运用专业知识划分区组掌握随机区组试验设计及统计分析方法进一步理解掌握方差分析方法随机区组缺值估计及其统计分析,最简单的完全随机设计:单因素完全随机设计、两因素完全随机设计。,第一节 完全随机实验设计,完全随机设计有两方面的含义:一是试验处理顺序的随机安排;二是试验材料的随机分组。,完全随机化试验设计:是将每个研究对象随机地分配到各个对照组或各处理组中的一种试验设计方法。,完全随机试验设计的优缺点,主要优点:(1)设计容易,处理数与重复数都不受限制,适用于实验条件、环境、试验动物差异较小的试验。(2)统计分析简单,无论所获得的试验资料各处理重复数相同与否,都可采用t检验或方差分析法进行统计分析。(如果是两个水平之间的对比则采用t检验的方法,如果是多个处理间的水平对比则采用方差分析的方法。)主要缺点:(1)由于未应用试验设计三原则中的局部控制原则,非试验因素的影响被归入试验误差,试验误差大,试验的精确性较低;(2)在试验条件、环境、试验动物差异较大时,不宜采用此种设计方法。,1、单因素完全随机设计(对比试验),【例21】在无酒精啤酒的研究中,为了解麦芽汁的浓度对发酵液中双乙酸生成量的影响,在发酵温度7,非糖比0.3,二氧化碳压力0.6kgcm2,发酵时间6d的试验条件下,选定麦芽汁浓度()为6(A1),10(A2),14(A3)3个水平,每个水平重复5次,进行完全随机化试验,寻找适宜的麦芽汁浓度。,第一节 完全随机实验设计,本试验中,水平数m3,重复r=5,共进行3515次试验。,此15次试验先做哪一个呢?,第一节 完全随机实验设计,现在采用查随机数字表确定试验顺序,(1)对所有试验编号,(2)确定读取随机数字的起始点,并读取相应数目的随机数字。,(3)根据随机数字的大小确定试验的先后顺序。,试验的先后顺序必须随机确定。随机化方法可采用抽签的方法,也可用随机数字表确定试验顺序。,查随机数据表,第11行13列,有86,往下读数有:46,32,76,07,51,91。如表21可见,第一节 完全随机实验设计,【例22】在食品安全性评价的预备试验中,希望了解试验动物(断乳大鼠)每天经口摄入不同量的某种有害物质后的体症反应情况。现将某有害物质A按大鼠每天经口摄入量不同分成A1,A2,A3,A4 4个水平,每个水平需用20只大鼠(雌雄各半)进行试验。,第一节 完全随机实验设计,本试验有四个水平,分为四组。由于每个组要求有20只(雌鼠10只,雄鼠10只),总计需要有40只雌鼠和40只雄鼠。现在要将其分配到四个组中。,(1)先将40只雌鼠按体重编号为l40;(2)再从随机表中随机指定某行某列,比如从随机数字表中的第10行第6列09开始向右读取40个2位数。,第一节 完全随机实验设计,如何分配这40只雌鼠和40只雄鼠呢?,分配可按照完全随机化的方法进行。,(3)查表得随机数据,09,47,27,96,54,49,17。依次录入动物编号下。,(4)然后用4去除每个随机数字,将余数1,2,3,4(除尽时,余数为4)置于相应随机数字下,相同余数对应的动物编号入同一组;若各组正好10只,分组完毕,否则再随机调整,直至各组均为10只。,第一节 完全随机实验设计,(5)假定初次分组的结果是:A111,A210,A312,A4=7。这就需要从A1,A3 组中分别随机取出1只和2只大鼠调整到A4组去。,方法是:再顺次读取3个随机数字,如55,23,64;再将55除以11,23除以12,64除以12,余数分别是11,11和4,这就意味着把A1组中的第11个对应的大鼠和A3组中第11和第4个对应的大鼠取出调整到A4组中去,最终每组10只雌性大鼠。,对于另40只雄性大鼠也如此分组,而后将4组雌鼠和4组雄鼠随机组合成4组,每组20只大鼠,雌雄各10只。这4组动物分别随机接受A1,A2,A3,A4处理即可。,第一节 完全随机实验设计,2、两因素完全随机设计,因素A与B的ab个水平组合各重复n次,进行试验时,这abnN次试验的先后顺序完全按随机方式确定,这就是两因素等重复完全随机设计方法。,【例23】为提高粒粒橙饮料中汁胞的悬浮稳定性,研究了果汁pH值(A)、魔芋精粉浓度(B)两个因素的不同水平组合对果汁黏度的影响。果汁pH值取3.5,4.0,4.5三个水平,魔芋精粉浓度()取0.1,0.15,0.2三个水平,每个水平组合重复2次,进行完全随机化试验。试验指标为果汁黏度(CP),越高越好。,第一节 完全随机实验设计,本项研究共计有9个组合。重复2次,共需18次试验。这18次试验的先后顺序完全按随机方式确定。,顺序确定的步骤:(1)将各因素水平组合全部列出;(2)将各因素水平组合编上号;(3)查出随机号,如第3列第11行,依次读取随机数据;(4)根据随机数据大小确定实验的先后次序。,第一节 完全随机实验设计,随机区组试验设计是一种随机排列的完全区组的试验设计。其方法是:,根据局部控制的原理,将试验的所有供试单元先按重复划分成非处理条件相对一致的若干单元组,每一组的供试单元数与试验的处理数相等。,然后分别在各区组内,用随机的方法将各个处理逐个安排于各供试单元中。,1、设计方法,第二节 随机区组试验设计方法,随机区组设计是一种适用性较广泛的设计方法。既可用于单因素试验,也适用于多因素试验。,由于同一区组内的各处理单元的排列顺序是随机而定的,故这样的区组叫做随机区组。,第二节 随机区组试验设计方法,【例24】某茶叶加工厂正在进行红碎茶加工。现在想考察不同的发酵时间对茶叶品质的影响,因此进行了通气发酵试验。发酵时间A有5个水平(k5):A1(30min),A2(50min),A3(70min),A4(90min),A5(120min)。试验目的是从各处理中找出最适的发酵时间。,第二节 随机区组试验设计方法,工厂有4台不同型号转子机用来揉切茶叶(分为甲、乙、丙、丁)。试验中多数非处理条件都能被控制为相对一致。试验设4次重复(r4)。因此采用随机区组法来安排本试验。,茶叶揉捻机,第二节 随机区组试验设计方法,试验分别以各台转子机安排1个区组(重复)。先给各台转子机(甲、乙、丙、丁)编号为区组I,。试验的每个供试单元以从转子机出来的每25kg揉碎叶为准。,各台转子机先后出来的5个25kg揉碎叶即为该区组的5个供试单元,分别编号为,。各处理顺序由随机方法(如抽笺法)确定.,第二节 随机区组试验设计方法,按方案,在甲机上最先出1个25kg揉碎叶安排第二水平A2,即发酵时间为50min;接着出来的第二个25kg揉碎叶安排第五个水平A5,即发时间120min;余类推。照此方案操作就可完成本试验全部实施工作。,随机区组试验设计在安排多因素试验时,【例25】在蛋糕加工工艺研究中,欲考察不同食品添加剂对各种配方蛋糕质量的影响而进行试验。本试验有2个因素,配方因素A有4个水平A1,A2,A3,A4(a4);食品添加剂因素B有3个水平B1,B2,B3(b3)。设3次重复(r3)。因试验用烤箱容量不很大,不能一次性将全部试验蛋糕烘烤完,只能分次烘烤,故选用随机区组法安排试验。,方法与单因素试验设计基本相同,只是事先要将各因素的各水平相互搭配成水平组合,以水平组合为处理,每个供试单元安排1个水平组合。,第二节 随机区组试验设计方法,根据题意,本试验的所有12个组合(ab4312):A1B1,A1B2,A1B3,A1B3,A2B1,A2B2,A2B3,A3B1,A3B2,A3B3,A4B1,A4B2,A4B3,依次编号为l,2,3,12。,由于烤箱容量不大,3次重复分3次烘烤。每次烘烤1个重复12个处理的蛋糕,作为1个区组。,第二节 随机区组试验设计方法,第二节 随机区组试验设计方法,依烘烤的先后次序标为区组I,。每次烘烤的12个处理蛋糕在烤箱中的具体排列顺序由随机方法确定。,优点主要有:(1)符合试验设计的3项基本原则,试验精确度较高。(2)设计方法机动灵活。(3)试验实施中的试验控制较易进行。(4)试验结果的统计分析简单易行。(5)试验的韧性较好。,缺点主要有:试验是按区组来控制的,区组内条件基本一致。进行结果分析时,区组间差异能消除,但不能分辨出区组内的差异。处理数太多时,一个区组内试验单元就多,控制难度相应增大。因此,试验处理数目有一定限制,一般15-20。,2、设计特点,第二节 随机区组试验设计方法,随机区组设计法可运用于多因素试验,但不是任何多因素试验都是用本法设计为最佳。通常本法主要适用于安排多个因素都同等重要的试验。,关于随机区组设计的区组(重复)数的确定,有人从统计学的角度,提出以试验结果作方差分析时误差项自由度df应不小于12为标准来确定。,3、注意事项,第二节 随机区组试验设计方法,在进行随机区组试验设计时,各区组内的随机排列应独立进行,也即各区组应分别进行1次随机排列,不能所有区组都采用同一随机顺序。各区组的随机顺序应不相同,否则试验中易产生系统误差。,我们说随机区组试验设计的试验精度比完全随机化设计为高,是针对环境条件或试验条件存在着较大差异,并且难于控制的情况而言的。,第二节 随机区组试验设计方法,随机区组设计的最大功效就是能很好地对试验环境条件和非处理条件进行局部控制,以最大限度地保证同一区组中的不同处理之间的非处理条件相对一致,使试验误差的影响降到最低。,如果某个试验本身规模不大,受环境条件的影响较小,或者环境条件及试验条件本身较为均匀一致或易于控制,这时,用随机区组法进行设计,其功效就不能明显表现出来。,第二节 随机区组试验设计方法,【例3-4】以淀粉为原料生产葡萄糖的过程中,残留许多糖蜜可作为生产酱色的原料。在生产酱色之前应尽可能彻底除杂,以保证酱色质量。今选用五种不同的除杂方法,每种方法做4次试验,各得4个观察值,结果见表2-4,试分析不同除杂方法的除杂效果有无差异?,第三节 随机区组试验结果分析,1、单因素试验结果的方差分析,这是一个单因素试验,因素为除杂方法Ai,共有5个水平,指标为除杂量Xij。即处理数k=5,重复数n=4。,第三节 随机区组试验结果分析,(1)试验资料的整理 X1=25.6+24.4+25.0+25.9=100.9同理计算出X2、X3、X4、X5的值和、X=100.9+109.8+108.1+113.7+85.0=517.5,第三节 随机区组试验结果分析,(2)计算各变异项平方和与自由度,矫正数 总离均差平方和=(25.62+24.42+21.22)-13390.3125=138.1975处理间离均差平方和=1/4(100.92+109.82+85.02)-13390.3125=128.475 处理内平方和 总自由度 处理间自由度 处理内(误差项)自由度,第三节 随机区组试验结果分析,(3)列方差分析表作F检验,查附表4,F0.05(4,15)=3.06,F0.01(4,15)=4.89F检验 F=32.12/0.65=49.41此FF0.01,即P0.01。推断:否定H0,接受HA,即不同除杂方法的除杂效果有极显著的差异。,第三节 随机区组试验结果分析,(4)多重比较,样本平均数的标准误:,第三节 随机区组试验结果分析,本例用新复极差法(SSR法)进行比较,根据dfe=15,查SSR表,得到秩次矩K2,3,4,5时的SSR0.05和SSR0.01值。,最小显著极差:,第三节 随机区组试验结果分析,表3-9 多重比较时的LSR值,第三节 随机区组试验结果分析,2、单因素随机区组试验结果的方差分析,与前面的单因素试验不同之处是多了一个区组。随机区组试验结果的统计分析,可将处理看作A因素,区组看作B因素,其剩余部分则为试验误差。,假设试验有k个处理,n个区组,则其自由度和平方和的分解式如下:总自由度=区组自由度+处理自由度+误差自由度,第三节 随机区组试验结果分析,试验的总变异剖分为处理变异、区组变异、试验误差等3项。,总平方和=区组平方和+处理平方和+试验误差平方和,第三节 随机区组试验结果分析,例3-7现有A、B、C、D、E、F、G等7个大豆品种,分别在3个地区种植,现在要比较7个品种中哪一个的蛋白质含量较高,其中E为传统品种,作为对照组,采用随机区组设计,3个地区种植的大豆品种的蛋白质含量结果如下表3-15,试作分析。,第三节 随机区组试验结果分析,第一步,资料整理,第三节 随机区组试验结果分析,第二步,计算各项平方和及自由度,第三节 随机区组试验结果分析,矫正数,总变异项平方和,区组间平方和,品种间平方和,误差平方和,第二步,计算各项平方和及自由度,第三节 随机区组试验结果分析,总变异自由度,区组间自由度,品种间(处理间)自由度,误差(处理内)自由度,第三步,列出方差分析表,并作F检验,第三节 随机区组试验结果分析,第四步,多重比较,第三节 随机区组试验结果分析,现在采用最小显著极差法(SSR法)比较,首先应算得样本平均数标准误SE,算得 值列于表3-19。,查SSR值表,当dfe=12时得k=2、37的 值,并根据公式,【例38】为了解5种小包装贮藏方法(A,B,C,D,E)对红星苹果果肉硬度的影响,进行了一次随机区组试验,以贮藏室为区组。试验结果如表25。试分析各种贮藏方法的果肉硬度的差异显著性。,第三节 随机区组试验结果分析,本例只涉及贮藏方法这1个试验因素,故为单因素随机区组 试验结果。试验的处理数k5,区组数r4。方差分析步骤如下:,第三节 随机区组试验结果分析,第一步,整理试验资料,第三节 随机区组试验结果分析,矫正数,第二步,计算各变异项平方和与自由度,总变异项,第三节 随机区组试验结果分析,区组项,处理项,误差项,第三节 随机区组试验结果分析,处理项均方,误差项均方,F 检验,第三节 随机区组试验结果分析,第三步,列方差分析表,作F检验,处理间F=4985F0.05,p0.05,故应推翻Ho,接受HA,说明从整体上看,5种贮藏方法下的平均果肉硬度存在显著差异,因而还须进一步作各种贮藏方法下果肉硬度均值之间的多重比较。,多重比较方法常用的有最小显著差数法(LSD法)和新复极差法(SSR法)。,第三节 随机区组试验结果分析,第四步,处理间多重比较,(1)最小显著差数法(LSD法)。,均数差异标准误,本例dfe12,MSe=0.2341,r=4,显著水准0.05,0.0l,由dfe 查t值表得t0.05(12)2.179,t0.01(12)3.055,于是有:,最小显著差数,第三节 随机区组试验结果分析,做出统计推断,第三节 随机区组试验结果分析,(2)新复极差法(SSR法)。,均数标准误,因有5个处理,秩次矩K就有4个值即:K2,3,4,5。由这4个K值和dfe=12,查SSR表,分别找出对应的SSRa值,就可计算出对应的最小显著极差LSR0.05。,最小显著极差,第三节 随机区组试验结果分析,如K=2时,查附表6得 SSR0.05(2,12)3.08,SSR0.01(2,12)=4.32,,于是 LSR0.05=0.24l93.08=0.745,LSR0.010.24l94.321.045,其余类推。,第三节 随机区组试验结果分析,新复极差法在作统计推断时,应注意对应不同K值的均值差数,应选用相应K值的LSRa作比较标准。,一般在均值差数三角形表中,每行最右端的1个差数对应的K值为2,从表210可见,K2的差数有0.45,1.73,0.10,2.02。,第三节 随机区组试验结果分析,第三节 随机区组试验结果分析,(1)线性模型,在双因素随机区组试验中,每个试验单元安排的是1个处理(水平组合)。处理效应ij就由3部分构成,即 ijAi+Bj+(AB)ij,3、双因素随机区组试验结果的方差分析,设试验有A,B两因素,A因素有a个水平,B因素有b个水平,作随机区组设计,有r个区组,则试验共有rab个观察值。,第三节 随机区组试验结果分析,双因素随机区组试验观察值的线性模型为:xijk+k+Ai+Bj+(AB)ij+ijk,式中:k1,2,r;i1,2,a;j1,2,b;为试验总体均值,其样本估计值为(全试验均值);ijk为试验误差,其相互独立,且服从N(0,2)分布,估计值为eij 满足;eijk0;k,Ai,Bj,(AB)ij 分别为区组效应、A因素主效、B因素主效和AB因素互作效应,其估计值分别是,第三节 随机区组试验结果分析,在可加性的假设下,可推知双因素随机区组试验结果的总变 异可分解为区组间变异、处理间变异和试验误差等3大项,而处理间变异又可进一步划分为A因素、B因素和AB因素互作 等3部分。,因此,方差分析时,就有平方和、自由度划分式:,SST=SSA+SSB+SSAB+SSr+SSeSSt=SSA+SSB+SSABdfT=dfA+dfB+dfAB+dfr+dfedft=dfA+dfB+dfAB,第三节 随机区组试验结果分析,在食品试验中,很多时候的双因素随机区组试验都属于固定模型,因此,其A因素、B因素、AB互作效应的F检验计算 F值公式应为:,第三节 随机区组试验结果分析,【例28】在蛋糕加工工艺研究中,欲考察不同食品添加剂对各种配方蛋糕质量的影响而进行试验。本试验有2个因素,配方因素A有4个水平A1,A2,A3,A4(a4);食品添加剂因素B有3个水平B1,B2,B3(b3)。设3次重复(r3)。因试验用烤箱容量不很大,不能一次性将全部试验蛋糕烘烤完,只能分次烘烤,故选用随机区组法安排试验。,第三节 随机区组试验结果分析,将例28的试验设计实施后,获得各处理蛋糕质量评分原始记录如表213。试作方差分析。,第三节 随机区组试验结果分析,第一步,试验资料的整理。,将表中的原始数据按区组和处理两分组整理,结果如下:,第三节 随机区组试验结果分析,然后按A,B 2因素构成另一张两向表,由此表计算另两项总和及均值;,第三节 随机区组试验结果分析,第二步,计算各变异项平方和与自由度,本例的各变异项平方和与自由度有如下几项:,矫正数,总变异,区组间,第三节 随机区组试验结果分析,处理间,A因素,B因素,AB互作,误差,第三节 随机区组试验结果分析,第三步,列方差分析表,并作F检验。,第三节 随机区组试验结果分析,第四步,多重比较。,(1)各种配方之间比较(A因素各水平间比较),采用LSD法:,最小显著差数,均数差异标准误,MSe0.262 6,dfe22,r3,b3,查临界t值表:t0.05(22)=2.074,t0.01(22)=2.819,第三节 随机区组试验结果分析,表214 各种配方的LSD法多重比较结果,第三节 随机区组试验结果分析,结果是:配方A2和A3最好,其次A1,最差A4,现以SSR法为例,均数标准误,K=2 时,最小显著极差,第三节 随机区组试验结果分析,(2)各种添加剂之间比较(B因素各水平间比较),K=3时,表3-33 各种添加剂新复极差检验的最小显著极差,第三节 随机区组试验结果分析,表234 各种添加剂的LSD法多重比较结果,结果是:添加剂B3和B1最好,最差B2,(3)各处理间比较。,如果交互效应的F检验为显著,则各因素不同水平的最佳搭配就不能简单地由各因素的最佳水平组合而成,而应在各处理的比较中选出。在作处理间的多重比较时,一般推荐使用LSD法。,最小显著差数,均数差异标准误,第三节 随机区组试验结果分析,处理间多重比较可以有3种形式。对于LSD法,这3种形式作统计推断时的比较标准都是共同的。即为上面计算的0.87和1.18这两个LSD值。,第三节 随机区组试验结果分析,形式1:,同一配方下不同添加剂间比较(同A异B间比较)这种形式的比较是固定配方因素(A)下进行添加剂因素(B)不同水平间比较,从中可以发现各种配方分别与何种添加剂搭配最为合适。比较结果见表216。,第三节 随机区组试验结果分析,表2-16 同一配方下各添加剂的LSD法多重比较结果,在A2,A4配方下,B1,B3效果无显著差异,均优于B2。在A3配方下,最适宜加B3添加剂,其质量评分极显著高于B2,B1。,第三节 随机区组试验结果分析,形式2:同一添加剂下不同配方间比较(同B异A间比较)这种形式的比较是固定添加剂因素下来比较不同配方水平间的差异,主要是看各种添加剂最适宜加在哪种配方蛋糕中。比较结果见表217。,第三节 随机区组试验结果分析,以上2种形式比较都不是在试验的全部处理之间进行的,因而就不能从中获得整个试验的最优处理。,形式3:全面比较是将本试验中全部12个处理均值都列出来作相互比较,以从中选出最优处理。本例比较结果由表2-18给出。,第三节 随机区组试验结果分析,表3-35 各处理间的多重比较,多重比较结果表明,A3B3,A2B3,A2B13个处理最好,其质量评分极显著地高于其他处理,而这3个处理间差异不显著。在12个处理中,A4B2处理最差,其质量评分极显著或显著地低于其他处理。,第三节 随机区组试验结果分析,