生物统计附试验设计第十章试验设计ppt课件.ppt
第十章 试验设计,主 要 内 容,第一节 试验设计概述第二节 试验计划与方案拟定第三节 试验设计的基本原则第四节 完全随机设计第五节 随机单位组设计第六节 拉丁方设计第七节 正交试验设计,第一节 试验设计概述,一、试验设计的基本概念 广义理解是指试验研究课题设计,也就是整个试验计划的拟定;狭义的理解是指试验单位(如动物试验的畜、禽)的选取、试验因素、水平、重复数的确定及试验单位的分组等。,试验设计的目的 避免系统误差,控制、降低试验误差;无偏估计处理效应,从而对样本所在总体作出可靠、正确的推断。,二、生物试验的要求与类型(一)生物试验的特点 干扰因素多;具有复杂性;周期长,(二)生物试验的基本要求 代表性(生物学代表性和环境代表性);正确性(准确性与精确性);重演性,(三)试验类型,一般调查 全面调查和抽样调查控制试验 指通过一定数量的有代表性的试验单元,在一定的试验条件下进行的带有探索性的研究工作。如:品种试验、养殖试验等,一、试验计划的内容及要求(自学)二、试验方案的拟定(一)基本概念(experimental scheme)根据试验目的与要求而拟定的进行比较的一组试验处理的总称。单因素试验方案、多因素试验方案,第二节 试验计划与方案的拟定,1、单因素试验(single-factor experiment)方案 单因素试验是指整个试验中只比较一个试验因素的不同水平影响的试验。单因素试验方案由该试验因素的所有水平构成。这是最基本、最简单的试验方案。,2、多因素试验方案 多因素试验是指在同一试验中同时研究两个或两个以上试验因素影响的试验。多因素试验方案由该试验的所有试验因素的水平组合(即处理)构成。完全方案 不完全方案,(1)完全方案 在列出因素水平组合(即处理)时,要求每一个因素的每个水平都要碰见一次,水平组合(即处理)数等于各个因素水平数的乘积。全面试验:根据完全试验方案进行的试验,全面试验的目的 考察试验因素对试验指标的影响;考察因素间的交互作用,并能选出最优水平组合 全面试验宜在因素个数和水平数都较少时应用,(2)不完全方案 在全部水平组合中挑选部分水平组合获得的方案。目的:探讨试验因素中某些水平组合的综合作用,而不在于考察试验因素对试验指标的影响和交互作用。部分试验:根据不完全方案进行的试验。,(二)拟定试验方案的要点 1、确定试验因素(根据试验的目的、任务和条件)2、根据各试验因素的性质确定试验水平 水平的数目要适当;水平间的差异要合理;,灵活掌握各因素水平的排列 一般可采用等差法(即等间距法)、等比法和随机法3种。3、试验方案中必须设置对照 空白对照;相互对照;标准对照;试验对照;自身对照,4、试验处理(包括对照)之间应遵循唯一差异原则 在进行处理间比较时,除了试验处理不同外,其它所有条件应当尽量一致或相同,从而具有可比性 5、有的试验要设置预试期 预试期的长短,可根据具体情况决定,一般以10-20天为宜,第三节 试验设计的基本原则,一、试验误差的来源(一)试验误差可分为系统误差(片面误差)、随机误差(抽样误差)两类。系统误差影响试验的准确性,随机误差影响试验的精确性。(二)动物试验中误差的来源,供试动物 饲养管理 环境条件 其它随机因素(如偶然疾病的侵袭、饲料的不稳定等引起的差异),二、试验设计的基本原则(一)重复 主要作用:估计试验误差,降低试验误差和增强代表性。(二)随机化 使供试单元进入各试验组的机会相等,以避免试验单元分组时试验人员主观倾向的影响。,(三)局部控制(试验条件的局部一致性)在试验环境或试验单位差异大的情况 下,可将整个试验环境或试验单位分成 若干个小环境或小组,在小环境或小组内使非处理因素尽量一致,这就是局部控制。每个比较一致的小环境或小组,称为单位组(或区组),试验设计三原则的关系和作用,第四节 完全随机设计,根据试验处理数将全部供试单元随机地分成若干组,然后再按组实施不同处理的设计 当试验条件特别是试验单元的初始条件比较一致时,可采用完全随机设计。该设计应用了重复和随机两个原则。随机分组的方法有抽签法和用随机数字表法。,一、完全随机的分组方法(一)两个处理比较的分组(步骤)将试验单元编号;将试验单元随机分组(随机数字表法,根据尾数的单、双);调整各组,使各组试验单元数目相等或接近(随机数字表法);各组试验动物随机地接受各种处理。,【例12.1】现有同品种、同性别、同年龄、体重相近的健康绵羊18只,试用完全随机的方法分成甲、乙两组。,从随机数字表()第12行第7列的16开始向右连续抄下18个随机数字,随机分组结果:甲组:2 4 5 6 12 14 16 乙组:1 3 7 8 9 10 11 13 15 17 18 仍用随机的方法进行调整。在前面18个随机数字后再接着抄下两个数字:71、23(需要从乙组调整两只到甲组),分别除以11(调整时乙组的绵羊只数)余数、10(调整1只绵羊去甲组后乙组剩余的绵羊只数)余数,7111=65,2310=23,(二)三个以上处理比较的分组(步骤同前)注意:一律先以处理数k除各随机数字;用完全随机的方法将试验单元分为四组、五组或更多的组,方法相同。,二、试验结果的统计分析,(一)处理数为2 两个处理的完全随机设计也就是非配对设计,对其试验结果采用非配对设计(成组数据)的t检验法进行统计分析。(二)处理数大于2 采用各处理重复数相等或不等的单因素试验资料方差分析法分析法分析。,三、完全随机设计的优缺点,主要优点:设计容易、统计分析简单;主要缺点:未应用试验设计三原则中的局部控制原则,非试验因素的影响被归入试验误差,试验误差较大,试验的精确性较低。在试验条件、环境、试验单元差异较大时,不宜采用此种设计方法。,第五节 随机单位组(区组)设计,随机单位组设计也称为随机区组设计。根据局部控制的原则,将初始条件基本相同的试验单元划归一个单位组,然后将各单位组的试验单元随机分配到各处理组。注意:每一单位组内的单元数等于处理数;单位组的数目等于每个处理的重复数。,特点:同一单位组内各试验单元尽可能一致,不同单位组间的试验单元允许存在差异;每一单位组内试验单元的随机分组要独立进行,每种处理在一个单位组内只能出现一次。,一、随机单位组设计方法(一)随机单位组设计的分组方法(步骤)将试验单元编号;划分单位组;每一单位组内试验单元随机地接受各种处理。,【例12.3】用5种中草药饲料添加剂分别以A1、A2、A3、A4、A5表示,供试4窝仔猪分别按体重依次编号为:1-5号为第组,6-10号为第组,11-15号为第组,16-20为第组。试按随机单位组设计将试验仔猪分组。,第组,第组,第组,第组,步骤:将试验单元编号;划分单位组;,每一单位组内试验单元随机地接受各种处理(随机数字表法)。将同一单位组内前4个随机数字依次除以5、4、3、2(最大数5为处理数),根据余数(余数为0者,以除数代之)确定每一单位组内各供试仔猪喂给的添加剂种类。,5种饲料添加剂试验随机单位组设计试验动物分组表,(二)配对设计分组方法 配对设计是处理数为2的随机单位组设计。在进行配对设计时,先按配对的要求将试验动物两两配对,然后将配成对子的两个试验单位随机地分配到两个处理组中。每一个对子就是试验处理的一个重复。配对要求:配成对子的两个试验单位的初始条件尽量一致,不同对子间试验单位的初始条件允许有差异。,二、试验结果的统计分析(一)随机单位组试验结果的统计分析 按两因素(试验因素A、单位组因素B)无重复观察值的方差分析法进行。平方和与自由度的划分式为:SST=SSA+SSB+SSe df T=dfA+dfB+dfe 假定单位组因素与试验因素不存在交互作用。,1、计算各项平方和与自由度;2、列出方差分析表,进行F检验;3、多重比较(只作试验因素比较,单位组因素即使显著,一般也不作单位组间的多重比较),步骤:,(二)配对设计试验结果的统计分析 采用配对设计t检验法进行统计分析。,三、随机单位组设计的优缺点(一)随机单位组设计的主要优点 1、设计与分析方法简单易行;2、由于随机单位组设计应用了试验设计三原则,将单位组间的变异从试验误差中分离出来,有效地降低了试验误差,提高了试验的精确性;,(二)随机单位组设计的主要缺点 当处理数目过多时,要使各单位组内供试单元的初始条件一致有一定难度。配对设计是处理数为2的随机单位组设计,其优点是结果分析简单,试验误差通常比非配对设计小;由于试验单元配对要求严格,不允许将不满足配对要求的试验单元随意配对。,第六节 拉丁方设计,拉丁方设计是从横行和直列两个方向进行双重局部控制,使得横行和直列两向皆成单位组的设计。特点:在拉丁方设计中,试验处理数=横行单位组数=直列单位组数=试验处理的重复数;每一处理在每一行或每一列都只出现一次。,一、拉丁方简介,(一)拉丁方 以 n 个 拉 丁 字 母 A,B,C,为元素,列出一个 n阶方阵,若这 n个拉丁方字母在 n 阶方阵的每一行、每一列都出现、且只出现一次,则称该 n阶方阵 为nn阶 拉 丁方。,A B B A B A A B A B C B C A C A B,22阶拉丁方,33阶拉丁方,第一行与第一列的拉丁字母按自然顺序排列的拉丁方,叫标准型拉丁方。若变换标准型的行或列,可得到更多种的拉丁方。在进行拉丁方设计时,可从上述多种拉丁方中随机选择一种;或选择一种标准型,随机改变其行列顺序后再使用。,(二)常用拉丁方,二、拉丁方设计方法,【例12.4】为了研究5种不同温度对蛋鸡产蛋量的影响,将5栋鸡舍的温度设为A、B、C、D、E,把各栋鸡舍的鸡群的产蛋期分为5期;由于鸡群和产蛋期对蛋鸡产蛋量有较大的影响,因此采用拉丁方设计,把鸡群和产蛋期作为单位组因素设置,以便控制这两个方面的系统误差,拉丁方设计基本步骤:(一)选择标准型拉丁方 试验因素(温度)处理数为5;直列单位组因素(鸡群)单位组数为5;横行单位组因素(产蛋期)单位组数为5;因此本例选取5 5标准型拉丁方,A B C D EB A D E CC E B A DD C E B AE D A C B,(二)随机排列 对直列(13542)、横行(41523)和试验处理的顺序(34521)进行随机排列,把5种不同温度按第三个5位数34521顺序排列,即:A=3,B=4,C=5,D=2,E=1,从而得出55拉丁方设计,三、试验结果的统计分析 将横行单位组因素(A)、直列单位组因素(B)、处理因素(C),按 三因素试验无重复观测值的方差分析法进行。假定3个因素之间不存在交互作用。平方和与自由度划分式为:,SST=SSA+SSB+SSC+SSe dfT=df A+dfB+dfc+dfe,四、拉丁方设计的优缺点,(一)拉丁方设计的主要优点 1、精确性高 拉丁方设计比随机单位组设计多设置了一个单位组因素,能将横行和直列两个单位组间的变异从试验误差中分离出来,因而试验误差比随机单位组设计小,试验的精确性比随机单位组设计高。2、试验结果的分析简便,(二)拉丁方设计的主要缺点 因为在拉丁设计中,横行单位组数、直列单位组数、试验处理数与试验处理的重复数必须相等,所以处理数受到一定限制;因此,拉丁方设计一般用于5-8个处理的试验。横行、直列单位组因素与试验因素间不存在交互作用,否则不能采用拉丁方设计。,第七节 正交试验设计,对于单因素或两因素试验,因其因素少,试验的设计、实施与分析都比较简单。但在实际工作中,常常需要同时考察 3个或3个以上的试验因素,若进行全面试验,则试验的规模将很大,往往因试验条件的限制而难于实施。正交试验设计就是安排多因素试验、寻求最优水平组合的一种高效率试验设计方法。,1、正交试验设计的基本概念 正交试验设计是利用正交表来安排与分析多因素试验的一种设计方法。正交试验设计的基本特点是:用部分试验来代替全面试验,通过对部分试验结果的分析,了解全面试验的情况。,一、正交试验设计的概念及原理,例如,要考察增稠剂用量、pH值和杀菌温度对豆奶稳定性的影响。每个因素设置3个水平进行试验。A因素是增稠剂用量,设A1、A2、A3 3个水平;B因素是pH值,设B1、B2、B3 3个水平;C因素为杀菌温度,设C1、C2、C3 3个水平。这是一个3因素3水平的试验,各因素的水平之间全部可能组合有27种,如再加上交互作用,水平组合数较多,工作量大,在有些情况下无法完成。若试验的主要目的是寻求最优水平组合,则 可利用正交表来设计安排试验。,2、正交试验设计的基本原理 如上例中,3因素3水平若进行全面实验,有27个水平组合。,表7-1,正交设计就是全面试验点(水平组合)中挑选出有代表性的部分试验点(水平组合)来进行试验,就是利用正交表L9(34)从27个试验点中挑选出来的9个试验点。即:(1)A1B1C1(2)A2B1C2(3)A3B1C3(4)A1B2C2(5)A2B2C3(6)A3B2C1(7)A1B3C3(8)A2B3C1(9)A3B3C2,4 因素3水平的全面试验水平组合数为34=81,5因素3水平的全面试验水平组合数为35=243,这在科学试验中是有可能做不到的。,上述选择,保证了A因素的每个水平与B因素、C因素的各个水平在试验中各搭配一次。,3、正交表及其基本性质(1)正交表 由于正交设计安排试验和分析试验结果都要用正交表,因此,我们先对正交表作一介绍。表7-2是一张正交表,记号为L8(27),其中“L”代表正交表;L右下角的数字“8”表示有8行,用这张正交表安排试验包含8个处理(水平组合);括号内的底数“2”表示因素的水平数,括号内2的指数“7”表示有7列,用这张正交表最多可以安排7个因素2水平试验。,表7-2,2水平正交表除L8(27)外,还有L4(23)、L16(215)等;3水平正交表有L9(34)、L27(213)等,(2)正交表的基本性质正交性 任一列中,各水平都出现,且出现的次数相等 例如L8(27)中不同数字只有1和2,它们各出现4次;L9(34)中不同数字有1、2和3,它们各出现3次。任两列之间各种不同水平的所有可能组合都出现,且对出现的次数相等 即每个因素的一个水平与另一因素的各个水平所有可能组合次数相等,表明任意两列各个数字之间的搭配是均匀的。,均衡分散性,指用正交表挑选出来的各因素水平组合在全部水平组合中的分布是均匀的。因此,这些试验点点代表性强,能够较好地反映全面试验的情况。,(3)正交表的基本特点,整齐可比性,即每一个因素的各水平间具有可比性。因为正交表中每一因素的任一水平下都均衡地包含着另外因素的各个水平,当比较某因素不同水平时,其它 因素的效应都彼此抵消。如在A、B、C 3个因素中,A因素的3个水平 A1、A2、A3 条件下各有 B、C 的 3个不同水平,即:,A因素3个水平间具有综合可比性。同样,B、C因素3个水平间亦具有综合可比性。,4、正交表的类别(1)等水平正交表 各列水平数相同的正交表称为等水平正交表。如L4(23)、L8(27)、L12(211)等各列中的水平为2,称为2水平正交表;L9(34)、L27(313)等各列水平为3,称为3水平正交表。(2)混合水平正交表 各列水平数不完全相同的正交表称为混合水平正交表。如L8(424)表中有一列的水平数为4,有4列水平数为2。也就是说该表可以安排一个4水平因素和4个2水平因素。再如L16(4423),L16(4212)等都混合水平正交表。,二、正交试验设计的基本程序,正交试验设计的基本程序包括试验方案设计及试验结果分析两部分。,试验目的与要求,试验指标,选因素、定水平,因素、水平确定,选择合适正交表,表头设计,列试验方案,试验方案设计:,试验结果分析,进行试验,记录试验结果,试验结果极差分析,计算K值,计算k值,计算极差R,绘制因素指标趋势图,优水平,因素主次顺序,优组合,结 论,试验结果分析:,试验结果方差分析,列方差分析表,进行F 检验,计算各列偏差平方和、自由度,分析检验结果,写出结论,1、试验方案设计,试验设计前必须明确试验目的,即本次试验要解决什么问题。试验目的确定后,对试验结果如何衡量,即需要确定出试验指标。试验指标可为定量指标,如强度、硬度、产量、出品率、成本等;也可为定性指标如颜色、口感、光泽等。一般为了便于试验结果的分析,定性指标可按相关的标准打分或模糊数学处理进行数量化,将定性指标定量化。,(1)明确试验目的,确定试验指标,例7-1 鸭肉保鲜天然复合剂的筛选。试验以茶多酚作为天然复合保鲜剂的主要成分,分别添加不同增效剂、被膜剂和不同的浸泡时间,进行4因素4水平正交试验。试设计试验方案。,正交试验设计步骤:明确目的,确定指标。本例的目的是通过试验,寻找一个最佳的鸭肉天然复合保鲜剂配方。,根据专业知识、以往的研究结论和经验,从影响试验指标的诸多因素中,通过因果分析筛选出需要考察的试验因素。一般确定试验因素时,应以对试验指标影响大的因素、尚未考察过的因素、尚未完全掌握其规律的因素为先。试验因素选定后,根据所掌握的信息资料和相关知识,确定每个因素的水平,一般以2-4个水平为宜。并列出因素水平表,(2)选因素、定水平,列因素水平表,选因素、定水平,列因素水平表。上例中,根据专业知识和以前研究结果,选择4个因素,每个因素定4个水平,因素水平表见下表。,表7-3 天然复合保鲜剂筛选试验因素水平表,正交表的选择是正交试验设计的首要问题。确定了因素及其水平后,根据因素、水平及需要考察的交互作用的多少来选择合适的正交表。正交表的选择原则是在能够安排下试验因素和交互作用的前提下,尽可能选用较小的正交表,以减少试验次数。,(3)选择合适的正交表,La(bc),试验总次数,行数,因素水平数,因素个数,列数,一般情况下,试验因素的水平数应等于正交表中的水平数;因素个数(包括交互作用)应不大于正交表的列数,选择正交表此试验为4因素4水平试验,不考虑交互作用,4因素共占4列,选L16(45)最合适,并有1空列,可以作为试验误差以衡量试验的可靠性。,L16(45)正交表,处理号 第一列 第二列 第三列 第四列第五列1111112122223133334144445212346221437234128243219313421032431113312412342131341423144231415432411644132,所谓表头设计,就是把试验因素和要考察的交互作用分别安排到正交表的各列中去的过程。在不考察交互作用时,各因素可随机安排在各列上;若考察交互作用,就应按所选正交表的交互作用列表安排各因素与交互作用,以防止设计“混杂”。,(4)表头设计,把正交表中安排各因素的列中的每个水平数字换成该因素的实际水平值,便形成了正交试验方案(表7-6)。,(5)编制试验方案,按方案进行试验,记录试验结果。,表7-6 天然复合保鲜剂筛选试验方案,2、试验结果分析,分清各因素及其交互作用的主次顺序,分清哪个是主要因素,哪个是次要因素;判断因素对试验指标影响的显著程度;找出试验因素的优水平和试验范围内的最优组合;分析因素与试验指标之间的关系,即当因素变化时,试验指标是如何变化的。,极差分析,方差分析,Kjm,kjm,计算简便,直观,简单易懂,是正交试验结果分析最常用方法。以上例为实例来说明极差分析过程。,三、正交试验的结果分析,1、直观分析法极差分析法,极差分析法R法,计算,判断,Rj,因素主次,优水平,优组合,Kjm为第j列因素m水平所对应的试验指标和,kjm为Kjm平均值。由kjm大小可以判断第j列因素优水平和优组合。,Rj为第j列因素的极差,反映了第j列因素水平波动时,试验指标的变动幅度。Rj越大,说明该因素对试验指标的影响越大。根据Rj大小,可以判断因素的主次顺序。,(2)计算各因素同一水平的平均值ki。k1=36.20,k2=33.27,k3=32.34,k4=31.83,例7-1试验结果极差分析,(1)计算Ki值。Ki为同一水平之和以第一列A因素为例:K1=36.20+31.77+38.79+38.02=144.78K2=31.54+35.02+30.90+35.62=133.08K3=30.09+32.37+32.87+34.02=129.35K4=29.32+32.64+34.54+32.80=129.30,(3)计算各因素的极差R,R表示该因素在其取值范围内试验指标变化的幅度。R=max(Ki)-min(Ki),(4)根据极差大小,判断因素的主次影响顺序。R越大,表示该因素的水平变化对试验指标的影响越大,因素越重要。由以上分析可见,因素影响主次顺序为A-C-B-D,A因素影响最大,为主要因素,D因素为不重要因素。(5)做因素与指标趋势图,直观分析出指标与各因素水平波动的关系。,表10-9 鸭肉保鲜天然复合剂筛选试验结果,表7-8 鸭肉保鲜天然复合剂筛选试验结果,(6)选优组合,即根据各因素各水平的平均值确定优水平,进而选出优组合。本例A、B、C为主要因素,按照平均值大小选取优水平为A1B1C4,即茶多酚用量取0.1%水平;以0.5%维生素C作为增效剂;1.0%葡萄糖液为被膜剂为形成的鸭肉保鲜复合剂为优组合,而浸泡时间为次要因素,选取操作时间1-3min即可。,极差分析法简单明了,通俗易懂,计算工作量少便于推广普及。但这种方法不能将试验中由于试验条件改变引起的数据波动同试验误差引起的数据波动区分开来,也就是说,不能区分因素各水平间对应的试验结果的差异究竟是由于因素水平不同引起的,还是由于试验误差引起的,无法估计试验误差的大小。此外,各因素对试验结果的影响大小无法给以精确的数量估计,不能提出一个标准来判断所考察因素作用是否显著。为了弥补极差分析的缺陷,可采用方差分析。,2、正交试验结果的方差分析,(1)正交试验结果的方差分析,方差分析基本思想是将数据的总变异分解成因素引起的变异和误差引起的变异两部分,构造F统计量,作F检验,即可判断因素作用是否显著。,总偏差平方和各列因素偏差平方和+误差偏差平方和,a、偏差平方和分解:,b、自由度分解:,c、方差:,d、构造F统计量:,e、列方差分析表,作F检验,若计算出的F值F0Fa,则拒绝原假设,认为该因素或交互作用对试验结果有显著影响;若F0Fa,则认为该因素或交互作用对试验结果无显著影响。,小 结,1、掌握试验设计、试验方案、完全随机、随机单位组、拉丁方设计的概念;2、掌握试验设计的三原则及其相互关系;3、掌握完全随机、随机单位组设计的方法与步骤以及试验结果的统计分析;4、了解试验方案的拟定、拉丁方设计的方法;,