正交设计教案超详细.ppt
实验设计,DOEDesign of Experiments,第5章 正交设计,5.1 正交表与正交设计 5.1.1 正交表 5.1.2 用正交表安排实验5.2 分析实验结果 5.2.1 实验结果的直观分析 5.2.2 实验结果的方差分析5.3 有交互作用的正交设计 5.3.1 表头设计 5.3.2 分析实验结果5.4 水平不等的正交设计 5.4.1 用混合水平正交表安排实验 5.4.2 改造正交表,5.5 独立重复实验5.6 筛选实验5.7 正交设计与区组设计 5.7.1 拉丁方设计 5.7.2 其他区组设计思考与练习,第5章 正交设计,正交设计是多因素的优化实验设计方法,也称为正交试验设计。它是从全面实验的样本点中挑选出部分有代表性的样本点做实验,这些代表点具有正交性。其作用是只用较少的实验次数就可以找出因素水平间的最优搭配或由实验结果通过计算推断出最优搭配。,5.1 正交表与正交设计,在20世纪40年代后期,日本统计学家田口玄一博士(Dr.Genichi Taguchi)使用设计好的正交表安排实验,这种方法简便易行,从此正交设计在世界范围内普遍推广使用。,田口玄一博士是著名的质量专家,他以预防为主、正本清源的哲学方法运思,把数理统计、经济学应用到质量管理工程中,发展出独特的质量控制技术。比如,头脑风暴法、OA 方法等,创立了“质量工程学(Quality Engineering)”,又叫“田口方法(Taguchi Methods)”,从而形成自己的质量哲学,即:质量不是靠检验得来的,也不是靠控制生产过程得来的;质量,就是把顾客的质量要求分解转化设计参数、形成预期目标值,最终生产出来低成本且性能稳定可靠的“物美价廉”的产品。本书编写时参照了田口博士大加推荐的“QE 方面最优秀的英文版本”。,1924,5.1 正交表与正交设计,5.1 正交表与正交设计,5.1 正交表与正交设计,5.1 正交表与正交设计,5.1 正交表与正交设计,5.1 正交表与正交设计,田口玄一博士在多年研究和实践的基础上,创造性地提出了关于质量的定义:“所谓质量,是指产品上市后给社会带来的损失。但是功能本身所产生的损失除外。”田口把产品质量与给社会带来的损失联系在一起,他认为,质量好的产品就是上市后给社会带来损失小的产品。这个定义保存了满足社会需要的中心内容,在本质上它与 ISO 9000:2000 给出的质量定义是一致的,但是,田口的质量定义强调了质量的经济效果和设计的目的性。,5.1 正交表与正交设计,田口博士还进一步提出了以质量损失来评价质量水平的概念和减少质量损失的方法,在此基础上,引发了以减少质量波动、提高产品健壮性为目标的设计思想的重大变革,产生了极具创造性的以参数设计、容差设计方法为主的线外质量管理方法、和以对质量特性、过程反馈控制,对过程诊断、调节等方法为主的线内质量管理问世,田口的线内外质量管理方法在欧美统称为“田口方法”。田口先生关于质量的定义最有价值之处是引入了质量损失的概念,开辟了定量研究质量的道路。日本的众多企业就是用田口的质量管理方法进行质量管理。,5.1 正交表与正交设计5.1.1 正交表,定义5.1 正交试验设计就是使用正交表(Orthogonal Array)来安排实验的方法。定义5.2 正交表是按正交性排列好的用于安排多因素实验的表格。,5.1 正交表与正交设计5.1.1 正交表,正交表的一般记法为Ln(a p),其中p是表的列数,n是表的行数,表中的数字都由1到a这a个整数构成。字母L表示正交表,实际上是引用了拉丁方(Latin)的名称。常见的正交表有L4(23)、L8(27)、L16(215)、L9(34)、L27(313)、L16(45)、L25(56),以及混合水平L18(2137)等正交表。用正交表安排实验就是把实验的因素(包括区组因素)安排到正交表的列,允许有空白列,把因素水平安排到正交表的行。具体来说,正交表的列用来安排因素,正交表中的数字表示因素的水平,用Ln(a p)正交表最多可以安排p个水平数目为a的因素,需要做n 次实验(含有n个处理)。,5.1 正交表与正交设计5.1.1 正交表,2 正交性 正交表的列之间具有正交性,正交性可以保证每两个因素的水平在统计学上是不相关的。正交性具体表现在两个方面,分别是:(1)均匀分散性。在正交表的每一列中,不同数字出现的次数相等。例如L9(34)正交表中,数字1,2,3在每列中各出现3次。(2)整齐可比性。对于正交表的任意两列,将同一行的两个数字看作有序数对,每种数对出现的次数是相等的,例如L9(34)表,有序数对共有9个,(1,1),(1,2),(1,3),(2,1),(2,2),(2,3),(3,1),(3,2),(3,3),它们各出现一次。,5.1 正交表与正交设计5.1.1 正交表,在得到一张正交表后,我们可以通过三个初等变换得到一系列与它等价的正交表(1)正交表的任意两列之间可以相互交换,这使得因素可以自由安排在正交表的各列上。(2)正交表的任意两行之间可以相互交换,这使得实验的顺序可以自由选择。(3)正交表的每一列中不同数字之间可以任意交换,称为水平置换。这使得因素的水平可以自由安排。,5.1 正交表与正交设计5.1.1 正交表,3 正交性的直观解释 以L9(34)正交表为例,9个实验点在三维空间中的分布见图5.1。图中正方体的全部27个交叉点代表全面实验的27个实验点,用正交表确定的9个实验点均匀散布在其中。具体来说,从任一方向将正方体分为3个平面,每个平面含有9个交叉点,其中都是恰有3个是正交表安排的实验点。再将每一平面的中间位置各添加一条行线段和一条列线段,这样每个平面各有三条等间隔的行线段和列线段,则在每一行上恰有一个实验点,每一列上也恰有一个实验点。可见这9个实验点在三维空间的分布是均匀分散的。,图5.1 L9(34)正交表9个实验点的分布,5.1.2 用正交表安排实验,用正交表安排实验首先看因素的水平,选取与因素水平相同的正交表,然后看因素的数目,因数的个数不能超过正交表的列数,允许有空白列。1 正交试验的设计【例5.1】某化工厂生产一种化工产品,采收率低并且不稳定,一般在60%80%之间波动。现在希望通过实验设计,找出好的生产方案,提高采收率。本例中的实验指标是采收率。根据专业技术人员的分析,影响采收率的3个主要因素是反应温度、加碱量、催化剂种类。每个因素分别取3个水平做实验,得因素与水平表见表5.2。,5.1.2 用正交表安排实验,对于以上这3 个因素3 个水平的实验,如要做全面实验,要做33=27次实验。厂方希望能用少量的实验找出最优生产方案,而正交实验设计正是解决这种问题的常用方法。实验的设计见表5.3。,5.1.2 用正交表安排实验,表5.3 用L9(34)正交表安排实验,5.1.2 用正交表安排实验,2 正交实验的实施 通过以上用L9(34)正交表安排实验可以看到,全部的实验是同时设计好的,属于整体设计。这里需要强调一个问题,做实验的顺序要依照随机化原则,其目的是尽量避免实验因素外的其他因素对实验的影响。例如操作人员、仪器设备、实验环境等因素的影响。假如实验员在实验过程中对这项实验逐渐熟悉,实验的效果越来越好,后面的实验采收率就有提高的趋势。如果不按随机化原则安排实验顺序,实验结果就会低估A因素的1水平(前3号实验),高估A因素的3水平(后3号实验)。这样操作人员就成为实验中不得不考虑的区组因素。,5.1.2 用正交表安排实验,2 正交实验的实施 在实验中要尽量保持实验因素以外的其他因素固定,在不能避免的场合可以增加一个区组因素,也安排在正交表的一个列上。在分析实验数据时区组因素也作为一个因素处理,可以避免对实验结果的系统影响。比如实验由3个人进行,则可以把人也看成一个因素,3个人便是3个水平,将其放在正交表的空白列上,那么该列的1,2,3水平对应的实验分别由第一、第二、第三个人去做,这样就避免了因人员变动所造成的系统误差。,5.2 分析实验结果,分析正交实验结果有两种方法:一、直观分析法 二、方差分析法。,5.2.1 实验结果的直观分析,表5.4 实验结果直观分析表,5.2.1 实验结果的直观分析(1)直接看的好条件,实验结果的直观分析。(1)直接看的好条件。从表中的9 次实验结果看出,第8号实验A3B2C1的采收率最高,为85%。但第8 号实验方案不一定是最优方案,还应该通过进一步的分析寻找出可能的更好方案。,5.2.1 实验结果的直观分析(2)算一算的好条件,(2)算一算的好条件。表中T1、T2和T3这三行数据分别是各因素同一水平结果之和。例如,T1行A因素列的数据180是A因素3个1水平实验值的和,而A因素3个1水平分别在第1、2、3号实验,所以T1A=y1+y2+y3=51+71+58=180 注意到,在上述计算中,B因素的3个水平各参加了一次计算,C因素 的3个水平也各参加了一次计算。其他的求和数据计算方式与上述方式相似,例如T2行C因素的求和数据237是C因素3个二水平实验值的和,而C因素3个二水平分别在第2、4、9号实验,所以T2C=y2+y4+y9=71+82+84=237 同样,在上述计算中A因素的3个水平各参加了一次计算,B因素的3个水平也各参加了一次计算。,5.2.1 实验结果的直观分析(3)分析极差,(3)分析极差 确定各因素的重要程度。表5.4中的最后一行R是极差,它是、和各列三个数据的极差,即最大数减去最小数 例如A因素的极差RA=8260=22。从表中看到:A因素的极差RA=22最大,表明A因素对采收率的影响程度最大。B因素的极差RB=8最小,说明B因素对采收率影响程度不大。C因素的极差RC=14大小居中,说明C因素对采收率有一定的影响,但是影响程度不大。,5.2.1 实验结果的直观分析(4)画趋势图,(4)画趋势图。,图5.2 因素水平趋势图,5.2.1 实验结果的直观分析(5)成本分析,(5)成本分析。前面的分析说明选取加碱量B2=48 kg是合适的,但是由于加碱量对采收率影响不大,如果考虑生产成本的话,选B1=35 kg可能会更好。因为B1虽然平均采收率低5%,但少投入13 kg碱。这就需要进一步进行经济核算,少投入13 kg碱和减少5%的采收率相比哪一样更有利。,5.2.1 实验结果的直观分析(6)综合分析与撒细网,(6)综合分析与撒细网。前面的分析表明,A3B2C2是理论上的最优方案,还可以考虑把反应温度A的水平进一步提高,加碱量B适当减少。这需要安排进一步的补充实验,可以在A3B2C2附近安排一轮2水平小批量的实验,其中催化剂固定为乙种,因素A再取一个比90更高的水平,因素B再取一个比48 kg略低的水平做实验,称为撒细网。如果实验者对现有的实验结果已经满意,也可以不做撒细网实验。,5.2.1 实验结果的直观分析(7)验证实验,(7)验证实验。不论是否做进一步的撒细网实验,都需要对理论最优方案做验证实验。需要注意的是,最优搭配A3B2C2或者A3B1C2只是理论上的最优方案,还需要用实际的实验做验证。对这两个方案各做两次验证实验,实验所得A3B2C2的两次采收率分别为87%、88%。实验A3B1C2的两次采收率分别为87%、85%。两者相差很小,从节约成本角度看最优搭配A3B1C2是可行的。,5.2.2 实验结果的方差分析,在前面的直观分析中,通过极差的大小来评价各因素对实验指标影响的程度,其中极差的大小并没有一个客观的评价标准,为了解决这一问题,需要对数据进行方差分析。正交设计是多因素实验设计,一般包含3个以上的因素,其方差分析方法是双因素实验设计方差分析的推广,仍然是通过离差平方和分解,构造F统计量,生成方差分析表,对因素效应和交互效应的显著性做检验。,5.2.2 实验结果的方差分析 1 计算离差平方和,5.2.2 实验结果的方差分析 1 计算离差平方和,(2)因素的离差平方和。因素A的离差平方和为:,(5.2),其中a=3是A因素的水平数,ni 是在第i水平下所做实验的次数,也就是计算 时所用到的数据个数。本例ni=n/a=9/3=3,A因素在每一个水平下都是做了3次实验。是在前面的直观分析方法中计算出的A因素的每一水平下的实验平均值。按照与上面相同的公式可以计算出SSB和SSC,只是把 分别作为B因素和C因素每一水平下的实验平均值。,5.2.2 实验结果的方差分析 1 计算离差平方和,(3)误差平方和SSE。有两种计算方法:方法一:用空白列计算。对空白列也按照上面计算因素离差平方和的公式计算出相应的离差平方和,就是误差平方和SSE。如果空白列不止1列,就分别计算出每个空白列的离差平方和,这些空白列的离差平方和之和就是误差平方和,空白列自由度之和就是误差平方和的自由度。,5.2.2 实验结果的方差分析 1 计算离差平方和,(3)误差平方和SSE。有两种计算方法:方法二:用公式SSE=SSTSSASSBSSC计算误差平方和,这是一个通用的方法。不考虑交互作用的一般公式为:误差平方和=总离差平方和各因素离差平方和之和,5.2.2 实验结果的方差分析 1 计算离差平方和,多数正交表满足离差平方和分解式,即总离差平方和等于各列离差平方和之和,这时两种方法是相同的。有些正交表不满足离差平方和分解式,这时方法二仍然适用,而方法一不再适用。这时空白列离差平方和只是误差平方和的一部分,空白列离差平方和的自由度小于误差平方和的自由度,用空白列做误差就会减小误差平方和的自由度,从而降低方差分析的效率,使得一些对实验指标有显著影响的因素被误认为没有显著影响。,5.2.2 实验结果的方差分析 2 方差分析表,计算出各有关的离差平方和后,就可以进一步计算出下面的正交设计方差分析表。,5.2.2 实验结果的方差分析 2 方差分析表,直接用SAS软件计算,计算程序为:DATA zhjiao1;INPUT A B C y;OUTPUT;CARDS;1 1 1 511 2 2 711 3 3 582 1 2 822 2 3 692 3 1 593 1 3 773 2 1 853 3 2 84,PROC ANOVA;CLASS A B C;MODEL y=A B C;MEANS A B C;RUN;,5.2.2 实验结果的方差分析 2 方差分析表,SAS软件的输出结果占用的篇幅较大,为了节约篇幅,本书对输出结果的格式都做了适当的调整,这里省略了各水平下的均值输出数据,方差分析表见表5.6:,5.2.2 实验结果的方差分析 2 方差分析表,本例中3个因素的P值都大于0.05,这时还不能急于断定3个因素都不显著,而是要剔除一个最不显著的因素。本例中B因素的P值=0.4674最大,是最不显著的因素,剔除因素B后重新做方差分析。只需要把上面SAS程序中的“MODEL y=A B C;”语句改为“MODEL y=A C;”,其他语句不变,得新的方差分析表5.7。,5.2.2 实验结果的方差分析 3 计算问题,如果读者手头没有SAS软件,也可以用SPSS、Minitab等统计软件完成以上方差分析的计算工作。还可以借助Excel软件,通过简单的计算得到方差分析结果,见表5.8。用Excel软件计算方差分析的过程。,(1)将数据输入到区域“A1:E10”。(2)在单元格“B11”输入公式“=SUMIF(B$2:B$10,$A2,$E$2:$E$10)/3”,计算出A因素1水平的实验平均值=60,然后将公式复制到区域“B11:D13”。(3)在单元格“B14”内输入公式“=3*DEVSQ(B11:B13)”,计算出SSA=728,然后将公式复制到区域“C14:D14”。在单元格“E14”内输入公式“=DEVSQ(E2:E10)”,计算出SST=1238。在单元格“F14”内输入公式“=E14-SUM(B14:D14)”,计算出SSE=86。,5.2.2 实验结果的方差分析 3 计算问题,(4)在区域“B15:E15”输入各项目的自由度。在单元格“F15”内输入公式“=E15-SUM(B15:D15)”,计算出误差自由度=2。(5)在单元格“B16”内输入公式“=B14/B15”,计算出MSA=364,然后将公式复制到区域“C16:F16”。(6)在单元格“B17”内输入公式“=B16/$F16”,计算出FA=8.465116,然后将公式复制到区域“C17:D17”。(7)在单元格B18内输入公式“=FDIST(B17,B15,$F15)”,计算出A因素的P值=0.105651,然后将公式复制到区域“C18:D18”。经过以上步骤就完成了方差分析的计算,把含有这个工作表的文件保存好,只需要做简单修改就可以用于其他的正交设计结果的方差分析。在本例中,如果要删除掉因素B重新做方差分析,则只需要简单地把含有B因素的第C列删除就可以了。,5.2.2 实验结果的方差分析 3 计算问题,表5.8 用Excel计算方差分析,5.2.2 实验结果的方差分析,5.2.2 实验结果的方差分析,5.2.2 实验结果的方差分析,5.2.2 实验结果的方差分析,5.2.2 实验结果的方差分析,5.2.2 实验结果的方差分析,5.2.2 实验结果的方差分析,5.3 有交互作用的正交设计,因素间存在交互作用的正交设计,5.3 有交互作用的正交设计5.3.1 表头设计,定义5.3 安排有交互作用的正交设计不仅要把实验因素安排在正交表的列上,还要由正交表所附带的交互作用表查出交互作用所在的列,把各因素和所考察的交互作用都安排在正交表的列上,称为表头设计。,5.3 有交互作用的正交设计 5.3.1 表头设计,【例5.2】在降低柴油机的耗油率(克/千瓦小时)研究中,根据专业技术人员的分析,影响耗油率的4个主要因素和水平见表5.9:,每个因素分别取2个水平做实验。并且认为因素A与B之间可能存在交互作用AB,因素A与C之间可能存在交互作用AC。现在希望通过实验设计,找出好的因素水平搭配,降低柴油机的耗油率。,5.3 有交互作用的正交设计 5.3.1 表头设计,本例中实验指标耗油率y是望小特性,实验指标数值越小越好。共有4个2水平因素,初步选用 正交表。,正交表,5.3 有交互作用的正交设计 5.3.1 表头设计,避免混杂原则,5.3 有交互作用的正交设计 5.3.1 表头设计,5.3 有交互作用的正交设计 5.3.2 分析实验结果,表5.12 实验结果与直观分析表,5.3 有交互作用的正交设计 5.3.2 分析实验结果,1 实验结果的直观分析,直接看的好条件是第8号实验A2B2C2D1,耗油率y=214.8,其中C因素的极差RC=8.425为最大,表明供油提前角度C对耗油率y的影响最大;其次是A因素的极差RA=5.675为次大,表明喷嘴器的喷嘴形式A对耗油率y也有较大的影响;B因素的极差RB=0.125很小,但是这并不能表明喷油泵柱塞直径B对耗油率没有影响,原因是第3列交互作用AB的极差为3.225并不很小,喷油泵柱塞直径B与喷嘴器的喷嘴形式A之间可能存在交互作用。第5列交互作用AC的极差为0.925也很小,这表明C与A之间不存在交互作用。,5.3 有交互作用的正交设计 5.3.2 分析实验结果,2 实验结果的方差分析总离差平方和的计算公式仍为:,本例n=8。各列离差平方和的计算公式仍为:,其中a=2是每列的水平数,ni=n/a=8/2=4,这时上面的公式简化为:,5.3 有交互作用的正交设计 5.3.2 分析实验结果,用SAS软件对数据做方差分析,计算程序为:,DATA zhjiao2;INPUT A B C D y;OUTPUT;CARDS;1 1 1 1 228.61 1 2 2 225.81 2 1 2 230.21 2 2 1 218.02 1 1 1 220.82 1 2 2 215.82 2 1 2 228.5 2 2 2 1 214.8PROC ANOVA;CLASS A B C D;MODEL y=A B C D A*B A*C;MEANS A B C;RUN;,5.3 有交互作用的正交设计 5.3.2 分析实验结果,5.3 有交互作用的正交设计 5.3.2 分析实验结果,从方差分析表看到,B因素的P 值=0.6051最大,其次是交互作用AC的P值=0.1190也大于0.05。可以断定B因素是不显著的,但是交互作用AC的显著性还需要进一步考察,方法是把最不显著B因素剔除后再重新做方差分析。这时产生了一个计算困难,各种统计软件都规定:如果方差分析模型中包含有某一交互作用,那么就必需同时包含构成这个交互作用的两个因素。本例的方差分析模型中包含了交互作用AB,因此就不能剔除B因素后用软件重新做方差分析。,5.3 有交互作用的正交设计 5.3.2 分析实验结果,解决的方法有两个:第一是仿照例2.5,利用表5.13中已计算出的各因素的离差平方和,借助Excel软件作简单的计算,就可以计算出剔除B因素后新的方差分析表。第二是把交互作用AB和AC作为两个因素AB和AC看待,把对应的列水平也输入到SAS程序的数据块中,对程序作简单修改就可以得到剔除B因素后的方差分析结果。,5.3 有交互作用的正交设计 5.3.2 分析实验结果,5.3 有交互作用的正交设计 5.3.2 分析实验结果,从上面剔除B因素后的方差分析表中看到,这时交互作用AC的P值=0.02600.05,也是显著的。各因素和交互作用按显著性由高到低(即P值由小到大)排序为:,由表5.12看到三个因素C、A、D的好水平分别是C2、A2、D1。B因素本身不显著,不能由B因素本身确定它的好水平,需要根据AB确定B因素的好水平。为此计算AB的水平搭配表5.15:,5.3 有交互作用的正交设计 5.3.2 分析实验结果,从上面的表中看到,由交互作用AB所得的A和B最优水平搭配是A2B1,其中A因素的最优水平与单独考虑A因素所得的最优水平是一致的。,5.3 有交互作用的正交设计 5.3.2 分析实验结果,从AC的水平搭配表中看到,最优搭配是A2C2,这与单独看C、A两个因素所得的最优搭配是一致的。综上所述,因素最优搭配的理论值是A2B1 C2 D1,还需要做验证实验给予验证。,然后再看交互作用AC,计算AC的水平搭配表5.16:,5.3 有交互作用的正交设计 5.3.2 分析实验结果,如果用Excel软件做有交互作用的方差分析,只需要把交互作用也作为因素看待,两个交互作用AB和AC分别看作因素AB和AC,其他的计算与无交互作用方差分析的方式完全相同。有交互作用的3水平正交设计,每个交互作用占正交表的两列。计算交互作用离差平方和时要把每个交互作用所占两列上的离差平方和相加,作为这个交互作用的离差平方和。相应地,每个交互作用的自由度是其所占例自由度之和,即2+2=4,也等于构成这个交互作用的各因素自由度的乘积,即22=4。,5.4 水平不等的正交设计,有时限于客观条件,实验中所考察的因素的水平数不能完全相等,这时需要采用混合水平正交表安排实验,或者对普通的正交表做修正,灵活使用正交表。,5.4 水平不等的正交设计 5.4.1 用混合水平正交表安排实验,【例5.3】在某种化油器设计中希望寻找出一种具有较小比油耗的结构,实验的影响因素见上表,其中有四个3水平的因素,一个2水平的因素,因素水平见表5.17。,5.4 水平不等的正交设计 5.4.1 用混合水平正交表安排实验,选用混合水平正交表,该表共有18行,需要做18次实验,其中第一列是2水平列,其余7列都是3水平列。表头设计与实验结果列在表5.18中。,5.4 水平不等的正交设计 5.4.1 用混合水平正交表安排实验,5.4 水平不等的正交设计 5.4.1 用混合水平正交表安排实验,直接看的好条件是第10号实验,其搭配是A1 B3C3D2 E2,比油耗y=208.4,另外第5、13、17实验的比油耗值也较低。在混合水平正交设计中,对数据的直观分析时存在一个问题,这时由于因素的水平数不同,使得因素的极差之间缺乏可比性。可以通过系数调整使得极差之间具有可比性,公式为:,其中da是与因素的水平数a有关的调整系数,取值见表5.19。通过调整虽然使极差具有了可比性,但是数值大小却只具有相对意义。,5.4 水平不等的正交设计 5.4.1 用混合水平正交表安排实验,用SAS软件做方差分析,计算程序与例5.1的计算程序完全相似,不再列出,计算出的方差分析见表5.20。,5.4 水平不等的正交设计 5.4.1 用混合水平正交表安排实验,从方差分析表看到,因素B、D、E都不显著,对一般情况的方差分析,应该逐一剔除最不显著的因素,再重新做方差分析。由于正交设计的因素之间不相关,剔除一个因素时其他因素的离差平方和不变,而三个不显著的因素B、D、E的P值都很大,所以可以同时将这三个因素剔除,得新的方差分析表见表5.21。,5.4 水平不等的正交设计 5.4.2 改造正交表,因素水平数不等的正交设计情况复杂多样,不可能对所有情况都事先编制好水平数不等的正交表,这时可以通过对一张现有正交表(称为基本表)的灵活改造而安排水平数不等的正交设计。,5.4.2 改造正交表 1 并列法,【例5.4】在Vc二步发酵的配方实验中,共有七个影响因素,其中因素A“尿素”有6个水平,其他6个因素都是3个水平,因素水平见下表5.22。,5.4.2 改造正交表 1 并列法,不考虑因素的交互作用。常见的混合水平正交表只有L18(2137)表,可以安排一个2水平的因素和7个3水平的因素。本例有1个6水平的因素和6个3水平的因素,这时可以把L18(2137)正交表中的2水平列和一个3水平列合并生成一个6 水平列。具体方法为:,(1,1)1(1,2)2(1,3)3(2,1)4(2,2)5(2,3)6,这样就由L18(2137)生成了一张新的L18(6136)混合水平正交表,可以安排1个6水平的因素和6个3水平的因素,实验的安排和实验结果见表5.23。L18(6136)正交表是由L18(2137)正交表的前两列生成的,容易验证它符合正交表的两个条件,确实是正交表。,5.4.2 改造正交表 1 并列法,表5.23 用混合水平正交表 L18(6136)安排实验与实验结果,5.4.2 改造正交表 1 并列法,本例中,因素A的自由度为6-1=5,离差平方和为:,其他各因素的自由度为3-1=2,离差平方和为:,5.4.2 改造正交表 1 并列法,计算7个因素的方差和均方见下表。均方最小的是D、F、G这3个因素,把他们合并为误差,得B、A、C、E这4个显著的因素P值分别为0.0003、0.0048、0.0054、0.0433。,5.4.2 改造正交表 1 并列法,以上用并列法生成混合水平正交表时所使用的基本表L18(2137)是无交互作用的正交表,如果使用有交互作用的基本表,就要把相应的交互作用列去掉。例如把L8(27)正交表的前两列并列生产一个4水平的列,前两列的交互作用在第3列,这时要把第3列去掉,生成一张有1个4水平列和4个2水平列的混合水平正交表L8(4124)。其余情况依次类推。,5.4.2 改造正交表 2 拟水平法,拟水平法是对水平较少的因素虚拟一个或几个水平,使它与其他因素的水平数相等。例如一个实验中有3个因素,A因素有2个水平,B、C因素都是3水平的因素。如果直接使用混合水平正交表就要用L18(2137)混合表,需要做18次实验,实际上是全面实验。为了减少实验次数,可以用L9(34)安排实验。在A因素的两个水平A1、A2中选择出一个水平,例如选择A1水平,然后虚拟一个A3水平,A3水平与A1水平实际上是同一个水平,这样A因素形式上就有3个水平,就可以用L9(34)安排实验了。对含有拟水平的A因素计算离差平方和时,仍使用通用的公式:,本例水平数a=2 是A因素的实际水平数,ni 是在第i水平下所做实验的次数,n1=6,n2=3,SSA的自由度是2-1=1。,5.4.2 改造正交表 2 拟水平法,用拟水平法改造的“正交表”不再具有正交性,计算离差平方和不用空白列法,而用公式 误差平方和=总离差平方和各因素离差平方和之和误差自由度=总自由度(n-1)各因素自由度之和 改造的“正交表”虽然不再具有正交性,但是用SAS软件计算方差分析的程序与普通正交设计的计算程序是一样的,只是因素的水平要取为实际的水平,不要取做拟水平,本书就不举例说明了。,5.4.2 改造正交表 3 组合法,一个实验中有2个2水平因素和3个3水平因素,共有5个因素,不考虑交互作用。如果用拟水平法,需要用L18(2137)或L27(313)正交表,实验次数过多。这时可以把L9(34)的1个3水平列拆分成2个2水平的列,或者看作是将2个2水平的列组合成1个3水平的列,通常的方法是:1(1,1)2(1,2)3(2,1),用组合法改造的“正交表”也不具有正交性,并且上面的改造方法有一个明显的缺陷,两个2水平列的(2,2)水平组合没有出现。,5.4.2 改造正交表 3 组合法,也可以采用其他的灵活改造方式,例如把基本表L9(34)的第一列的9个实验用下面的方法改造为两个2水平列:,这样两个2水平列的4种水平组合方式就都出现了,当然这样改造的实验同样也不具有正交性。,实验号 基本表水平 改造表水平1 1(1,1)2 1(1,1)3 1(2,2)4 2(1,2)5 2(1,2)6 2(2,2)7 3(2,1)8 3(2,1)9 3(2,2),5.5 独立重复实验,正交实验的目的是为了减少实验次数,对同一个处理(通常只做一次实验,在一些特殊场合下对同一个处理也有必要做多次独立的重复实验,分为以下两种不同情况:(1)相同操作独立重复实验。在多数场合下,对每个处理准备好实验条件是困难的,而在同一个实验条件下重复做几次实验是容易的。这时相同处理下的实验误差不能反映操作方法的误差,仅反映样品之间的误差。这种场合下的一种简单的数据分析方法是把同一个处理下的几次实验数值做平均,用平均数作为该处理下的实验指标数值。(2)随机顺序独立重复实验。这种场合要求对每个处理下的重复实验要重新准备实验条件,相同处理下的实验误差既包含操作方法的误差,也包含样品之间的误差。本书以下讲到的重复实验都是指这种随机顺序独立重复实验。,5.5 独立重复实验,【例5.5】在对中药赤芍提取工艺改进实验中,以提取率为实验指标,采用L9(34)正交表作重复实验,因素水平如下:,表5.24 因素水平表,正交表的第一列作为空白列,3个实验因素A、B、C分别安排在正交表的第2、3、4列上,实验结果见表5.25。,5.5 独立重复实验,表5.25 实验安排与实验结果,5.5 独立重复实验,解 用SAS软件计算方差分析,计算程序为:,DATA zhjiao1;INPUT D A B C y;OUTPUT;CARDS;1 1 1 1 54.41 2 2 2 81.581 3 3 3 77.652 1 2 3 77.952 2 3 1 60.622 3 1 2 73.443 1 3 2 82.63 2 1 3 71.263 3 2 1 61.551 1 1 1 50.11 2 2 2 81.581 3 3 3 86.472 1 2 3 78.752 2 3 1 65.332 3 1 2 73.213 1 3 2 95.533 2 1 3 84.153 3 2 1 59.7PROC ANOVA;CLASS A B C D;MODEL y=D A B C;RUN;,5.5 独立重复实验,和无重复实验的方差分析计算程序相比有两点不同:第一,对k次重复实验,每个实验处理(水平搭配)要重复输入k次,也就是对每次的实验指标数值分别输入一次,作为数据文件的一行。本例重复次数k=2,前9行是每个实验处理的第1次实验数据,后9行是每个实验处理的第2次实验数据。第二,空白列也作为一个因素参与计算。,5.5 独立重复实验,输出结果见表5.26。计算得到的方差分析表的形式与无重复实验的方差分析表是相同的,在这个方差分析表中:总离差平方和SST=2525是18个实验数据的离差平方和,,各列离差平方和为:,5.5 独立重复实验,表5.26 方差分析表,5.5 独立重复实验,对于重复实验,总离差平方和大于各列离差平方和之和,两者之差称为纯误差平方和,记为SSEP,即,如果所使用的正交表在无重复实验时满足离差平方和分解式,例如本例中的L9(34)正交表,这时纯误差平方和为:,自由度是多少?,5.6 筛选实验,在一些实验中,仅根据专业知识并不能确定出少数几个对实验指标起决定作用的因素,在实验设计的初期会提出许多影响实验指标的因素,但是真正的影响因素可能并不多。这时就需要先对实验的众多可能的影响因素做初步筛选,找出真正对实验有影响的因素,这种实验设计方法称为筛选实验。在正交设计中也称为撒粗网。,5.6 筛选实验,在筛选实验中,由于所考察的因素数目较多,所以通常不考虑因素间的交互作用,否则就需要做大量的实验。这时需要选用无交互作用的正交表,也就是把每个交互作用均匀分布在其余各列上的正交表。在常用的正交表中,L12(211)、L20(219)和L18(2137)都是无交互作用的正交表。,5.6 筛选实验,用L12(211)正交表需要做12次实验,最多可以安排11个2水平的因素。用L20(219)正交表需要做20次实验,最多可以安排19个2水平的因素。用L18(2137)正交表需要做18次实验,最多可以安排7个3水平的因素和1个2水平的因素。可见如果因素只取2水平就可以用较少的实验次数考察较多的因素,而因素取3水平时就会大幅度地增加实验次数。所以在筛选实验中通常取因素水平为2。,5.6 筛选实验,在筛选实验中2水平因素的选取方法有一个原则,就是其中的一个水平要取在中心位置,而另外一个水平选择靠近边界位置,与中心位置尽量远一些,这样才能正确识别因素对实验指标是否有显著影响。中心位置是根据现有的专业知识或经验认为的最佳取值。例如根据经验认为生产的最佳温度是50,允许的温度变化范围是10,那么就可以取温度的1水平是50,2水平是60或40。如果把两个水平取在中心位置的对称位置(例如45和55),实验结果可能是两个水平实验指标的平均值很接近,就会误认为温度是不重要的因素而被筛选掉。,5.6 筛选实验,【例5.6】在一项减小应力(系统内部的损耗)的实验中,共需要考虑11个因素,如果每个因素都取3个水平则至少要做27次实验。现在决定首先做筛选实验,每个因素都只取两个水平,暂不考虑交互作用。用L12(211)正交表安排实验,其中分别用1和-1表示因素的高低两个水平,实验的安排和实验结果见表5.27。,5.6 筛选实验,表5.27 筛选实验安排和实验结果,5.6 筛选实验,5.6 筛选实验,因素A、B、G、H、I的方差都很小,可以把这几项都合并为误差项。重新做方差分析,得表5.29的方差分析表(2)。,因素E、J的P值都小于0.01,是高度显著的,是影响实验指标的主要因素。因素D、F、K的P值在0.01到0.05之间,对实验指标也有重要影响。因素D的P值为0.106,是影响实验指标的次要因素。各因素的方差由大到小(或P值由小到大)的排列顺序是:J、E、F、C、K、D、I、H、B、G、A 下一步对因素J、E、F或J、E、F、C用L9(34)正交表进一步做3水平的实验,就可以得到最优的实验条件。,5.6 筛选实验,5.7 正交设计与区组设计,很多实验设计问题都要考虑区组因素,本章前面的内容没有涉及区组因素,实际上正交设计中对区组因素的处理非常简便。,5.7 正交设计与区组设计 5.7.1 拉丁方设计,正交设计是从拉丁方设计的基础上发展而来的,拉丁方设计可以作为正交设计的特例,是对一个实验因素和两个区组因素的实验设计。在正交设计中,把区组因素与实验因素等同对待,拉丁方设计就成为3个因素的正交设计。以下引用文献4例2.3.9说明这个问题。,5.7 正交设计与区组设计 5.7.1 拉丁方设计,【例5.7】为研究5个不同剂量(剂量由小到大分别用A、B、C、D、E表示)的甲状腺提取液对豚鼠甲状腺重的影响,考虑到鼠的种系