正交试验设计.ppt
第五章 正交试验设计,本章主要授课内容 概述 正交表 正交试验设计的优点 正交试验设计的基本步骤 正交试验设计结果的直观分析法 单指标正交试验设计及其结果的直观分析 多指标正交试验设计及其结果的直观分析 有交互作用的正交试验设计及其结果的直观分析 混合水平的正交试验设计及其结果的直观分析,正交试验设计结果的方差分析法 方差分析的基本步骤与格式 二水平正交试验的方差分析 三水平正交试验的方差分析 混合水平正交试验的方差分析,5.1 概述,对于多因素多水平试验,若对每个因素的每个水平都相互搭配进行全面试验,则试验次数为:试验次数水平数因素数(每个水平组合上只作1次试验)例:3因素4水平的全面试验次数43=64次正交试验设计(orthogonal design):利用正交表科学地安排与分析多因素试验的方法 例:3因素4水平的正交试验次数:16,5.1.1 正交表(orthogonal table)正交表:根据正交原理设计的,已规范化的表格,是正交设计中安排试验和分析试验结果的基本工具。,5.1.1.1 等水平正交表等水平正交表:各因素的水平数是相等的。(1)等水平正交表符号:Ln(r m)L:正交表代号 n:正交表横行数(试验次数)r:因素的水平数 m:正交表纵列数(最多能安排的因数个数),(2)部分等水平正交表符号如下,2水平正交表:L4(23),L8(27),L12(211),L16(215),3水平正交表:L9(34),L18(37),L27(313),4水平正交表:L16(45),L32(49),L64(421),5水平正交表:L25(56),L50(511),L125(531),(3)等水平正交表的特点,表中任一列,不同的数字出现的次数相同,即每个因素的每一个水平都重复相同的次数均匀可比性 表中任意两列,把同一行的两个数字看成有序数字对,所有可能的数字对(水平组合)出现的次数相同均衡分散性。两性质合称为“正交性”:使试验点在试验范围内排列整齐、规律,也使试验点在试验范围内散布均匀。,5.1.1.2 混合水平正交表混合水平正交表:各因素的水平数是不完全相同的。,混合水平正交表性质:(1)表中任一列,不同数字出现的次数相同。(2)每两列,同行两个数字组成的各种不同的水平搭配出现的次数是相同的,但不同的两列间所组成的水平搭配种类及出现次数是不完全相同的。(3)采用混合水平的正交表安排试验时,每个因素的各水平之间的搭配是均衡的。,5.1.2 正交试验设计的优点,在所有试验方案中均匀地挑选出代表性强的少数试验方案。通过对这些少数试验方案的试验结果进行统计分析,可以推出较优的方案。对试验结果作进一步的分析,可以得到试验结果之外的更多信息。,例5-1:某工厂想提高产品的质量和产量,考察了工艺中三个主要因素:温度(A),时间(B),加碱量(C),每个因素各选三个水平进行试验。试验的目的是为了提高合格产品的产量,寻找最适宜的操作条件。(忽略因素间的交互作用),A2,A3,A1,B1,B2,B3,C1,C2,C3,C1,C2,C3,C1,C2,C3,a.全面试验:27种试验方案,全面试验的试验点分布(分布均匀),特点:数据点分布均匀性好,各因素和水平的搭配全面,但试验次数较多。,b.简单比较法:试验次数比较少,常常被采用。第一步:B1C1A1,B1C1A2,B1C1A3A3 第二步:A3C1B1,A3C1B2,A3C1B3 A3B2 第三步:A3B2C1,A3B2C2,A3B2C3 A3B2C3,特点:试验次数少,但试验结果不可靠,当因素的数目和水平数更多时,常常会得到错误的结论。,简单比较法的试验点分布(不均匀),c.正交试验设计:选用正交表L9(34),只需要做9次试验。如果将A,B,C三个因素分别安排在正交表的1,2,3列,则试验方案为A1B1C1,A1B2C2,A1B3C3,A2B1C2,A2B2C3,A2B3C1,A3B1C3,A3B2C1,A3B3C2。,正交试验的试验点分布,特点:试验点分布均匀,试验次数较少,具有代表性。,5.1.3 正交试验设计的基本步骤 正交试验设计总的来说包括两个部分:一是试验设计,二是数据处理。基本步骤可简单归纳如下:(1)明确试验目的,确定评价指标(2)挑选因素,确定水平,(3)选正交表,进行表头设计根据因素数和水平数选择合适的正交表。按列选取 因素数交互作用列数空列正交表列数 因素水平数与正交表对应的水平数一致若考虑试验因素间的交互作用,应根据交互作用因素的多少和交互作用安排原则选用正交表,表头设计就是将试验因素安排到所选正交表相应的列中。不考虑交互作用,可将因素随机安排在正交表各列需考察交互作用,按照正交表对应的交互作用列表统筹安排原则:一级交互作用不能与因素混杂;要考察的交互作用不能与因素混杂,(4)明确试验方案,进行试验,得到结果(5)对试验结果进行统计分析 直观分析方法(极差分析法)分析因素主次顺序,寻找最优水平组合方差分析法 分析因素或交互作用对试验指标影响的显著性(6)进行验证试验,作进一步分析 最优水平组合是通过统计分析得出的,还需要进行试验验证,以保证试验结论的可靠性,5.2.1 单指标正交试验设计及其结果的直观分析,5.2 正交试验设计结果的直观分析法,例5-2:柠檬酸硬脂酸单甘酯是一种新型的食品乳化剂,它是柠檬酸与硬脂酸单甘酯,在一定的真空度下,通过酯化反应制得,现对其合成工艺进行优化,以提高乳化剂的乳化能力。乳化能力测定方法:将产物加入油水混合物中,经充分混合、静置分层后,将乳状液层所占的体积百分比作为乳化能力。根据探索性试验,确定的因素和水平如下表所示,假定因素间无交互作用。,解:本题中,试验的目的是提高产品的乳化能力,试验指标为乳化能力,因素水平为3因素3水平(假定因素间无交互作用),所以可以从正交表的选取开始进行试验设计和直观分析。,(1)选正交表 选用正交表L9(34)来安排试验。(2)表头设计,(3)明确试验方案,三个符号说明:Ki:表示任一列上水平号为 i 时,所对应的试验结果之和。ki:ki=Ki/s,其中s为任一列上各水平出现的次数,ki 表示任一列上因素取水平 i 时所得试验结果的算术平均值。R(极差):在任一列上 R=maxK1,K2,K3-minK1,K2,K3,或 R=maxk1,k2,k3-mink1,k2,k3,(4)按规定的方案做试验,得出试验结果(5)计算极差,确定因素的主次顺序,各列的极差是不相等的,说明各因素的水平改变对试验结果的影响是不相同的,极差越大,表示该列因素的数值在试验范围内的变化,会导致试验指标在数值上更大的变化,所以极差最大的那一列,就是因素的水平对试验结果影响最大的因素,也即最主要的因素。本例中,RARBRC,各因素的主次顺序为:A(温度),B(酯化时间),C(催化剂种类)若空白列的极差R较大,说明:可能漏掉了对试验结果有重要影响的其它因素因素之间可能存在不可忽略的交互作用,(6)最优水平组合的确定,各因素优水平的确定与试验指标有关,若指标越大越好,则应选取使指标大的水平,即各列Ki(或ki)中 最大的那个值对应的水平;反之,若指标越小越好,则应选取使指标小的水平。本例中,试验指标是乳化能力,指标越大越好,所以应挑选每个因素的Ki(或ki)中最大的值对应那个水平。A因素列:K2K3K1;B因素列:K2K3K1 C因素列:K2K3K1 所以,优方案为A2B2C2,此外,实际确定优方案时,还应区分因素的主次,对于主要因素,一定要按照有利于指标的要求选取最好的水平,而对于不重要的因素,由于其水平的改变对试验结果的影响较小,则可以根据有利于降低消耗,提高效率等目的来考虑别的水平。,(7)进行验证试验,作进一步的分析,优方案往往不包含在正交实验方案中,还需要进一步的试验验证。优方案是在给定的因素和水平的条件下得到的,若不限定给定的水平,有可能得到更好的试验方案。将因素水平作为横坐标,试验指标的平均值ki为纵坐标,绘制因素与指标的关系图 趋势图,根据趋势图对所选的因素和水平进行适当的调整,可以找到新的更优方案。,例6-2趋势图,从图中可以看出,当反应温度A2=120,酯化时间B2=2h,选用乙种催化剂(C2)时产品乳化能力最好。从趋势图还可以看出,酯化时间不是越长越好,当酯化时间少于3h,产品的乳化能力有随时间减少而提高的趋势,所以适当减少乳化时间,也许会找到更优的方案。,总结,正交试验设计的基本步骤:(1)明确试验目的,确定评价指标(2)挑选因素(包括交互作用),确定水平(3)选正交表,进行表头设计(4)明确试验方案,进行试验,得到结果(5)对试验结果进行统计分析(6)进行验证试验,作进一步分析,5.2.2 多指标正交试验设计及其结果的直观分析 多指标试验中,不同指标的重要程度常常是不一致的,各因素对不同指标的影响程度也不完全相同。多指标正交试验的直观分析方法一般有两种:综合平衡法和综合评分法。5.2.2.1综合平衡法综合平衡法:先对每个指标分别进行单指标的直观分析,得到每个指标的影响因素主次顺序和最佳水平组合,然后根据理论知识和实际经验,对各指标的分析结果进行综合比较和分析,得出较优方案。,例5-3:在用乙醇溶液提取葛根中有效成分的试验中,为了提高葛根中有效成分的提取率,对提取工艺进行优化试验,需要考察3项指标:提取物得率(提取物质量与葛根质量之比)、提取物中葛根总黄酮含量、总黄酮中葛根素含量,三个指标都是越大越好,根据前期探索性试验,决定选取3个相对重要的因素:乙醇浓度、液固比(乙醇溶液与葛根质量之比),以及提取剂回流次数进行正交试验,它们各有3个水平,具体试验数据如下表所示,不考虑因素间的交互作用,试进行分析,找出较好的提取工艺条件。,因素水平表,解:这是一个3指标、3因素、3水平的试验,由于不考虑交互作用,可以选用正交表L9(34)来安排试验。表头设计、试验方案及试验结果如下表所示。与单指标试验的分析方法相同,先对各指标分别进行直观分析,得出因素的主次和优方案,并且画出各因素与各指标的趋势图。,(1)试验方案及试验结果,试验结果分析(续),从上表可以看出,对于不同的指标,不同因素的影响程度是不一样的,所以将3个因素对3个指标影响的重要性的主次顺序统一起来是行不通的。不同指标所对应的优方案也是不同的,但是通过综合平衡法可以得到综合的优方案。(2)综合平衡分析因素A:对于后两个指标都是取A3好,而且对于葛根总黄酮含量,A因素是最主要的因素,在确定优水平时应重点考虑;对于提取物得率则是取A2好,从趋势图或Ki(ki)可以看出A取A2,A3时,提取物得率相差不大,而且从极差可以看出,A为较次要的因素。所以根据多数倾向和A因素对不同指标的重要程度,选取A3。,因素B:对于提取物得率,取B2或B3基本相同,对于葛根总黄酮含量取B3好,对于葛根素含量则是取B2;另外对于三个指标而言,B因素都处于末位的次要因素,所以B取哪个水平对三个指标的影响都比较小,可以本着降低消耗的原则,选取B2,以减少溶剂耗量。因素C:对于三个指标,都是以C3为最佳水平,所以取C3。综合平衡法优方案:A3B2C3,(3)综合平衡依据的原则 对于某个因素,可能对某个指标是主要因素,但对另外的指标则可能是次要因素,那么在确定该因素的水平时,应首先选取作为主要因素时的优水平;若某因素对各指标的影响程度相差不大,可以按照“少数服从多数”的原则,选取出现次数较多的优水平;当因素各水平相差不大时,可依据降低消耗,提高效率的原则选取合适的水平;若各试验指标的重要程度不同,则在确定因素优水平时,应首先满足相对重要的指标。,(4)综合平衡法的特点 计算工作量大 可以从试验结果中获得较多的信息 有时综合平衡比较困难,5.2.2.2 综合评分法综合评分法:根据各个指标的重要程度,对得出的试验结果进行分析,给每一个试验评出一个分数,作为这个试验的总指标,然后根据这个总指标(分数),利用单指标试验结果的直观分析法作进一步的分析,确定较好的试验方案。,几种常用的评分方法:(1)对每号试验结果的各个指标统一权衡,综合评价,直接给出每一号试验结果的综合分数。(2)先对每号试验的每个指标按一定的评分标准评出分数,若各指标的重要性是一样的,可以将同一号试验中各指标的分数的总和作为该号试验的总分数;若各指标的重要性不同,要先确定各指标相对重要性的权数,然后求加权和作为该号试验的总分数。,(3)如何对每个指标评出分数,非数量性指标:依靠经验和专业知识给出分数有时指标值本身就可以作为分数,如回收率、纯度等用“隶属度”来表示分数:指标最大值的隶属度为1,指标最小值的隶属度为0,0隶属度1如果各指标的重要性一样,可以直接将各指标的隶属度相加作为综合分数,否则求出加权和作为综合分数。,例5-4:玉米淀粉改性制备高取代度的三乙酸淀粉酯的试验中,需要考察两个指标,即取代度和酯化率,这两个指标都是越大越好,试验的因素和水平如下表所示,不考虑因素之间的交互作用,试验目的是为了找到使取代度和酯化率都高的试验方案。解:这是一个2指标,3因素3水平的试验,由于不考虑交互作用,所以可选用正交表L9(34)来安排试验。表头设计、试验方案及试验结果如下表所示。,说明:本例中的两个指标的重要性不一样,根据实际要求,取代度和酯化率的权重分别取0.4和0.6,每号试验的综合分数=取代度隶属度0.4+酯化率隶属度0.6,满分为1.00。优方案C1A3B1,不包括在已经做过的9个试验中,所以应按照这个方案做一次验证性试验,看是否比正交表中1号试验的结果更好,从而确定真正最好的试验方案。,综合评分法特点:,将多指标的问题,通过适当的评分方法,转换成了单指标的问题,分析计算简单方便。确定合理的评分标准和各指标的权数,是综合评分的关键。,5.2.3 有交互作用的正交试验设计5.2.3.1交互作用的判别,设有两个因素A和B,各取两水平A1,A2和B1,B2,共有4种水平组合在每个组合水平上做试验,根据试验结果判断,有交互作用:A或B对试验指标的影响,与另一个因素取哪一个水平有关。无交互作用:A或B对试验指标的影响,与另一个因素取哪一个水平无关。,有交互作用,无交互作用,=5,=-20,5.2.3.2 有交互作用的正交试验设计及其结果的直观分析,例5-5:用石墨炉原子吸收分光光度计法测定食品中的铅,为提高测定灵敏度,希望吸光度大。为提高吸光度,对A(灰化温度/)、B(原子化温度/)和C(灯电流/mA)三个因素进行了考察,并考虑交互作用AB,AC,各因素及水平如下表所示。试进行正交试验,找出最优水平组合。,解:(1)选表 本例是一个3因素2水平试验,但是还有2个交互作用,在选正交表时,应将交互作用看成因素,所以本例应按照5因素2水平的情况来选正交表,于是应选最小正交表L8(27)来安排试验。(2)表头设计 参照交互作用列表统筹安排。,L8(27)交互作用列表,(3)明确试验方案,进行试验,得到试验结果 注意:交互作用虽然也占有相应的列,但它们与空白列一样,对确定试验方案不起任何作用。,(4)计算极差、确定因素主次(5)优方案的确定 考虑交互作用的最优水平组合,需要采用交互作用表来确定。,比较表中的四个值,1.032最大,所以取A2C2好,从而优方案为A2B2C2,5.2.4 混合水平的正交试验设计及其结果的直观分析,混合水平的正交试验设计方法主要有两种方法直接利用混合水平的正交表采用拟水平法,即将混合水平的问题转化成等水平问题来处理,5.2.4.1直接利用混合水平的正交表,例5-6:某人造板厂进行胶压板制造工艺的试验,以提高胶压板的性能,因素及水平如下所示,胶压板的性能指标采用综合评分的方法,分数越高越好,忽略因素间的交互作用。,解:本问题中有3个因素,一个因素4个水平,另外两个因素都为2个水平,正好可以选用混合水平正交表L8(4124)。因素A有4个水平,应安排在第1列,B和C都为2个水平,可以放在后4列中的任何两列上,本例将B,C依次放在第2,3列上,第4,5列为空列。试验方案及试验结果如下表所示。,由于C因素是对试验结果影响较小的次要因素,它取不同的水平对试验结果的影响很小,如果从经济的角度考虑,可取9min,所以优方案也可以为A4B2C1。5.2.4.2 拟水平法拟水平法是将混合水平的问题转化成等水平问题来处理的一种方法。例5-7:某制药厂为提高某种药品的合成率,决定对缩合工序进行优化,因素水平表如下所示,忽略因素间的交互作用。,分析:这是一个4因素的试验,其中3个因素是3水平,1个因素是2水平,可以套用混合水平正交表L18(2137),需要做18次试验。假如C因素也有3个水平,则本例就变成了4因素3水平的问题,如果忽略因素间的交互作用,就可以选用等水平正交表L9(34),只需要做9次试验。,但是实际上因素C只能取2个水平,不能够不切实际地安排出第3个水平。此时,可以根据实际经验,将C因素较好的一个水平重复一次,使C因素变成3水平的因素。其中,第3水平是虚拟的,称为拟水平。解:C因素拟出一个水平后,可以选用正交表L9(34)来安排试验,试验结果及分析如下表所示。,注1:因素C的第3水平实际上与第2水平是相等的,所以应重新安排正交表第3列中C因素的水平,将3水平改成2水平,于是C因素所在的第3列只有1,2两个水平,其中第2水平出现6次,所以求和时只有K1,K2,求平均值时k1=K1/3,k2=K2/6。其它列的K1,K2,K3与k1,k2,k3的计算方法与例6-2一致。注2:计算极差时,应根据ki(i表示水平号)来计算,即R=max(ki)-min(ki),不能根据Ki计算极差。,注3:确定优方案时,合成率是越高越好,因素A,B,D的优水平可以根据K1,K2,K3或k1,k2,k3的大小顺序取较大的Ki或ki所对应的水平,但是对于因素C,就不能根据K1,K2的大小来选择优水平,而是应根据k1,k2的大小来选择优水平。,5.3 正交试验设计结果的方差分析法,能估计误差的大小 能精确地估计各因素对试验结果影响的重要程度尤其适用于水平数大于等于3且要考虑交互作用的试验,5.3.1 无重复等水平正交试验方差分析,例5-8:某厂拟采用化学吸收法,用填料塔吸收废气中的SO2,为了使废气中SO2的深度达到排放标准,通过正交试验对吸收工艺条件进行了模索,试验的因素与水平如下表所示。需要考虑交互作用AB,BC。如果将A,B,C放在正交表L8(27)的1,2,4例,试验结果(SO2摩尔分率,%)依次为0.15,0.25,0.03,0.02,0.09,0.16,0.19,0.08。试进行方差分析。(a=0.05)解:(1)列出正交表L8(27)和试验结果。,(2)计算离差平方和,(3)计算自由度(4)计算均方由于各因素和交互作用的的自由度为1,所以它们的均方应该等于它们各自的离差平方和,即,MSA=SSA=6.125MSB=SSB=136.125MSAB=SSAB=171.125MSC=SSC=3.125MSBC=SSBC=105.125但误差的均方为:,比较发现MSA MSe,MSC MSe,说明因素A,C对试验结果的影响较小,为次要因素,所以可以将它们都归入误差,这样误差的离差平方和、自由度和均方都会随之发生变化,即,新误差平方和:SSe=SSe+SSA+SSC=27.250+6.125+3.125=36.500新误差自由度:dfe=dfe+dfA+dfC=2+1+1=4新误差均方:,(5)计算F值,(6)F检验查得临界值F0.05(1,4)=7.71,F0.01(1,4)=21.20所以对于给定显著性水平a=0.05,因素B和交互作用AB,BC对试验结果都有显著影响(P0.05)。(7)方差分析表,(8)优方案的确定因素A,B优水平搭配为A1B2,因素B,C优水平搭配为B2C2。最后确定的优方案为A1B2C2。,5.3.2 设置重复的等水平正交试验方差分析,例5-9 下表是设置了r=3次重复的L16(45)正交试验,请对结果作方差分析。,共48次试验,每个因素的每个水平对应12个试验结果,计算结果中,为什么?,本例的正交试验有重复,重复与重复之间的差异即重复误差并没有包括在各列平方和之内,因此,总平方和应等于各列平方和与重复误差平方和的总和。,设置重复的正交试验在进行方差分析时,其误差包括两项:1)空列平方和SSe1(包括被并入的因素列或交互列平方和)2)设置重复产生的误差平方和SSe2,结果表明,A、B、C、D对试验指标影响均极显著(P0.01)。如果该试验指标越大越好,则最优因素水平组合为A3B4C3D3,5.3.3 混合水平正交试验的方差分析,5.3.3.1 混合水平正交试验,例5-10:需要做一个4123试验,其中A因素4水平,B、C、D因素2水平,并且需要考察A、B、C之间的交互作用AB、AC、BC 这种正交试验可以通过从标准正交表改造而来的混合正交表安排试验。本例中A需要一个1个4水平列,B、C、D需要 3个2水平列,AB、AC分别需要3个2水平列,BC需要1个2水平列,共需要11列。可选择L16(41212),如果要考察的因素中,大多数因素水平多,而某一个因素由于客观原因只能采用较少的水平,可以采用拟水平法拟水平法是采用水平多的正交表安排较少水平因素的一种方法。,5.3.3.2 拟水平正交试验,比如,某试验的因素水平表如下:不考虑交互作用,如何设计该试验的正交试验方案?,可以考虑采用L9(34)因素B只有2个水平,可以给它虚拟一个水平,即从水平1、2中挑出1个水平作为水平3(挑出的这个水平一般是试验者比较感兴趣的水平),试验后得到的试验结果如何进行方差分析?,试验结果表明,仅因素C对指标影响显著(P0.05),