第七章 回归正交试验设计ppt课件.ppt
第七章 回归正交试验设计,Orthogonal Regression Design,正交设计:优方案只能限制在已定的水平上,而不是一定试验范围内的最优方案回归分析可通过所确立的回归方程 ,对试验结果进行预测和优化,但回归分析只能对试验数据进行被动的处理和分析,不涉及对试验设计的要求。回归正交设计可将两者结合起来。它可以在因素的试验范围内选择适当的试验点,用较少的试验建立一个精度高、统计性质好的回归方程,并能解决试验优化问题。,回归正交设计(orthogonal regression design) :,回归正交设计处理的对象:可以在因素的试验范围内选择适当的试验点用较少的试验建立回归方程能解决试验优化问题不适合非数量性因素,7.1 一次回归正交试验设计及结果分析,一次回归正交设计就是利用回归正交设计原理,建立试验指标(y)与m个试验因素x1,x2,xm之间的一次回归方程:例:m3时,一次回归方程: yab1x1b2x2b3x3b12x1x2b13x1x3b23x2x3其中x1,x2,x3表示3个因素;x1x2,x1x3,x2x3表示交互作用若不考虑交互作用,为三元一次线形回归方程: yab1x1b2x2b3x3,7.1.1 一次回归正交设计的基本方法,(1)确定因素的变化范围 以因素xj为例:设xj 的变化范围为xj1, xj2 xj1为xj的下水平 xj2为xj的上水平 xj0为xj的零水平: xj0 (xj1 xj2)/2因素xj的变化间距j:jxj2xj0 xj0- xj1j= (xj2 xj1)/2,(2)因素水平的编码,zj:因素xj的编码 ,称为规范变量 xj:自然变量 上水平xj2的编码 :zj21 下水平xj1的编码:zj11 零水平xj0的编码:zj00,编码(coding):将因素xj的各水平进行线性变换:,编码目的:使每因素的每水平在编码空间是“平等”的,规范变量zj的取值范围都是1,1,不会受到自然变量xj的单位和取值大小的影响。编码能将试验结果y与因素xj(j1,2,m)之间的回归问题,转换成试验结果y与编码值zj之间的回归问题,从而大大简化了回归计算量。,(3)一次回归正交设计表,将二水平的正交表中“2”用“1”代换 ,例:,回归正交设计表的特点:任一列编码的和为0 任两列编码的乘积之和等于0,(4)试验方案的确定,可参考正交设计的表头设计方法交互作用列的编码等于表中对应两因素列编码的乘积 零水平试验(中心试验 )目的是为了进行更精确的统计分析,得到精度较高的回归方程。,表头设计 :,7.1.2 一次回归方程的建立,总试验次数为n : nmcm0mc:二水平试验次数m0:零水平试验次数一次回归方程系数的计算:常数项:a一次项系数:bj 交互项系数: bjk,j1,2,m,jk, k1,2,m1,说明:求得的回归系数直接反映了该因素作用的大小 回归系数的符号反映了因素对试验指标影响的正负,7.1.3 回归方程及偏回归系数的方差分析,7.1.3.1 无零水平试验时 平方和:总平方和:,一次项偏回归平方和 :,交互项偏回归平方和:,回归平方和 :,残差平方和 :,自由度,dfTn1 各种偏回归平方和的自由度1 回归平方和的自由度 :,残差自由度:,不考虑交互作用时:dfR=m,dfe=n-m-1。,均方F检验:回归方程显著性检验偏回归系数显著性检验 :判断因素或交互作用对试验的影响程度可直接从回归方程中剔除不显著的一次和交互项经检验不显著的因素或交互作用应归入残差,重新检验,例7-1:用石墨炉原子吸收分光光度计测定食品中的铅,为提高测定灵敏度,希望吸光度(y)大。为提高吸光度,讨论了x1(灰化温度/), x2(原子化温度/)和 x3 (灯电流/mA)三个因素对吸光度的影响,并考虑交互作用x1x2 , x1x3 。已知x1300700, x218002400,x3810mA。试通过回归正交试验确定吸光度与三个因素之间的函数关系式。,(1)因素水平编码,(2)正交表的选择和试验方案的确定,(3)回归方程的建立 依题意 m0=0,n=mc=8,(3)回归方程的建立,计算各回归系数:,(3)回归方程的建立,写出y与规范变量zj的回归方程 y=0.50475+0.00975z1+0.03375z2-0.00575z3+0.00475z1z2+0.00725z1z3根据偏回归系数绝对值大小,确定因素和交互作用的主次顺序 x2x1x1x3x3x1x2 根据偏回归系数的正负,得到各因素对试验指标的影响方向,(4)方差分析,(4)方差分析,dfT=n-1=8-1=7 df1=df2=df3=1 df12=df13=1dfR=df1+df2+df3+df12+df13=1+1+1+1+1=5dfe=dfT-dfR=7-5=2MS1=SS1/df1=0.000761 MS2=SS2/df2=0.009113MS3=SS3/df3=0.000265 MS12=SS12/df12=0.000181MS13=SS13/df13=0.000421MSR=SSR/dfR=0.010741/5=0.002148MSe=SSe/dfe=0.000123/2=0.000062F1=MS1/MSe=0.000761/0.000062=12.27F2=MS2/MSe=0.009113/0.000062=146.98F3=MS3/MSe=0.000265/0.000062=4.27F12=MS12/MSe=0.000181/0.000062=2.92F13=MS13/MSe=0.000421/0.000062=6.79FR=MSR/MSe=0.002148/0.000062=34.65,方差分析表,F0.01(1,2)=98.49 F0.05(1,2)=18.51F0.01(5,2)=99.30 F0.05(5,2)=19.30,新的方差分析表,F0.05(1,6)=5.99 F0.01(1,6)=13.74,(5)最终的回归方程,y=0.50475+0.03375z2z2=(x2-2100)/300 y=0.50475+0.03375 (x2-2100)/300 整理后得:y=0.2685+0.0001125x2,7.1.3.2 有零水平试验时,目的:进行回归方程的失拟性(lack of fit)检验 (要求m02 )失拟性检验:为了检验一次回归方程在整个研究范围内的拟合情况失拟性检验步骤:,设m0次零水平试验结果为y01,y02,y0m0 重复试验误差:平方和:,重复试验误差的自由度:,回归方程失拟部分:,失拟平方和 :,失拟平方和自由度:,对于给定的显著性水平(一般取0.1) 当FLfF(dfLf,dfe1)时,就认为回归方程失拟不显著,失拟平方和SSLf是由随机误差造成的,所建立的回归方程是拟合得很好。只有当回归方程显著、失拟检验不显著时,才能说明所建立的回归方程是拟合得很好的。,失拟检验 :,例7-2从某植物中提取黄酮类物质,为了对提取工艺进行优化,选取三个相对重要的因素:乙醇浓度x1、液固比x2、和回流次数x3 进行了回归正交试验,不考虑交互作用。已知x160%80%, x2812,x313次。试通过回归正交试验确定黄酮提取率与三个因素之间的函数关系式并确定优化方案。,(1)因素水平编码,(2)正交表选择及试验方案确定,(3)回归方程的建立 依题意 m0=3,n=mc+m0=11,回归方程:y=6.6182+0.5125z1+0.5375z2+0.3125z3因素作用主次:x2x1x3,(4)方差分析,(4)方差分析,dfT=n-1=8-1=7 df1=df2=df3=1 dfR=df1+df2+df3=1+1+1=3dfe=dfT-dfR=10-3=7,(4)方差分析,MS1=SS1/df1=2.101 MS2=SS2/df2=2.311 MS3=SS3/df3=0.781MSR=SSR/dfR=5.193/3=1.731MSe=SSe/dfe=0.103/7=0.0147F1=MS1/MSe=2.101/0.0147=142.9F2=MS2/MSe=2.311/0.0147=157.2F3=MS3/MSe=0.781/0.0147=53.1FR=MSR/MSe=1.731/0.0147=117.8,方差分析表,F0.01(1,7)=12.25 F0.05(1,7)=5.59F0.01(3,7)=8.45 F0.05(3,7)=4.35,(5)失拟性检验,本例中,零水平试验次数m0=3,可进行失拟性检验。,SSLf=SSe-SSe1=0.103-0.00667=0.0963dfe1=m0-1=3-1=2 dfLf=dfe-dfe1=7-2=5,检验结果表明,失拟不显著,回归模型与实际情况拟合很好。,(6)最终的回归方程,y=6.6182+0.5125z1+0.5375z2+0.3125z3z1=(x1-70)/10 z2=(x2-10)/2 z3=(x3-2)/1y=-0.2818+0.05125x1+0.26875x2+0.3125x3x1=80 x2=12 x3=3时,Y7.9807(经用规划求解),7.2 二次回归正交组合设计,回归方程的建立:根据最小二乘法原理得到正规方程组求解正规方程组,得回归系数方程的个数回归系数个数要求:试验次数回归方程的项数回归正交组合设计:在一次回归正交试验设计的基础上再增加一些特定的试验点,通过适当的组合形成试验方案,7.2.1 二次回归正交组合设计表,(1)二元二次回归正交组合设计试验方案二元二次回归方程:该方程共有6个回归系数,所以要求试验次数n6,而二水平全面试验的次数为22=4次,显然不能满足要求,于是在此基础上再增加5次试验。,试验方案,正交组合设计的三类试验点及次数:二水平试验:一次回归正交试验设计中的试验点 全实施:mc2m 1/2实施:mc2m11/4实施:mc2m2 星号试验:与原点(中心点)的距离都为 m2m 零水平试验:各因素水平编码都为零时的试验 试验次数m0,二元二次回归正交组合设计,总的试验次数为:n=mc+2m+m0,(2) 三元二次回归正交组合设计试验方案,三元二次回归方程:该方程共有10个回归系数,所以要求试验次数n10,而二水平全面试验的次数为23=8次,显然不能满足要求,于是在此基础上再增加7次试验。,三元二次回归正交组合设计,(3)星号臂长度与二次项的中心化,星号臂长度星号臂长度与因素数m,零水平试验次数m0及二水平试验数mc有关计算公式如下:或者直接查下表,二次项的中心化,对二次项的每个编码进行中心化处理 :(二次项编码)(二次项编码算术平均值)利用Excel列出回归正交组合设计表 表8-19 二元二次回归正交组合设计编码表 表8-20 三元二次回归正交组合设计编码表m0=4时, m0=2时,m0=3时(作业),7.2.2 二次回归正交组合设计的应用,(1)基本步骤 因素水平编码 试验因素的水平被编为,1,0,1,变化间距:j上水平零水平零水平下水平,7.2.2.二次回归正交组合设计的应用,(1)基本步骤确定合适的二次回归正交组合设计,试验方案的实施回归方程的建立 常数项:a一次项偏回归系数:bj交互项偏回归系数:bkj二次项偏回归系数:bjj,回归方程显著性检验,失拟性检验 与一次回归正交设计是相同的。 回归方程的回代:利用中心化公式,将zj转换成 zj2利用编码公式,将规范变量转换成自然变量最优试验方案的确定:根据极值的必要条件:可以求出最优的实验条件(借助于规划求解),例7-3 为了提高某种淀粉类高吸水性树脂的吸水倍率,在其它合成条件一定的情况下,重点考察丙烯酸中和度和交联剂用量对试验指标(产品吸水倍率)的影响,已知丙烯酸中和度(x1)的变化范围为0.70.9,交联剂用量(x2)的变化范围为13 mL,试用二次正交组合设计分析出这两个因素与试验指标(y)之间的关系。,(1)因素水平编码,计算依据,m=2,取m0=2,根据星号臂计算公式或查表得=1.078x1=0.9 ,x-1=0.7, x10=0.81=(0.9-0.8)/1.078=0.093,x2=3 ,x-1=1, x10=22=(3-2)/1.078=0.93,(2)试验方案,(2)正交组合设计,(3)回归方程的建立,(4)回归方程及偏回归系数的显著性检验,(4)方差分析,dfT=n-1=10-1=9 df1=df2=df12=df1=df2=1 dfR=df1+df2+df12+df1+df2=1+1+1+1+1=5dfe=dfT-dfR=9-5=4MS1=522.5/1=522.5 MS2=SS2/df2=4461.2/1=4461.2MS12=SS12/df12=182.3MS1=SS1/df1=1458.8MS2=SS2/df1=4705.8MSR=SSR/dfR=11330.6/5=2266.1MSe=SSe/dfe=49.9/4=12.5F1=MS1/MSe=522.5/12.5=41.8F2=MS2/MSe=4461.2/12.5=356.9F12=MS12/MSe=182.3/12.5=14.6F1=MS1/MSe=1458.8/12.5=116.7F2=MS2/MSe=4705.8/12.5=376.5FR=MSR/MSe=2266.1/12.5=181.3,方差分析表,F0.01(1,4)=21.20 F0.05(1,4)=7.71F0.01(5,4)=15.52 F0.05(5,4)=6.26,(5)失拟性检验,本例中,零水平试验次数m0=2,可进行失拟性检验。,SSLf=SSe-SSe1=49.9-4.5=45.4dfe1=m0-1=2-1=1 dfLf=dfe-dfe1=4-1=3,检验结果表明,失拟不显著,回归模型与实际情况拟合很好。,(6)最终的回归方程,y=468.5+9.09z1-26.56z2-6.75z1z2-23.24z1 -41.7z2y=468.5+9.09z1-26.56z2-6.75z1z2-23.24(z12-0.6324) -41.7(z22-0.6324)y=509.6+9.09z1-26.56z2-6.75z1z2-23.24z12 -41.74z22(可用规划求解)z1=(x1-0.8)/0.093 z2=(x2-2)/0.93 y=-1544.0+4539.8x1+227.0 x2-78.0 x1x2-2678.7x12-48.3x224539.8-78.0 x2-5357.4x1=0227.0-78.0 x1-96.6x2=0 x1=0.8 x2=1.7时,Y547(经用规划求解),