第十二回归设计.ppt
第十二章 回归设计,12.1 回归设计的基本概念12.2 一次回归正交设计12.3 二次回归的中心组合设计12.4 二次回归正交设计12.5 二次回归旋转设计,12.1 回归设计的基本概念 回归设计(也称为响应曲面设计)目的是寻找试验指标与各因子间的定量规律,考察的因子都是定量的。它是在多元线性回归的基础上用主动收集数据的方法获得具有较好性质的回归方程的一种试验设计方法。本章主要介绍Box的回归设计方法及其应用,并假定读者已具有多元线性回归分析的基础知识。为了符号上的统一,在12.1.2中列出了回归分析中的主要公式。,12.1.1 多项式回归模型 在一些试验中希望建立指标y与各定量因子(又称变量)间相关关系的定量表达式,即回归方程,以便通过该回归方程找出使指标满足要求的各因子的范围。可以假定 y与 间有如下关系:这里 是 的一个函数,常称为响应函数,其图形也称为响应曲面;是随机误差,通常假定它服从均值为0,方差为 的正态分布。在上述假定下,可以看作为在给定 后指标的均值,即,称z 的可能取值的空间为因子空间。我们的任务便是从因子空间中寻找一个点z0 使E(y)满足质量要求。当f的函数形式已知时,可以通过最优化的方法去寻找z0。在许多情况下f的形式并不知道,这时常常用一个多项式去逼近它,即假定:,这里各 为未知参数,也称为回归系数,通常需要通过收集到的数据对它们进行估计。若用 表示相应的估计,则称,为y关于 的多项式回归方程。,在实际中常用的是如下的一次与二次回归方程(也称一阶与二阶模型):,一般p个自变量的d次回归方程的系数个数为,12.1.2 多元线性回归(12.1.1)是一个多项式回归模型,在对变量作了变换并重新命名后也可以看成是一个多元线性回归模型。1回归模型 设所收集到的n组数据为假定回归模型为:,记随机变量的观察向量为 未知参数向量为 不可观察的随机误差向量为 结构矩阵那么上述模型可以表示为:,或,2回归系数的最小二乘估计 估计回归模型中回归系数的方法是最小二乘法。记回归系数的最小二乘估计(LSE)为,应满足如下正规方程组:当 存在时,最小二乘估计为 在求得了最小二乘估计后,可以写出回归方程:今后称 为正规方程组的系数矩阵,为正规方程组的常数项向量,为相关矩阵。在模型(12.1.5)下,有,若记,那么,在通常的回归分析中,由于C非对角阵,所以各回归系数间是相关的:,3对回归方程的显著性检验 对回归方程的显著性检验是指检验如下假设:H0:H1:不全为0检验方法是作方差分析。记 则有平方和分解式 其中 为残差平方和,自由度为 为回归平方和,自由度为当H0为真时,有 对于给定的显著性水平,拒绝域为。,若记p+1维向量,那么,4失拟检验 当在某些点有重复试验数据的话,可以在检验回归方程显著性之前,先对y 的期望是否是 的线性函数进行检验,这种检验称为失拟检验,它要检验如下假设:H0:H1:当在 上有重复试验或观察时,将数据记为 其中至少有一个,记。此时残差平方和可进一步分解为组内平方和与组间平方和,其中组内平方和就是误差平方和,记为,组间平方和称为失拟平方和,记为,即:,,,,,,,,,检验统计量为 在H0为真时,对于给定的显著性水平,拒绝域为 当拒绝H0时,需要寻找原因,改变模型,否则认为线性回归模型合适,可以将Se与SLf合并作为SE检验方程是否显著。,其中,5对回归系数的显著性检验 当回归方程显著时,可进一步检验某个回归系数是否为0,也即检验如下假设:此种检验应对j=1,2,p逐一进行。常用的检验方法是t检验或等价的F检验,F检验统计量为:其中 是 中的第j+1个对角元。记分子为,即,它是因子 的偏回归平方和 分母是模型中 的无偏估计。,也称为 的标准误,即其标准差的估计。,当H0j为真时,有。给定的显著性水平,当 时拒绝假设H0j,即认为 显著不为零,否则可以将对应的变量从回归方程中删除。注:当有不显著的系数时,一般情况下一次只能删除一个F值最小的变量,重新计算回归系数,再重新检验。通常要到余下的系数都显著时为止。,12.1.3 回归分析对数据的处理由被动变主动 古典的回归分析方法只是被动地处理已有的试验数据,对试验的安排不提任何要求,对如何提高回归方程的精度研究很少。后果:(1)盲目增加试验次数,而这些试验结果还不能提供充分的信息,以致在许多多因子试验问题中达不到试验目的。(2)对模型的合适性有时无法检验,因为在被动处理数据时在同一试验点上不一定存在重复试验数据。为了适应寻求最佳工艺、最佳配方、建立生产过程的数学模型等的需要,人们就要求以较少的试验次数建立精度较高的回归方程。,为此,要求摆脱古典回归分析的被动局面,主动把试验的安排、数据的处理和回归方程的精度统一起来考虑,即根据试验目的和数据分析的要求来选择试验点,不仅使得在每一个试验点上获得的数据含有最大的信息,从而减少试验次数,而且使数据的统计分析具有一些较好的性质。这就是二十世纪五十年代发展起来的“回归设计”所研究的问题。回归设计的分类:根据建立的回归方程的次数不同,回归设计有一次回归设计、二次回归设计、三次回归设计等;根据设计的性质又有正交设计、旋转设计等。本章仅介绍一次回归的正交设计与二次回归的组合设计(包括正交设计与旋转设计)。,12.1.4 因子水平的编码 在回归问题中各因子的量纲不同,其取值的范围也不同,为了数据处理的方便,对所有的因子作一个线性变换,使所有因子的取值范围都转化为中心在原点的一个“立方体”中,这一变换称为对因子水平的编码。方法如下:设因子 的取值范围为:,与 分别称为因子 的下水平与上水平。其中心也称为零水平:,因子的变化半径为,令,此变换式就称为“编码式”。,例12.1.1 为提高某橡胶制品的撕裂强度,考察橡胶中某成分的百分比、树脂成分的百分比及改良剂的百分比三个因子对其的影响,这三个因子的取值范围分别为:对其作编码,令 通过上述变换后,编码空间为中心在原点的立方体,其边长为2。在后面我们将会看到,在编码时,有时立方体的边长可以大于2。,今后称x 的可能取值的空间为编码空间。我们可以先在编码空间中寻找一个点x0使E(y)满足质量要求,然后通过编码式寻找到z0。,12.2 一次回归正交设计 12.2.1 一次回归正交设计 建立一次回归方程的回归设计方法有多种,这里介绍一种常用的方法,它是利用二水平正交表来安排试验的设计方法。其主要步骤如下:1确定因子水平的变化范围 设影响指标y的因子有p个,希望通过试验建立y关于 的一次回归方程,那么首先要确定每个因子的变化范围,设因子 的取值范围为:,这里 与 分别是因子 的下水平与上水平。,2对每一因子的水平进行编码 记因子 的零水平为 其变化半径为 那么采用如下编码式,即,对因子的水平进行编码,常列成如下的因子水平编码表:,3选择适当的二水平正交表安排试验 在用二水平正交安排试验时,要用“-1”代换通常二水平正交表中的“2”,以适应因子水平编码的需要。这样一来,正交表中的“1”与“-1”不仅表示因子水平的不同状态,也表示了因子水平的数量大小。经过这样的代换后,正交表的交互作用列可以由表中相应列的对应元素相乘得到,从而交互作用列表也不需要了。表12.2.2就是一张代换后的L8(27),与原来的正交表没有本质区别,仍然用L8(27)表示。,表的选择仍然同正交设计一样,既要考虑因子的个数,有时还要考虑交互作用的个数。,在改造后的正交表中,若用 表示第i号试验第j个因子xj的取值,那么 称具有上述性质的设计称为正交设计。,12.2.2 数据分析 在一次回归的正交设计中记第i号试验结果为yi,i=1,2,n,此时我们假定的模型是 我们要建立y关于 的一次回归方程 可采用回归分析中的最小二乘估计去估计各个回归系数,并对回归方程及回归系数进行显著性检验,最后给出回归方程。在一次回归的正交设计中有关计算十分简单,可以用列表的方法完成。,1.求回归系数的估计 用最小二乘估计求回归系数的估计。结构矩阵,由于X中的元素不是1就是-1,所以每列元素的平方和为n,又考虑到此为正交设计,故正规方程组的系数矩阵为对角阵:,从而,又记,其中,那么回归系数的最小二乘估计为,即,由于C是对角阵,所以各回归系数间不相关。这将为回归方程与系数的检验带来方便,并且在删除变量后回归系数不需重新计算。具体计算可以列表进行(见表12.2.2)。,2回归方程的显著性检验 对回归方程的显著性检验的统计量是 其中 考虑到,故 具体计算与检验见表12.2.3与表12.2.4。,3回归系数的显著性检验 可以采用统计量检验 是否为零。其分母是 的无偏估计 分子是 的偏回归平方和,记为 那么 注意到回归平方和的计算公式,有 具体计算与检验见表12.2.3与表12.2.4。,例12.2.1 硝基蒽醌中某物质的含量y与以下三个因子有关:z1:亚硝酸钠(单位:克)z2:大苏打(单位:克)z3:反应时间(单位:小时)为提高该物质的含量,需建立y关于变量z1,z2,z3的回归方程。1试验设计(1)确定因子取值范围,并对它们的水平进行编码 本例的因子水平编码见表12.2.5。表12.2.5 因子水平编码表 因子 水平 编码值 z1 z2 z3 上水平+1 9.0 4.5 3 下水平-1 5.0 2.5 1 零水平 0 7.0 3.5 2 变化半径j 2 1 1,(2)利用二水平正交表安排试验 本例有三个因子,即p=3,为今后可能需要考察因子间的交互作用方便起见,因此选用L8(27),将三个因子分别置于第一、二、四列上,从而可得试验计划,并按计划进行试验。试验计划及试验结果见表12.2.6。,2数据分析 本例的计算见表12.2.7,有关方程与系数的检验见表12.2.8。在本例中n=8。,根据表12.2.7,可以写出y关于x1,x2,x3的回归方程为:若取显著性水平为0.05,有,由于F6.59,所以上述求得的回归方程是有意义的。在显著性水平为0.05时,由表12.2.8知因子x2不显著,其它因子显著。,在正交回归设计中,当某一变量不显著时,可以直接将它删去,此时不会改变其它的回归系数,也不会改变这些变量的偏回归平方和,这是正交回归设计的一个优点。现在将x2从回归方程中删去,最后得各因子均为显著的回归方程是:将编码式:代入,得y关于z1,z3的回归方程为:,从方程知,当z1,z3增加时,y也会相应增加。,我们把不显著变量的偏回归平方和加到残差平方和中,从而获得方程对应的 的估计。在本例中残差平方和变成因此 的估计为。,12.2.3 零水平处的失拟检验 上述用一次回归正交设计方法求得一次回归方程是简单、易行的,但是否能真实反映实际呢?由于试验是在各因子的上水平(+1)与下水平(1)处进行的,即使模型在这些边界点上拟合得很好,但是在因子编码空间的中心拟合是否也好呢?这可用在零水平处增加若干重复试验,再通过检验来判断。设在各因子均取零水平时进行了m 次试验,记其试验结果为,其平均值为,其偏差平方和及其自由度为,利用在零水平处的重复试验的检验有两种方法。,方法1:当一次回归模型在整个编码空间上都适宜时,则按一次回归方程应有如今在零水平上进行了m 次重复试验,其平均值为 这相当于存在两个正态分布:要检验这两个正态分布的均值是否相等,即检验 为此可采用t统计量去检验。,由于 与 独立,因此有 此外且两者也独立,从而并且 与 独立。令 其中,在 时,有对给定的显著性水平,当 时认为模型在编码空间的中心也合适,不存在因子的非线性效应,否则需要另外寻找合适的模型,譬如建立二次回归方程,这将在12.3中介绍。,方法2:由于在各因子均取零水平时进行了m 次重复试验,因此可以采用12.1.2中的失拟检验,将n+m次试验结果合并在一起进行数据分析,并检验 采用统计量 对给定的显著性水平,当 时认为模型合适,否则需要另外寻找合适的模型。,12.2.4 含交互作用的模型 当变量间存在交互作用时,我们可以更一般地考虑建立含两个因子间交互作用的模型,其交互作用用两个因子的编码值的乘积表示,即可假定有如下的回归模型:只要在回归的一次正交设计中,n大于 就可以将其看成是k元线性回归,并且这k项仍然是相互正交的,因此可以在表12.2.3中加上诸列,按同样的计算便可求得诸回归系数,并对它们进行检验。,譬如对例12.2.1来讲,我们可以建立如下回归方程:系数的估计可以按表12.2.9计算。,对系数与方程的检验见表12.2.10。,若取显著性水平为0.10,那么,此时所有交互效应与因子x2不显著,结论同上。,12.2.5 快速登高法 我们进行回归设计目的是要寻找最好的条件,但是在开始进行试验时,可能与最优条件相距甚远,此时需要寻找一条进行试验的路径,使指标值很快达到最大(或最小),快速登高法便是这样一种快速向最优点逼近的方法(若要求指标值小的话,也称最速下降法)。,1.快速登高法的基本想法是:根据微分学原理,任一多元函数在局部区域内总可以用一个多维平面去近似。利用一次回归正交设计可以建立一次回归方程,此时如果要在编码空间中寻找一个点使指标y达到最大(或最小),那么这个点总是位于边界上。当点越出边界后,指标值是否会更大(或更小)呢?为回答这一问题,我们可以采用如下的方法:先在一个小区域上拟合一次回归方程(12.2.11)再从编码空间的中心出发,沿着(12.2.11)的“梯度方向”选择若干个试验点进行试验,以便观察指标y的变化,从而寻找使y达到更大(或更小)的点。这种从编码空间的中心出发,在(12.2.11)的梯度方向上安排若干试验点的方法称为快速登高法。,2.梯度方向 一个多元函数 在点 的梯度是一个p维向量,其第j个分量是y关于xj的偏导在该点的值,这一向量所决定的方向便是该点的梯度方向,它是多元函数y增长最快的方向。对(12.2.11)来讲,任意一点的梯度方向是(b1,b2,bp)。如果因子间存在交互作用,这时建立的回归方程为:那么在编码中心(0,0,0)的梯度方向仍为(b1,b2,bp)。,3.快速登高法的试验点 记因子 的零水平为,变化半径为,编码值 的回归系数为,沿梯度方向的试验点取为,这里m是在梯度方向上进行试验的点数。在因子空间中,称 为步长。为实施试验方便,设置一个步长变化系数d,那么实际试验中的步长变化为,d的具体确定方法参见例12.2.2。快速登高法的具体试验点见表12.2.11,其示意图见图12.3.1。,图12.2.1 快速登高的示意图,例12.2.2 一位化学工程师需要确定化工产品收率最大的操作条件。他认为影响收率有两个因子(变量):反应时间z1与反应温度z2,当前的运行条件是z1=35(分钟),z2=155(),而收率约是40%。试验与分析的步骤如下:1拟合一次回归模型,即建立一次方程:(1)给出两个因子在试验中的变化范围:因子水平表,(2)用二水平正交表L4(23)安排试验,试验方案与结果如下:,(3)建立一次回归方程:,所得一次回归方程为:,对回归方程与回归系数作显著性检验的方差分析表如下:,若取,那么,所以方程在显著性水平0.05上是显著的,又,则两个系数也是显著的。,2检验一次方程的合适性 为了了解是否存在因子间的交互作用,是否有因子的高次效应,在中心点进行了m=5次试验,结果为:40.3,40.5,40.7,40.2,40.6其平均值为,偏差平方和为,其自由度=4。采用方法1中的检验统计量t作检验。现在,n=4,m=5,将它们代入后有 若取,那么,由于|t|2.5706,因此在0.05水平认为所得到的一次方程是合适的。,若采用方法2,我们可以将九个试验结果合并在一起建立方程,用12.1.2中的公式,可得到如下方程:此方程的残差平方和为SE=0.1772,再将它分解为纯误差与失拟两个偏差平方和:它们的自由度分别为4与2,作F检验得FLf=0.06,取,那么,由于FLf 5.14,说明方程是合适的。,3给出快速登高的方向与试验点:在本例中,z1的变化以5作步长变化为方便,则步长系数d可取为:那么各因子步长变化及其修匀值见表12.2.16,试验计划及试验结果见表12.2.17。表12.2.16 快速登高参数,从上面的试验结果可以看出,在z1=85(分钟),z2=175()附近结果较好,那么可以以该点为中心,重新设计一个一次回归的正交设计,重复上述过程,直到找到最佳的或满意的最大值为止;也可以该试验条件作为中心点,安排二次回归设计,关于二次回归设计方法见下一节。注:在列出快速登高计划后,不一定按顺序一一试验,可选做其中的若干个,只要y在不断增大即可。,12.2.6 一次回归正交设计的旋转性 1.旋转性:若一个设计在离设计中心距离相等的点上,其预测值的方差相等,则称该设计为旋转设计。由于方差相等可减少对预测的干扰,因此旋转性颇受人们的关注。2.一次回归的正交设计具有旋转性 在上面介绍的设计中,利用(12.1.10)与(12.1.11)有 且 互不相关,因此预测值的方差为:现在编码空间中心点的坐标为(0,0,0),记点(x1,x2,xp)离中心的距离记为,则 从而在离中心距离为的点上预测值的方差相等,仅与 有关,其值为:这就表明一次回归的正交设计具有旋转性。,12.3 二次回归的中心组合设计 一、中心组合设计方案 中心组合设计中的试验点由三部分组成:(1)将编码值-1与1看成每个因子的两个水平,如同一次回归的正交设计那样,采用二水平正交表安排试验,可以是全因子试验,也可以是其1/2实施,1/4实施等。记其试验次数为mc,则mc=,或(1/2实施)、(1/4实施)等。(2)在每一因子的坐标轴上取两个试验点,该因子的编码值分别为-与,其它因子的编码值为0。由于有p个因子,因此这部分试验点共有2p个。常称这种试验点为星号点。(3)在试验区域的中心进行m0次重复试验,这时每个因子的编码值均为0。,譬如p=2的中心组合设计方案是:,试验点分布的图示为:,二、中心组合设计方案的特点 该方案总试验次数n为:每个因子(变量)都可取5个水平,故该方案所布的试验点范围较广。该方案还有较大的灵活性,因为在方案中留有两个待定参数m0(中心点的试验次数)和(星号点的位置),这给人们留下活动余地,使二次回归设计具有正交性、旋转性等成为可能。中心点处的m0次重复,使试验误差较为准确估计成为可能,从而使对方程与系数的检验有了可靠依据。,12.4 二次回归正交设计 如果一个设计具有正交性,则数据分析将是十分方便的,又由于所得的回归系数的估计间互不相关,因此删除某些因子时不会影响其它的回归系数的估计,从而很容易写出所有系数为显著的回归方程。我们可以适当选择m0与 使二次回归中心组合设计具有正交性。,12.4.1 二次中心组合设计的结构矩阵X与系数矩阵 p=2的中心组合设计回归模型的结构式为,结构矩阵如下:x0 x1 x2 x1x2(x1)2(x2)2,这里mc=4,2p=4,则n=mc+2p+m0=8+m0,再记那么,一般情况下有,其中,表示元素均为1的u维列向量,表示为行向量,表示u阶单位阵,表示u行v列的矩阵,其元素均为1,G是p阶对称方阵,其对角元均为,非对角元均为mc,即,12.4.2 正交性的实现 要使中心组合设计具有正交性,就要求 为对角阵。首先利用“中心化”变换使诸平方项列的和为0,为此把列的元素减去该列的均值,即令,从而此时的 阵为:,这里GG是p阶对称方阵:,其中的对角元 为 列元素的平方和,且都相等,记为:非对角元g为 与()对应元素的乘积和,(12.4.7)为使设计成为正交的只要设法使g=0。由于在g中mc是给定的,n=mc+2p+m0,所以在给定了m0后,g只是 的函数:,因此可以适当选取 使g=0。对不同的因子个数p与中心点重复次数m0,对应的值见表12.4.1。,表12.4.1 二次回归正交设计的参数 值表,12.4.3 统计分析 1回归系数的估计 在对 列作了中心化变换后,我们可以首先建立y 关于诸 的回归方程:,现在 为对角阵,从而其逆矩阵十分简单:,再记,其中 则 具体计算见表12.4.2。,2对回归方程与回归系数的检验 由于是正交设计,有诸 的偏回归平方和为 回归平方和为,仍然用 表示总平方和,其自由度为,则残差平方和为,其检验可在表12.4.3上进行。,若在中心点上有重复试验的话,还可以进一步对 进行分解:,记在中心点上的试验结果为,其平均值,则 可对二次回归模型的合适性进行检验。,例12.4.1 为提高钻头的寿命,在数控机床上进行试验,考察钻头的寿命与钻头轴向振动频率F及振幅A的关系。在试验中,F与A的变动范围分别为:125 Hz,375Hz与1.5,5.5,采用二次回归正交组合设计,并在中心点重复进行三次试验。,1对因子的取值进行编码 现在有两个因子,即p=2,现在中心点进行三次试验,即m0=3,则有表12.4.1上查得此二次回归正交组合设计中的=1.148。若因子zj 的取值范围为,则令 的编码值分别为-,,那么零水平为:变化半径为:编码值-1与1分别对应于:与 在本例中因子F与A的零水平分别是250,3.5;它们的变化半径分别是109,1.74.因子编码值见表12.4.4。,2试验计划与试验结果 本例的试验计划见表12.4.5,在试验随机化后所得试验结果列在该表的最右边一列。表12.4.5 试验计划与试验结果,3参数估计 为求出y关于 的二次回归方程,首先将 与 列中心化,即令。在本例中:则,(12.4.16)此时。回归系数的估计见表12.4.6。,4.模型、方程及系数的检验 本例中由于在中心点有3次重复试验,所以在给出所得到的回归方程之前,先对模型的合适性、方程及系数作显著性检验:中心点上3次试验结果的平均值为=206,由此求得纯误差平方和 Se=1026,从而失拟平方和为:SLf=1281.53-1026=255.53,失拟检验的统计量为:在 时,所以认为模型合适。有关方程与系数的检验见表12.4.7。,由于,所以认为方程显著。又,。所以 与 的系数在显著性水平0.05上是显著的,x2的系数在显著性水平0.10上是显著的。,5.写出二次回归方程并求最佳条件 我们可以写出在0.10水平上各系数都显著的回归方程为:,再将(12.4.16)代入,即可得y关于x1,x2的二次回归方程:最后再将编码式代入,即可得y关于F,A的二次回归方程:为延长寿命,可以将回归方程对F与A分别求导,并令其为零以解出最佳水平组合为F=291.58,A=3.50,在该水平组合下,平均寿命的估计是211.6。,12.5 二次回归旋转设计12.5.1 旋转性条件与非退化条件 回归正交设计的最大优点是试验次数较少,计算简便,又消除了回归系数间的相关性。但是其缺点是预测值的方差依赖于试验点在因子空间中的位置。由于误差的干扰,试验者不能根据预测值直接寻找最优区域。若能使二次设计具有旋转性,即能使与试验中心距离相等的点上预测值的方差相等,那就有助于克服上述缺点。所以试验者常常希望牺牲部分的正交性而获得旋转性,特别在计算机软件发展的今天,计算的不便之处可以交由计算机帮助处理。,一、旋转性条件 在一般的p元d次回归中,共有 项,此时正规方程的系数矩阵 是 阶对称方阵,其中元素的一般形式是 其中指数 分别可取 等非负整数,且还要满足 A中的元素也可分成两类:一类元素,它的所有指数都是偶数或零,另一类元素,它的所有指数中至少有一个为奇数。在旋转设计中,对这两类元素是有要求的,下面的定理便给出了A中元素的具体结构,是旋转设计的基本要求,称为旋转性条件。,定理12.5.1 在p 元d次回归的旋转设计中对应的A中的元素 其中指数如上所述,n是试验次数,是待定参数,下标a 必为偶数,且。,特例:对d=1,2的旋转性条件具体化。(1)d=1的情况:在一次回归旋转设计,此时A中满足 且 都是偶数或零这些条件的,应有 而A中其它元素都是0,此时 其中 是p+1阶单位阵。在12.2中给出的一次回归正交设计便是 的一次旋转设计。,(2)d=2的情况:在二次回归旋转设计,此时A中满足 且 都是偶数或零这些条件的,有以下几种情况,这时 这是一个 阶对称方阵,其中,是一个p阶对称方阵,是元素全为1的p 维列向量,空白处为零矩阵,与 可以根据具体的设计确定。,二、非退化条件 为获得二次回归方程中的回归系数的最小二乘估计,需要求,因此还要求。由于,要使,必须要 它提供了作旋转设计时应该避免的情况,称为二次设计的非退化条件。,12.5.2 二次旋转设计 这一小节我们具体给出一个中心组合设计要成为二次旋转设计的条件。1.二次设计的旋转性条件 按定理可以具体给出二次设计的旋转性条件为:,若设第i个试验点 位于半径为 的球面上,那么 从而 所以,另一方面 则 所以,这表明 与 平方的比值不仅与因子数p、试验次数n 有关,还与n个试验点所在球面的半径()有关。,2.二次中心组合设计的非退化条件:为使设计是非退化的,就要求试验点的分布满足,我们可以证明在二次中心组合设计中有:等号成立的唯一条件是n个试验点都在同一球面上。证明:由于对任意实数 有这表明如下二次三项式是非负的:,所以判别式即,这表明只要n 个试验点不在同一球面上就有可能获得旋转设计方案。在中心组合设计方案中n个试验点分布在三个不同半径的球面上,其中:个点分布在半径为 的球面上;2p个点分布在半径为 的球面上;个点分布在半径为 的球面上。它不会使矩阵A退化。,3.的选取 为使设计满足旋转性条件只要适当选取参数,在中心组合设计中有:因此,为使设计具有旋转性,则要求 即只要:从中便可求得。当对中心组合设计提出进一步的要求时,可以确定设计中的另一个参数m0。,12.5.3 二次回归正交旋转设计 当要求一个设计不仅具有旋转性,还要求保持正交性,或至少是近似正交的。这时需要使的非对角线元素全为0,那么只需要(12.4.7)给出的g=0,现在 在g的表达式中,mc是给定的,现在 也已确定,从而g只是m0的函数,所以可令g=0解出m0。如果解得的m0是整数,则所得设计为正交旋转设计;如果所得解不是整数,则取最接近的整数,这时的设计是近似正交的旋转设计。,二次回归正交(或近似正交)旋转组合设计的参数 与m0见表12.5.1。表12.5.1 二次回归正交旋转组合设计参数,12.5.4 二次回归通用旋转设计 所谓一个设计具有通用性是指在与编码中心距离小于1的任意点(x1,x2,xp)上的预测值的方差近似相等。由于一个旋转设计各点预测值的方差仅与该点到中心的距离有关,则Var()=f(),通用设计要求当1时,f()基本为一个常数。根据这一要求,可以通过数值的方法来确定m0。当一个设计既要具有旋转性又要具有通用性时,设计中的参数与m0见表12.5.2。,12.5.5 数据分析 由于正交旋转设计的数据分析同前面12.4.3一样,所以下面仅对通用旋转组合设计的数据分析作一介绍 1回归系数的估计 要估计回归系数必须先求出XX的逆矩阵,在二次回归组合设计中,可求得:,根据不同的p与实施方案,其中的K,E,F,G的值已列成表格供使用(见表12.5.3)。,如果记XY阵中的元素为:则回归系数的估计为:,2对回归方程的检验 由于在回归系数的估计中未进行中心化变换,因此各类偏差平方和的计算要用下面的公式:现在残差平方和的计算可以如下进行:从而回归平方和为:各类自由度分别为:,由于在中心点有m0次重复试验,因此还可将SE分解为:其自由度分别为:这样可先检验模型的合适性,所用统计量为 当模型合适时,再用统计量:检验方程的显著性。,3对回归系数的显著性检验 为对回归系数进行显著性检验,需要诸项 的偏回归平方和及2的估计,其公式如下:,从而检验诸项 系数的统计量依次为:,如果有不显著的项,要删去该项,一次只能剔除一项,由于这里不是正交设计,所以回归系数间具有相关性,删除一个变量后,回归系数需要重新计算。由于求回归系数的正规方程组的系数矩阵阶数较高,求逆矩阵相当麻烦,通常将这项工作交给计算机协助完成。,例12.5.1 超声波换能器设计中要求灵敏度余量y尽量大,而这一指标与以下两个因子有关:z1:保护膜厚度,取值范围为0.20.6(mm)z2:吸收材料之比,取值范围为4:17:1为减少试验次数并建立精度较高的回归方程,决定采用二次回归通用旋转组合设计。,1对因子的取值进行编码 在p=2时,从表12.5.2查得设计参数为:=1.414,m0=5共需进行n=13次试验。编码如下:,2试验计划与试验结果 本例用编码值表示的试验计划见表12.5.5,在试验随机化后所得试验结果列在该表的最右边一列。,3参数估计(1)先求出各,它们列在表12.5.6的最后一行。(2)按公式(12.5.9)求回归系数的估计:先在表12.5.3中查得:K=0.2,E=-0.1,F=0.14375,G=0.01875,又由于mc=4,=1.4142,故得=8,代入(12.5.9)得:b0=57,b1=1.04105,b2=-0.364275,b12=-0.125,b11=-1.59375,b22=0.40625从而得回归方程为:,表12.5.6 计算表,4对模型与方程的检验 为对回归方程作检验,首先要计算各类偏差平方和,有:由于在中心点重复进行了5次试验,中心点试验结果的平均值=57,因此还可求出其误差的偏差平方和:从而失拟平方和为:检验模型合适性的F比为:所以模型合适。,把SLf并入试验误差后再对方程的显著性进行检验,有:所以方程有意义。,5对每一回归系数分别进行检验 由上可得=2.6744/7=0.382,那么对回归系作检验的统计量分别为:F1=8(1.04105)2/0.382=22.697 F2=8(-0.364275)2/0.382=2.779 F12=4(-0.125)2/0.382=0.164 F11=(-1.59375)2/(0.143750.382)=46.256 F22=(0.40625)2/(0.143750.382)=3.005若取,查表得F0.95(1,7)=5.59,则 三个系数不显著,但是由于系数间不独立,所以不能一次将它们全部删除。可以逐一删除不显著的项,再检验,直到获得每一系数都显著为止。由于F12最小,所以首先删去,然后建立方程,再检验,直到所有系数显著为止。这一过程通常交计算机来完成。我们这里罗列以下中间结果:,首先删去,得到的回归方程为:对各系数检验的F值分别为:25.30,3.10,51.70,3.35。由于F0.95(1,8)=5.32,则 两个系数不显著。再删去,得到的回归方程为:对各系数检验的F值分别为:20.52,41.86,2.72。由于F0.95(1,9)=5.12,则 的系数不显著。再删去,得到的回归方程为:(12.5.17)对各系数检验的F值分别为:17.55,38.81。由于F0.95(1,10)=4.96,各系数均显著。所以这是最后所得方程。在此回归方程中。,(5)写出回归方程并求最优条件 各项系数在0.05水平上显著的回归方程为(12.5.17),该方程中不含x2,所以只要将x1的编码式 代入,则得y 关于z1的回归方程为:,在获得了方程后,可以寻找使y达到最大的条件,将上式的右边对z1求导并令其为零,可解得:z1=0.44。这表明我们取保护膜厚度为0.44mm,可使y达到最大,此时E(y)的估计值为57.422。由于z2对y影响不大,所以可以在试验范围内任意选取。若该材料比较贵,则可选取z2=4:1。,