试验设计与设计的准则.ppt
试验设计与设计的准则,刘森茂数学科学学院,先从一个简单的试验开始:生产集成电路的一个初始步骤是产生晶体外延层。试验中有三个地方需要配置:感应旋转方法、喷咀位置、沉积温度,每个地方有两种配置方法。也即有三个因子,每个因子两个水平。试验人员希望找出最好的配置,使得产生的外延层厚度尽可能接近15.4毫米。,为此,试验人员在每一种可能的设置下(2的3次方,共8种可能)做5次试验,共40次试验。上述试验叫做“完全因析试验”,我们可以用五次试验距离目标值差距的平方和作为响应变量,建立回归模型,并进行方差分析。,模型方程是:上述参数叫做回归方程的系数,在试验设计中,也叫因子的效应。,一般的分析方法:,最小二乘估计回归分析中的变量筛选正态图、半正态图F检验效应是否显著根据显著的回归系数确定因子水平,这个试验有三个因子,每个水平下重复5次,共有40次试验。但在稍微复杂一点的试验中,因子数往往有8-10个,甚至更多,那时即使没有重复,试验次数也已经数百、上千,这在很多情形下(如农业试验有很长的周期,汽车、机械、核物理等试验则很费钱)是很不好的。这时,流行的做法是选择一个“部分因析试验”。,为了引出“部分因析设计”,我们先给前面提到的“效应”做一个严格的定义。A因子的主效应:A、B因子的交互效应:A、B、C的三阶交互效应:“+”是指一个水平,“-”是另一个。”AB+”是指”A+,B+”或”A-,B-”。通过与前面的回归模型相对比(回归模型中用最小二乘计算回归系数),这里的效应与回归模型中的回归系数只相差一个倍数。,著名的效应三原则:,效应排序原则;低阶效应比高阶效应更重要;主效应二阶效应三阶效应同阶效应同样重要;效应稀疏原则;在因析试验中相对重要的因子效应数目是不多的。,效应遗传原则;要使一个交互效应是显著的,至少它的一个亲本因子是显著的。若AB交互效应显著,则A和B至少有一个是显著的。基于以上原则,设计界目前广泛使用的是部分因析试验,以及用MA准则来判断试验是否优良。,部分因析试验只是完全因析试验的一部分。考虑一个简单的试验(参见Box(1961),page5,table3).我们来看这两个效应:123和4,显然有:也即,这两个效应“别名”,在记号上有:4=123,或I=1234(I是单位元),这也称作一个定义对照关系,也叫定义字。,对一般的部分因析试验,可能有不只一个定义对照关系,可以证明,所有的定义对照关系构成一个二阶可交换群,叫做“定义对照子群”。一个 设计,是说它的试验次数是,它有k个因子,它的定义对照子群有 个元素。,MA准则(最小低阶混杂):,对上面的那个定义字I=BCDE,我们说它的字长度为4,因为是一个4阶效应与单位效应别名。对一个 设计,用 记其定义对照子群中字长为i的字的个数,称为一个试验的字长型。一个MA设计就是顺次最小化字长型的设计。它所依据的道理是效应排序原则,因为如果长度较短的定义字比较多,就意味着低阶效应别名状况比较严重。,上面讲的都是两水平的情形,对于一般的素数水平,理论是相似的。为了一般化,前面说的”+”和”-”要改为GF(2)中的0和1,而一般的素数p水平,就是用GF(p)中的运算法则。对于素数幂 水平,运用GF()中的运算。但对于一般的数,因为没有对应的有限域,所以无法构建相应的部分因析设计理论。我们做一个罗列:2,3,5,7(素数);4,8,9(素数幂),但6不行,而7水平以上的实际试验极为罕见。,试验设计大量的成果和论文就是用来寻找MA设计。参见Chen,Sun,and Wu(1993)(page816).用计算机进行搜索在试验次数和因子数比较小的情形下是可行的,但二者比较大时就变得不可行。90以来,学术界开始用编码理论和有限域上的射影几何来寻找MA设计。其他方法还有“补设计”和“最大偶设计的补设计”等。,其他设计准则:,MA设计准则很直观,也很简洁,但它是不是最好的?我们引入两个基本的概念:一般可以认为,主效应和二阶交互效应是应该考虑的,最多在某些时候考虑一下三阶交互效应,三阶以上是应该忽略的。一个主效应或二因子交互效应如果不与其他主效应或二因子交互效应别名,那么我们称这个主效应(或二因子交互效应)是纯净的。一个纯净的效应如果也不与任何三阶交互效应别名,则称它是强纯净的。,一个新的设计准则就是:那些拥有最多纯净效应的设计是最优的。两个准则的区别与联系:在试验次数和因子数都不太大的情形下,二者大多数是一致的,但随着试验次数和因子数的增大,二者的分歧越来越大。我们考虑一个例子:考虑两个 设计:(1)I=1235=1246=3456(2)I=125=1346=23456,字长型分别为:(0,3,0,0)和(1,1,1,0),因此从MA准则的角度考虑,设计(1)比设计(2)优良。但设计(1)没有纯净的二因子交互作用,而设计(2)有6个,所以在某些场合设计(2)优于设计(1),设计(2)的缺点在于它纯净的主效应只有三个。这两个准则各有优劣,应该使用哪个应视具体情况而定。,GMC准则,这个准则的形式很复杂,要表述清楚都需要很多新的定义和细节。它的思想是全面考虑所有效应之间的别名关系,给出一个复杂的数组,然后顺次最小化这个数组,注意MA设计也是顺次最小化一个数组字长型。但这个准则却是一个最一般化的情形,MA准则和最多纯净效应个数准则都是它的变种或子集。,但关于这个准则下的最优设计研究也是进展缓慢。一些成果可以参见Zhang,Mukerjee(2007)和Li,Zhao and Zhang(2008),这两篇也只是在某些情形寻找到了最优设计。,