试验设计与优化拟合ppt课件.ppt
《试验设计与优化拟合ppt课件.ppt》由会员分享,可在线阅读,更多相关《试验设计与优化拟合ppt课件.ppt(185页珍藏版)》请在三一办公上搜索。
1、第三部分试验设计,实验设计与优化的重要性,就分析化学而言,通过试验设计以找到最优的量测实验条件一直是化学计量学研究的一个重要内容,如色谱分析中的最优分离条件的选择、各种仪器分析方法的诸多参量的选择等。 对于化学量测实验,试验设计的成败,关系到实验能否得到包含所需信息的化学量测数据,一个失败的试验设计将导致所得到的数据中包含的信息量极低,任何卓有成效的处理数据的化学计量学方法也无法从中提取有用的信息。,教学内容,1基本概念2 因子设计和部分因子设计3正交试验设计4 均匀试验设计5 D-最优试验设计6 星点设计,基本概念,试验指标或响应值,在试验设计中,衡量试验效果的量称为试验指标或响应值,能用数
2、值表述的指标称定量指标,如化学反应的产率、分析试验的检测限或其他品质因数等。,定性指标,不是用量表示的指标称为定性指标,如化学产品的色度等。,定量指标,定性指标常可转化为定量指标,如用5级计分进行评分等。,多指标试验设计,当试验设计的指标要用一组数表示时,如分析方法的优化需考虑灵敏度、准确度、选择性等,称多指标试验设计的问题。,因素(因子),在改变试验条件时,能够影响试验指标取值的量称为因素(亦称因子)。,因素也可以是定量因素或定性因素,和指标一样,定性因素总可转化为定量因素。,水平,因素的取值,称为因素(或因子)的水平。,一般试验方案是由若干个试验组成,因素在这些试验中变化了几种状态就称为几
3、种水平。,试验设计中,只对可控因素在试验前作出设计,而对不可控因素,则在试验过程中记录其水平,在数据分析中加以处理。,有的因素所处的状态是不可控制的,例如在自然条件下进行的某些试验。一般化学实验的条件多是可控。,水平,协同作用,交互作用,试验域,因素的可能取值的区域称为试验域,多个因素对试验的共同影响,但不是简单的加和的现象。,同时试验,通过试验设计对有关因素的水平进行规划后,同时进行诸因子各水平的试验,继综合分析所得到的试验结果,求出最优条件。,序贯试验,每进行一次或少数几次试验后,先分析已取得的试验结果,再根据这些结果规划下一步的试验,目前应用广泛的正交试验、均匀试验设计及最优试验设计基本
4、上属于同时试验法,而序贯试验法的典型代表是单纯形优化法。值得提出的是,同时试验与序贯试验可在优化试验中综合使用。,序贯试验,设计和优化,试验设计就是研究如何选择和优化实验条件,好的试验设计能够通过有限次数的试验,选择优良的实验条件,节约人力、物力、财力和时间。因此,试验的设计与优化密不可分。,方法分类,分析法,在试验区域内有目的、有规律地散布一定量的试验点,多方向同时寻找优化目标。因只是对给定条件下一切可能的试验点进行优化,因此不能真正实现全局优化,所谓的最优化只是近似的,最优点也只是较优点。但实际应用表明,该优化方法完全能够满足一般科研和生产的实际需要。,也就是同时试验法又称同步试验法或离散
5、优化法,黑箱法,在实现优化目标的整个过程中,遵循一定的优化路径逐渐寻找最优点的方法,它是单向寻优,后一阶段是在前一阶段优化的基础上进行。,方法分类,也就是序贯试验又称循序试验法或序贯优化,拉丁方,18世纪的欧洲,普鲁士弗里德里希威廉二世要举行一次与往常不一样的阅兵仪式,他要求阅兵式由6列方队组成,每个方队的行和列都要由6种不同部队的6种军官组成,不得有重复和空缺。这实际上就是要求在6列方队中,安排的部队、军官在,行和列全部排列均衡。这在当时可难坏了大臣们,他们冥思苦想也没有找到答案,就请教于当时著名的数学家欧拉。,由此引起了数学家们的极大兴趣,提出了均衡分布的新的数学思想,这种思想对研究自然世
6、界具有普遍的意义。这种思想正是今天试验设计的基本思想。20世纪20年代,英国统计学家Fisher运用均衡排列的拉丁方成功地解决了农业试验中的试验条件不均匀问题,创立了试验设计这一学科。,拉丁方是用字母或数字排列的具有一定性质的方阵,每个字母或数字在该方阵中每行和每列中恰好出现一次,方阵的行数或列数称为拉丁方的阶。,第一行,以及第1列上所有字母(或数字)是按字母(或数字)顺序排列的拉丁方。如上图中前一种,标准拉丁方,从标准拉丁方出发,通过交换行或列可得到其它形式的拉丁方。如上图后一种是由标准形式的1和2列互换而得,因子设计,因子设计(Factorial Design)是一种多因素试验设计方法。因
7、子设计根据拉丁方的思想,考察各因素所有可能的组合来安排实验,属于全面试验。,试验数目,因子设计的任务就是要通过这样的试验安排来了解各个因素及各因素水平之间的搭配对响应值或指标的影响,即析因问题。,为水平数(n)为底、因素数(m)为指数的幂,即nm,2水平 3 因素: 23=82水平 4 因素: 24=162水平 7 因素: 27=1283水平 4 因素: 34=81,析因设计表,因素:A因素 B因素 AB因素,水平:低水平 高水平,FD4(22)析因设计表,第1列是试验序号,第2列是第1个因素从开始,以与相间排列,第列是第个因素从与开相间排列, 即前一因素的水平加倍后,再相间排列,第4列是两因
8、素的交互效应列,遵守乘法规则排列,FD8(23)析因设计表,设计矩阵MATLABR的实现,fullfact函数,desing=fullfact(levels),格式,说明,函数FULLFACT用于混合水平(mixed-levels)的全因子设计矩阵。输入矢量参数levels用于定义因素的水平数,如levels=2 4 3,函数将给出24次试验的全因子设计矩阵。其中第1列是2水平;第2列是4水平;第3列是3水平。,示例,d = 1 1 1 2 1 1 1 2 1 2 2 1 1 1 2 2 1 2 1 2 2 2 2 2 1 1 3 2 1 3 1 2 3 2 2 3,d=fullfact(2
9、2 3),d = 0 0 0 0 0 1 0 1 0 0 1 1 1 0 0 1 0 1 1 1 0 1 1 1,示例,d=ff2n(3),full2n函数,格式,desing=full2n(N),说明,Full2n用于构建两水平设计表,给出具有N列的设计矩阵,其中输入参数N为因子数,效应分析,主效应估价,主效应:单个因素对实验结果的影响,A因素主效应,B因素主效应,因素主效应等于: (高水平和低水平之和)/水平重复数,效应A=(y2-y1)+(y4-y3)/2 =(y2+y4)-(y1+y3)/2,=(y3-y1)+(y4-y2)/2 =(y3+y4)-(y1+y2)/2,交互效应估价,交互
10、效应在直观图上表现为对角线的变化,交互效应=(正项和负项和)/重复数,交互效应存在于否的直观判定,FD8(23)析因设计表,对于FD8(23)析因设计,各因素主效应,A效应=(y2+y4+y6+y8) (y1+y3+y5+y7)/4,B效应=(y3+y4+y7+y8) (y1+y2+y5+y6)/4,C效应=(y5+y6+y7-y8) (y1+y2+y3+y4)/4,对于三因素的试验,其各因素的主效应已由原来的二因素的线表示,变化成面的表示。联系其设计表,各因素的主效应对应的计算式如下,FD8(23)析因设计表,两因素间交互作用效应,三因素中任意两因素间的交互效应已由原来的二因素试验时的交线变
11、为交叉成面的表示。联系其设计表对应的计算式如下,AB交叉效应=(y1+y4+y5+y8) (y2+y3+y6+y7)/4,AC交叉效应=(y1+y3+y6+y8) (y2+y34+y5+y7)/4,BC交叉效应=(y1+y2+y7+y8) (y2+y3+y5+y6)/4,三因素间交互作用效应,ABC三项间的交叉作用在立体直观图上无法表示,其对应的计算式为,ABC交叉效应 =(y2+y3+y5+y8) (y1+y4+y6+y7)/4,【例】液相色谱分离酚,试验立体直观图,主效应,=(y2+y4+y6+y8)-(y1+y3+y5+y7)/4 =(9.5+10.7+8.8+11.7) - (10.0
12、+11.0+9.3+11.9) /4 = -0.375,=(y3+y4+y7+y8) - (y1+y2+y5+y6)/4 =(11.0+10.7+11.9+11.7)-(10.0+9.5+9.3+8.8)/4 =1.925,=(y5+y6+y7+y8) - (y1+y2+y3+y4)/4 =(9.3+8.8+11.9+11.7) -(10.0+9.5+11.0+10.7)/4 =0.125,甲醇(M),乙酸(A),柠檬酸(C),两因素交叉效应,乙酸对甲醇(AM) =(y8+y5+y4+y1)- (y7+y6+y3+y12)/4 =(11.7+9.3+10.7+10) -(11.9+ 8.8+1
13、1+9.5+)/4 =0.125,乙酸对柠檬酸(AC) =(y8+y6+y3+y1)- (y7+y5+y4+y2)/4 =(11.7+8.8+11+10) -(11.9+ 9.3+10.7+9.5+)/4 =0.025,两因素交叉效应,甲醇对柠檬酸(MC) =(y1+y2+y7+y8)- (y3+y4+y5+y6)/4 =(10+9.5+11.9+11.7) -(11+10.7+9.3+8.8)/4 =0.825,三因素交叉效应,乙酸甲醇柠檬酸(AMC) =(y2+y3+y5+y8)- (y1+y4+y6+y7)/4 =(9.5+11+9.3+11.9) -(10+10.7+8.8+11.9)
14、/4 =0.025,效应及残差正态图,效应正态图(Normal plot of effects),对各因素的主效应及交叉效应的计算后,进而需对这些效应进行统计估价,决定哪些效应在模型建立时需要包括,哪些可以忽略。,正态图即正态分布图。是用来检测一系列 变量是否服从正态分布的图形。 因正态分布为一种由多种不定因素综合效 果而产生出来的分布,所以,如某些效应 服从正态分布,就可认为它们实际对实验 不产生显著影响。,残差正态图(Normal plot of residuals),残差正态图是在建立模型后,按模型计算试验结果的残差,进而对残差进行统计估价,判断所得模型是否合理。,正态分布图的构造,1)
15、先将需检验的一系列变量按大小进行排列,对于已得到的各种效应,可得如下表所示的排列;,色谱分离试验所得各种效应的顺序排列表,效应名称 A AC AMC C AM MC M效应数值 -0.375 0.025 0.025 0.125 0.125 0.825 1.925,2)计算累积概率:对于有T个数据的系列,可根据以下公式计算它们的累积概率,Pi(%) =100 (i - 0.5) / T,3)以需检验变量的标度为x轴,以累积概率为y轴作图,在图上能用一条直线描述的变量可视为是服从正态分布的变量。,效应名 A AC AMC C AM MC M概率 7.14 21.43 35.71 50 64.88
16、78.57 92.86,色谱分离试验的正态分布图,从图可以看出,效应AC、AMC、C以及AM正好落在一条直线上,说明它们对试验的影响很小,可以忽略。于是,如果需对此色谱分离试验建立回归模型的话,只需选择乙酸(A)、甲醇(M)和甲醇及柠檬酸的交叉效应(MC)来建立相应的模型即可。,对数据建模得,y =10.363 - (0.375/2)XA +(1.925/2)XM +(0.825/2)XMC,得到上述模型后,用它来计算该模型的残差,如所得残差按上述方法所得的残差正态分布图可用一直线表出,说明模型是合理的。用此模型算出的残差列表,它们的残差正态分布图示于下图。这些残差点近似可由一条直线表出,但分
17、散度较大。,No. 1 2 3 4 5 6 7 8实验值 10.09.511.010.7 9.3 8.8 11.9 11.7计算值 10.08.8011.111.55 10.0 8.80 11.10 11.55残差 -0.00.70-0.10-0.85-0.70-0.00 0.80 0.15,色谱分离试验所得残差表,色谱分离试验的残差正态分布图,对于来自于正态分布的一系列数据X,当把X按升序(由小到大)排列、对序号绘图后,大多数数据近似一条直线。,正态分布图,正态分布随机产生的标准差为1的组数,排序后示意图( 均值为0, 100个数据),将T个自然数进行变换,使成累积概率形式,Pi(%) =1
18、00 (i - 0.5) / T,此时,累积概率同自然数序列成线性关系,正态分布随机产生的(均值为0,标准差为1 )100个数据的组数,排序后,对按自然数进行变换,使成累积概率作图,正态分布随机产生的(均值为0,标准差为1 )10个数据的组数,排序后,对按自然数进行变换,使成累积概率作图,正态分布随机产生10个数据,排序后,对按自然数进行变换,使成累积概率作图,对直线偏离较大的点,或是不来自不同分布,蓝:均值为0标准差为1 ;红,均值为0标准差为4黑:均值为4标准差为1,有关MATLAB指令,生成服从正态分布的随机数:r=normrnd (mu, sigma, m)% mu为均值% sigma
19、为标准差% m为12的向量%r=normrnd(0,1,100 1)排序: r=sort(r)累积概率:y=100*(i-0.5)/T绘图:plot(r,y,o)添加最小二乘拟合线:isline,经正态分布图估算效应的其它算法,直接绘正态概率图,MATLAB 指令normplot(x) % x 待处理原始数组,正态分布的Q-Q图,MATLAB 指令qqplot(x),关系模型,对于二因素试验方案,当用代表Y指标,代表X因素,因素与指标间的模型可用下列方程表示,式中y表示4次试验结果构成的矢量,xj表示第j个因素在4 次试验中的水平矢量;e 为误差矢量。写成矩阵为,即,A的最小二乘解为,矩阵A中
20、第一个a0元素是一常量(平均贡献)a1, a2, 分别是因素x1和x2的主效应a3是因素x1和x2的两者之间x1x2的交互效应的量度。,在因子设计中,X矩阵的形式非常简单,元素仅为“+1”和“-1”,其逆阵存在、且其值是原矩阵的X的转置1/n倍。其中n为试验次数,故可有,即,同理对于三因素试验方案,对于实例模型,y =10.363 - (0.375/2)XA +(1.925/2)XM +(0.825/2)XMC,平均贡献=10.363,2水平因子设计时需计算的效应数,在实际研究中,因素只有3个的并不多,而且因素试验的水平也不可能只限于2,只要因素和水平数一增加,因子设计就显出了它的不足。即使全
21、部因素均是二水平的,当因素数为n时,总试验数就是N=2n。,部分因子设计(Fractional Factorial Design),对于2水平的部分因子设计半因子设计法 N=2n-1四分之一因子设计法 N=2n-1对于3水平的部分因子设计三分之一因子设计法 N=3n-1,为何要进行部分因子设计?,在不损失信息的情况下,减少试验次数,这一目标可能实现吗?,相关因素 硫酸锌(Zinc sulphate,Z) 硫酸镁(Magnesium sulphate,M) pH值(P) 对硝基苯基磷酸二钠 (Disodium p-nitrophenyl phosphate,D) 2-氨基2-甲基-1-丙醇 (2
22、-Amino-2-methyl-1-propanol, A),实例:磷酸酶活性,构造一个五因素两水平的全因子设计表来进行实验,以得到有关磷酸酶活性的主要影响因素等信息。试验次数N=25=32,磷酸酶活性25次全因子效应正态分布图,此结果似乎说明对于磷酸酶活性的试验原本就可只用三因子设计表来完成,因pH和硫酸镁的效应不显著。这从另一方面说明25次全因子试验本身就存在信息盈余,完全可以想办法减少试验次数。,对磷酸酶活性有显著影响的因素,A(2-氨基2-甲基-1-丙醇),D(对硝基苯基磷酸二钠),Z(硫酸锌),ZD交叉效应(对硝基苯基磷酸二钠与硫酸锌),DA交叉效应 (2-氨基2-甲基-1-丙醇与对
23、硝基苯基磷酸二钠),磷酸酶活性25-1次半因子效应正态分布图,3 正交试验设计,基本思想在试验因素的全部水平组合中,挑选部分有代表性的水平组合进行试验,通过对这部分试验结果的分析了解全面试验的情况,找出最优的水平组合。特点用部分试验来代替全面试验,通过对部分试验结果的分析,了解全面试验的情况。本质上正交试验设计是一种特殊的部分因子设计,正交试验设计,正交试验设计法是利用规格化的表格正交表,科学地挑选试验条件,合理安排实验。正交试验设计法最早由日本质量管量专家田口玄一(Taguchi 日本工业之父)提出,称为国际标准型正交试验法。认为:“一个工程技术人员若不掌握正交试验设计法,只能算半个工程师”
24、。我国工业企业,正交试验设计法的应用也取得相当的成就,中国数学家张里千教授发明了中国型正交试验设计法。上世纪六七十年代由华罗庚教授倡导而兴起。,全面试验与正交试验,全面试验指参与试验的全部因素与全部水平互之间的全部组合。 例:有3个因素(A,B,C), 每个因素有两水平(A1 A2,B1 B2,C1 C2) 则全面试验数为:238 当3因素3水平时,全面试验的次数达到27次正交试验相应的试验次数分别为4次和9次。,3因素(ABC) 2水平(1,2)的全面试验A1B1C1,A1B1C2, A1B2C1,A1B2C2, A2B1C1, A2B1C2,A2B2C1, A2B2C2,23因子设计(全面
25、试验)表,全面试验与正交试验直观图,全面试验:27个试验点正交试验:9个试验点,二因素三水平直观图,三因素三水平直观图,每一平面有均匀分布的2个试验点,3因素(ABC)3水平(1, 2, 3)试验,每一平面有均匀分布的3个试验点,完全对,设有两组元素a1, a2, , an与b1, b2, , bn, 则有nm个“元素对”,上数表为两组元素构成的“完全对”。如有一个矩阵的某两列中,同行元素所构成的元素是一完全对,并在此两列中每对出现的次数也相同,则称这两列搭配均衡,否则为搭配不均衡。,两列搭配均衡,两列搭配不均衡(每对出现的次数不同),对于一个nm阶矩阵A,它的第j列的元素由数码1,2,, t
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 试验 设计 优化 拟合 ppt 课件
链接地址:https://www.31ppt.com/p-1892442.html