分组试验设计.ppt
2023/5/11,数理统计在化学中的应用,1,$8.2 分组试验设计,试验方案的设计:合理安排试验,分析试验结果和影响因素之间的关系,确定影响因素的主次,从而寻找最佳的试验条件试验设计必须考虑的问题研究目的和方法实验对象的选择及所需要的数量(抽样)试验的分组设计和合理的选择观察的指标和标准的方法误差的来源和控制要采用的掘取信息的方法,2023/5/11,数理统计在化学中的应用,2,试验设计的三个基本原理,重复;随机化;区组化,2023/5/11,数理统计在化学中的应用,3,1.完全随机设计分组,1.完全随机设计分组将个试验单位随机分配到各试验组例8-6:动物试验分组之一2.配对试验设计分组将个试验对象先配对,再随机分组,如先按性别,年龄,体重等相近的组成若干对例8-6:动物试验分组之二,2023/5/11,数理统计在化学中的应用,4,2023/5/11,数理统计在化学中的应用,5,2023/5/11,数理统计在化学中的应用,6,$8.3 试验设计,试验设计的目的就是为了试验优化.试验优化由于具有设计灵活、计算简便、试验次数少、优化成果多、可靠性高以及适用面广等特点,因而发展迅速,应用广泛,已成为多快好省地获取试验信息的现代通用技术,成为科学实验、质量管理的一个科学工具。,2023/5/11,数理统计在化学中的应用,7,日本:工程师共同语言的一部分。据说在日本,一个工程师如果没有试验设计这方面的知识,就只能算半个工程师。中国:试验设计的现代发展稳健设计以及各种回归设计方法的实际应用于20世纪70年代末、80年代初在我国才刚刚开始。仅正交试验设计的应用成果目前已超过10万项,经济效益在50亿元以上。还有较大的差距。,2023/5/11,数理统计在化学中的应用,8,一.简单比较和正交拉丁方,在分析试验设计中,当影响的因素较多时,就无法对各个因素的每个水平进行全面的搭配实验,这就需要寻找试验次数少而又能获得可靠结果的试验方法。通常,全面的因素试验只有在因素不多的情况下才可能进行6个因素+5个水平 56=15625,2023/5/11,数理统计在化学中的应用,9,1.简单比较法,例如某合成反应,需要寻找最适宜的酸度(A)、试剂浓度(B)、温度(C),每个因 素分三个水平,一般常用的简单做法是单因素条件试验,即首先人为地固定A和B的量,来变化C。,2023/5/11,数理统计在化学中的应用,10,缺点:,1)看起来好象是做了9次试验,但实际上只是7 次,因为其中有两个各做了两次。2)各因素,各水平出现的机会不等。3)C2是在A1B1条件下最好,但其他条件下是否好,未做试验,因此是不是最佳,并不确定。4)当因素间交互作用影响比较大时,就不一定是各种条件因素的最好的搭配组合。5)用这种方法安排试验,如不重复做试验,是给不出误差估计的,因此,同样的试验次数,提供信息不多。,2023/5/11,数理统计在化学中的应用,11,2.拉丁方试验设计,均衡分布思想,虽然远在古代就有,但只是在近代才与生产科研实际相结合,产生了拉丁方、正交表,显示出它的巨大威力。18世纪的欧洲,普鲁士弗里德里希威廉二世(1712一1786)要举行一次与往常不同的6列方队阅兵式。他要求每个方队的行和列都要由6种部队的6种军官组成,不得有重复和空缺。这样在每个6列方队中,部队军官在行和列全部排列均衡。群臣们冥思苦想,竟无一人能排出这种方队。后来,向当时著名的数学家欧拉(17071783)请教,由此引起了数学家们的极大兴趣,致使各种拉丁方问世。,2023/5/11,数理统计在化学中的应用,12,正交拉丁方法,正交试验法就是在正交拉丁方法的基础上发展起来的。正交拉丁方是指由拉丁字母组成的正方形中,其每一行,每一列内都没有重复的字母。例如下面两个就是44拉丁方。A B C D A B C D B A D C B C D A C D B A C D A B D C A B D A B C,2023/5/11,数理统计在化学中的应用,13,洛书,二四为肩,六八为足,左三右七,戴九履一,五居中央。这是世界上最古老的幻方。它的三条纵行、三条横行、两条对角线上三个数字之和都是十五。,2023/5/11,数理统计在化学中的应用,14,拉丁方其它形式表示,例如因素C的33拉丁方,可写成 C1 C2 C3 C2 C3 C1 C3 C1 C2 利用上述拉丁方就可以把试验安排得很均衡。例如下表的试验。B1 B2 B3A1 A1B1C1 A1B2C2 A1B3C3A2 A2B1C2 A2B2C3 A2B3C1 A3 A3B1C3 A3B2C1 A3B3C2,2023/5/11,数理统计在化学中的应用,15,8-4 正交设计,在多因素试验设计中,已被广泛使用的正交设计法(orthogonal design),是一种既能减少试验次数,又能获得可靠结果的多因素的优选方法。正交设计是利用一套规格化的表格来安排试验。这种表就叫正交表(orthogonal layout)。正交的含义是指两列向量的数量积等于零,它有着搭配均衡的特性。在正交表中,任意两列的搭配都是均衡的。,2023/5/11,数理统计在化学中的应用,16,正交表的列数(最多能安排的因素个数,包括交互作用、误差等),正交表的行数(需要做的试验次数),各因素的水平数(各因素的水平数相等),正交表的代号,正交表的记号及含义,正交表是一种特别的表格,是正交设计的基本工具。,2023/5/11,数理统计在化学中的应用,17,正交表的特点,正交表中任意一列中,不同的数字出现的次数相等;在试验安排中,所挑选出来的水平组合是均匀分布的(每个因素的各水平出现的次数相同)均衡分散性正交表中任意两列,把同行的两个数字看成有序数对时,所有可能的数对出现的次数相同。任意两因素的各种水平的搭配在所选试验中出现的次数相等整齐可比性,2023/5/11,数理统计在化学中的应用,18,L4(23),2023/5/11,数理统计在化学中的应用,19,L8(27),2023/5/11,数理统计在化学中的应用,20,L9(34),2023/5/11,数理统计在化学中的应用,21,为什么正交试验法能大大减小试验工作量呢?三因素三水平如要做全面试验共需做27次,而正交试验只要做9次就可以了呢?,2023/5/11,数理统计在化学中的应用,22,图中9次试验点在整个试验空间中分布均衡,而且因素变化很有规律性,这样就使得各因素之间的比较和试验结果的统计处理变得十分简便。正交试验法实际上是一种在多维空间中寻优的试验法,其办法就是让试验点分布均衡,通过比较实验结果而最终找出最优试验点的范围。,2023/5/11,数理统计在化学中的应用,23,一 无交互作用的三因素三水平问题的正交设计,例8-8在原子光谱分析中,研究激发电流,电极形状与电极间距对测定某样品中微量铁的灵敏度的影响。每个因素各取3个水平,激发电流为3,5,8安培,电极形状为平头,凹月面及细腰状平头,间距为2,3,4毫米。试用正交设计来安排试验。,2023/5/11,数理统计在化学中的应用,24,根据正交试验的结果,经直观分析,就可以找出最佳试验条件,还可以用方差分析来检验试验因素的显著性。如进行直观分析,可在平均值指标中直接选择较好的指标,也可用作图来加以分析,只要将平均值T/3值(在试验水平数相同时,也可直接用T值)分别对A、B、C作图,即可找出最佳试验条件来。从表中T值可知,A3B3C3为最佳,也就是8安培,细腰状电极,4毫米间距为最好。但如考虑到II类电极比III类电极更容易加工,因此也可选择A3B2C3。,2023/5/11,数理统计在化学中的应用,25,二 有交互作用的四因素二水平问题的正交设计,对于有交互影响的因素,在用正交表试验时,还必须要知道,如AB或AC这些交互因素应放在表中的第几列。此时可以根据专门的交互作用表来进行安排。例如L8(27)就附有二列间交互作用表,,2023/5/11,数理统计在化学中的应用,26,表示位于第二、第四列的两因素的交互作用要放于第六列。,注意:主效应因素不放交互列。如A、B因素已放第1、2列,则C 因素就不放第3列。,2023/5/11,数理统计在化学中的应用,27,例8-9,研究一新的光度分析体系,试验的因素有操作方法(搅拌,不搅拌),温度(T),反应时间(min)以及显色剂浓度(%)等条件的影响,试验的水平如下:,本实验需考虑温度与显色时间,温度与硫酸浓度之间之间的交互影响,2023/5/11,数理统计在化学中的应用,28,根据试验的结果,由极差值可知:显色剂浓度,温度与显色时间的交互作用是最主要的其次是温度再次显色时间和操作方法温度和显色剂浓度的交互影响最小,可不必考虑,2023/5/11,数理统计在化学中的应用,29,(1)显色剂浓度和显色时间没有交互作用,只和温度涉及交互作用,但是交互作用很小,因此,选择显色剂浓度可以选择平均吸光度高的水平,也就是显色剂浓度为2%。(2)搅拌与其他因素没有交互作用,选择不搅拌(3)显色温度和显色时间有交互作用,那就要画出相应的图表:,2023/5/11,数理统计在化学中的应用,30,最佳条件:,显色剂浓度:2%显色温度:50 oC显色时间:2小时操作方法:不搅拌,2023/5/11,数理统计在化学中的应用,31,$8.5 均匀试验设计,正交设计是利用正交表的均衡分散性和整齐可比性,以较少的实验次数获得基本上能反映全面情况的试验结果的一种优化试验设计方法为了保证整齐可比和搭配均衡的特点,简化数据处理,实验点应在试验范围内充分地均衡分散,因此试验点不能过少当欲考察的因素较多,特别是因素水平数较多时,需要的试验次数仍然很多,例如要考察9个水平试验,用正交表安排试验,至少要进行92次试验,2023/5/11,数理统计在化学中的应用,32,为此,寻找一种适用于多因素、多水平而试验次数更少的试验设计方法是有意义的,我国数学家方开泰和王元等利用数论方法构造了均匀试验设计(uniform design)表如果不考察试验数据的整齐可比性,而让试验点在试验范围内充分地均衡分散,则可以从全面试验中挑选比正交试验设计更少的实验点作为代表进行试验,这种着眼于实验点充分地均衡分散的试验方法,称为均匀试验设计方法,2023/5/11,数理统计在化学中的应用,33,2023/5/11,数理统计在化学中的应用,34,2008年度国家科学技术奖励大会日前在北京举行,香港浸会大学荣休教授方开泰和中国科学院数学与系统科学研究院王元院士合作研究逾30年的“均匀试验设计的理论、方法及其应用”,获颁国家自然科学奖二等奖。,2023/5/11,数理统计在化学中的应用,35,均匀设计最先运用在军事工业上(我国导弹设计),后来在石油、化工、生物以及科学计算等高新产业上也获得成功应用。著名汽车品牌福特汽车在开发6汽缸汽车引擎时,便应用了均匀设计,其后该理论更成为福特汽车计算机仿真实验的常规方法。东北制药总厂为了使数理统计方法在工业参数优化中发挥更多的作用,成立了优化技术应用研究室,将各种实用的数学方法在计算机上实现,供科研和生产应用。为此研制出“均匀设计与统计调优软件包”,用这一技术完成十几项科研和生产课题,创百万元以上的经济效益。1993年“均匀设计与统计调优技术应用”通过国家医药管理局的技术鉴定,1994年列入全国医药行业“八五”科技推广项目。,2023/5/11,数理统计在化学中的应用,36,2023/5/11,数理统计在化学中的应用,37,和正交试验设计需要正交表一样,均匀试验设计也需要用规格化的表格来安排实验,这种表格称均匀设计表,简称U表(uniform)。通常只列出试验次数为奇数的表,对于偶数次数试验可以用试验次数多一次的奇数表划去最后一行来安排,2023/5/11,数理统计在化学中的应用,38,列数(最多能安排的因素个数,包括交互作用、误差等),行数(需要做的试验次数),各因素的水平数(各因素的水平数相等),均匀设计表的代号,均匀设计表的记号及含义,2023/5/11,数理统计在化学中的应用,39,均匀试验设计的突出优点是试验工作量很少,特别适用于水平数较多时的试验安排但它与正交表是不同的,不仅表中各列的地位不平等,而且各因素安排在表中的位置也是不能随便变换的,需根据试验中欲考察的实际因素数,依照附在每一张均匀设计表后的使用表来确定因素所对应的列号例如用 U11(1110)安排 2因素11水平的试验,因素安排在第1列与第7列;5因素11水平试验则安排在第1,2,3,5,7列.,2023/5/11,数理统计在化学中的应用,40,均匀设计的特点,1)每个因素的每个水平做一次且仅做一次试验。2)任两个因素的试验点点在平面的格子点上,每行每列有且仅有一个试验点。性质1)和2)反映了试验安排的“均衡性”,即对各因素,每个因素的每个水平一视同仁。3)均匀设计表任两列组成的试验方案一般并不等价。均匀设计表的这一性质和正交表有很大的不同,因此,每个均匀设计表必须有一个附加的使用表。4)当因素的水平数增加时,试验数按水平数的增加量在增加。而正交设计当水平增加时,试验数按水平数的平方的比例在增加。由于这个特点,使均匀设计更便于使用。,2023/5/11,数理统计在化学中的应用,41,试验安排的特点使试验数据失去了整齐可比性,数据一般应采用回归分析法进行分析由于实验次数较少,试验精度较差,为了提高其精度,可采用试验次数较多的均匀设计表来重新安排因素各水平的试验,2023/5/11,数理统计在化学中的应用,42,均匀设计表的构造,如均匀表U7(76),第1次(表中第2行)6个因素分别以1,2,3,4,5和6的水平进行组合试验;下一次试验各因素水平分别在前一次水平基础上加1,2,3,4,5和6,并以7进制进位取余数(当余数为0时,水平号取7)例如在表中第3列的7次试验的水平号分别为 3,33=6,63=92(取余数),23=5,53=8 1,13=4和43=7,即为3,6,2,5,1,4和7。同理可构造出其他均匀表的因素水平安排,2023/5/11,数理统计在化学中的应用,43,2023/5/11,数理统计在化学中的应用,44,例8-10:阿魏酸的制备阿魏酸是某些药品的主要成分,为了在制备过程中能增加其产量。经过分析研究,挑选出因素和试验区域,为:原料配比:1.0-3.4吡啶总量:10-28反应时间:0.5-3.5确定了每个因素相应的水平数为7。,2023/5/11,数理统计在化学中的应用,45,表 1.,第1步:将试验因素的水平列成下表:,2023/5/11,数理统计在化学中的应用,46,例如:,表 1.2:,表 1.3:,46,2023/5/11,数理统计在化学中的应用,47,每个表还有一个使用表,将建议我们如何选择适当的列。其中偏差为均匀性的度量值,数值小的设计表示均匀性好。例如 U7(74)的使用表为:,表 1.1.4:,表1.1.2:,2023/5/11,数理统计在化学中的应用,48,第3步:应用选择的 UD-表,做出试验安排。,1.将 x1,x2和 x3放入列1,和3.,x1 x2 x3,2用x1的个水平替代第一列的1到 7.,1.01.41.82.22.63.03.4,3.对第二列,第三列做同样的替代.,13 1.519 3.025 1.010 2.516 0.522 2.028 3.5,4.完成该设计对应的试验,得到个结果,将其放入最后一列.,表 1.1.5:,2023/5/11,数理统计在化学中的应用,49,第 4步:用回归模型匹配数据,首先,考虑线性回归模型:,y=0.33 0.366 0.294 0.476 0.209 0.451 0.482;x1=1.0 1.4 1.8 2.2 2.6 3.0 3.4;x2=13 19 25 10 16 22 28;x3=1.5 3.0 1.0 2.5 0.5 2.0 3.5;x0=ones(1,7);X=x0;x1;x2;x3;b,bint,r,rint,stats=regress(y,X),2023/5/11,数理统计在化学中的应用,50,b=0.2024 0.0372-0.0034 0.0769bint=-0.1137 0.5185-0.0863 0.1607-0.0199 0.0130-0.0114 0.1653r=0.0198-0.0538 0.0339 0.0339-0.0734 0.0590-0.0196,2023/5/11,数理统计在化学中的应用,51,rint=-0.1732 0.2129-0.1935 0.0859-0.1067 0.1746-0.1067 0.1746-0.0816-0.0652-0.1289 0.2469-0.1558 0.1166stats=0.7667 3.2869 0.1773,2023/5/11,数理统计在化学中的应用,52,rcoplot(r,rint)作残差分析图(如残差置信区间不包含中心线,则可视为异常点),2023/5/11,数理统计在化学中的应用,53,第5步:优化-寻找最佳的因素水平组合,表1.1.5的设计是73=343个全面试验的部分实施,其中最好的试验点是值为Y=48.2%的#7。它不一定是全局最好的。如果想找到满足下式的x1*和 x3*:,这里求取max的区域为:,2023/5/11,数理统计在化学中的应用,54,b=0.0623 0.2511-0.0600 0.0235bint=-0.0489 0.1736 0.1264 0.3758-0.0938-0.0262 0.0082 0.0388stats=0.9777 43.8786 0.0056,2023/5/11,数理统计在化学中的应用,55,可以看到,结果分析与正交设计有所不同,一般应采用多元线性回归分析法指标最佳试验点所对应的试验条件,即使不是全面试验中最好的条件,往往也是接近于全面试验中最佳条件的试验条件由于均匀试验中试验点在整个试验区域内分布均匀,因此采用多元线性回归对实验数据进行解析以确定最佳实验条件是可行的,2023/5/11,数理统计在化学中的应用,56,例8-11 石墨炉原子吸收分析钯,试验因素:灰化温度、灰化时间、原子化温度,原子化时间,2023/5/11,数理统计在化学中的应用,57,2023/5/11,数理统计在化学中的应用,58,后退法选变量,首先采用全部变量可在Excel中完成设Y=a0+a1x1+a2x2+a3x3+a4x4+a5x12+a6x22+a7x3 2+a8x4 2,2023/5/11,数理统计在化学中的应用,59,第二步:去掉t最小的变量,2023/5/11,数理统计在化学中的应用,60,Y=0.3836034914+0.000010005x1-0.0033240463x2-0.0003529434x3+0.0142100156x4-0.0000000358x12+0.0000403424x22+0.0000000985x32-0.0010763079x42,2023/5/11,数理统计在化学中的应用,61,去掉x1,2023/5/11,数理统计在化学中的应用,62,进一步去掉x3,x42,2023/5/11,数理统计在化学中的应用,63,进一步去掉x4,2023/5/11,数理统计在化学中的应用,64,Y=-0.05345-3.04510-3 x2-3.13810-8 x12+3.53010-5 x22+3.41910-8 x3 2,2023/5/11,数理统计在化学中的应用,65,最优试验条件,将计算得的b阵代入可算得最优条件为TC=139.6、tc=41.2s、Ta=1791.3,ta=6.6 s由于该条件并不在设计表内,应再安排试验得出其指标,判断其是否最优。,2023/5/11,数理统计在化学中的应用,66,例8-12.均匀设计法在全光亮镀镍研究中的应用,1.均匀设计表的选取本实验的目的是提高镀层光亮性。经初步研究,取其固定组成为硫酸镍25g/L,次磷酸钠25g/L,醋酸钠25g/L。考察因素为稳定剂,主光亮剂,辅助光亮剂,润湿剂4个因素,每个因素取值范围为t个水平(t 为实验次数),4个因素的一次项及二次项各有4项,4项因素间的两两交互作用设有6项,共14项,实验数不能小于14,本实验选用U17(178)表。,2023/5/11,数理统计在化学中的应用,67,均匀表U17(178),2023/5/11,数理统计在化学中的应用,68,U17(178)表的使用表,本实验为4因素,这4个因素安排在均匀表的1,5,7,8列,去掉U17(178)的最后一行,将实验方案及结果见下表。,2023/5/11,数理统计在化学中的应用,69,2023/5/11,数理统计在化学中的应用,70,2.指标的选择和优化,指标是回归方程中的响应函数,在本实验中即是镀件质量。根据我们对镀件的要求,定义一个综合指标z,z的分值由外观评分R,沉积速度评分V,耐腐蚀性评分Q乘以不同的权重构成,z=0.5R+0.2V+0.3Q。R,V,Q的分值分别为0100。,2023/5/11,数理统计在化学中的应用,71,3.实验方法,试样为10cm5cm0.2cm的低碳钢板,在8890 的恒温水浴槽内施镀,镀液pH值控制在4.5-5.0。镀前处理按常规进行,按均匀设计表中确定的组成分别配成16种化学镀液,挂镀法施镀1h,清洗,晾干,对试样进行外观的评定。沉积速度测定:沉积速度,样片增加的重量/样片的面积(g/cm2)耐腐蚀性测定:10硫酸浸泡24h,根据失重及腐蚀后外观评分,2023/5/11,数理统计在化学中的应用,72,4.结果处理及分析,实验结果用计算机处理,主要运用软件为SPSS和Matlab。4.1建立数学模型及筛选变量考虑到可能有的数学关系,将各因素的一次项,二次项,两因子间的交互作用项均作为考察对象,回归方程模型为:R=b0+bixi+bijxixj+biixi2(i=1,2,3,4;ij)b为各项系数。将给因素的值及综合指标输入计算机,用自后淘汰变量法(backward selection)进行回归分析和变量筛选,sigF0.10的变量被淘汰,最后得到指标与相关组成的回归方程。,2023/5/11,数理统计在化学中的应用,73,Z=86.726+6.555d4.554p21.384c20.0164123.177pc0.1932p0.1209c0.3779dc为主光亮剂;d为辅助光亮剂;为润湿剂;p为稳定剂。,4.2对回归方程的优化处理用求条件极值的强约束优化法对回归方程进行优化,用Matlab语言编程,用BFGS拟牛顿(Quasi-Newton)算法及最小二乘法寻优,本实验找到的最优解为:主光亮剂C3.7mg/L,辅助光亮剂HD1.1ml/g,稳定剂0.2mg/L,润湿剂19.7mg/L,乳酸6mol/L。,2023/5/11,数理统计在化学中的应用,74,8-6单纯形试验法(simplex),单纯形优化法最初由Erns引入化学研究,它是一种按黑箱方式工作的试验设计方法。正交设计试验是通过在多维空间中均衡地布置试验点,并比较它们的优劣来寻优单纯形试验法是基于在多维空间中的几何图形的变换来寻找试验点,并逐一比较试验结果后逐步搜索寻优的。,2023/5/11,数理统计在化学中的应用,75,这里所说的图形是指的在n维空间中,具有n+1个顶点的图形,例如,两维空间使用三角形,三维空间使用有四个顶点的多面体。这些图形的顶点即是试验所安排的试验点,通过比较各试验点的结果并丢弃最差点而代之以新点,从而再构成新的单纯形,这样就可逐步逼近最优试验点。,2023/5/11,数理统计在化学中的应用,76,1、两因素试验,两因素试验(n=2),可以看成是在两维空间中进行的,即在平面上寻优的过程。假定试验从初始点X0开始,在平面中X0的坐标为(a1,a2),例如a1可以是pH值,a2可以是试剂的浓度值。从X0开始,如果构造一个正三角形,另两个顶点为X1和X2,则它们可以分别取如下值:X1(a1+p,a2+q),X2(a1+q,a2+p)。,2023/5/11,数理统计在化学中的应用,77,对每一个因素,应选择一个步长,也即该因素对于起始水平变化的幅度。在图形中,步长即是两点间的距离。如果各因素的步长都是相同的数值a,那么试验的初始单纯形就是以X0为顶点,各棱长均为a的正规单纯形,(亦即正三角形或正多面体),各点的p值,q值,可根据公式来计算。,2023/5/11,数理统计在化学中的应用,78,2023/5/11,数理统计在化学中的应用,79,这样,当n=2时,初始单纯形的三个试验点也就确定了,它们是X0(a1,a2),X1(a1+0.966a,a2+0.259a),X2(a1+0.259a,a2+0.966a),若初始水平为pH=7.0,百分浓度=2.0,步长均为0.5,则三个试验点即是,2023/5/11,数理统计在化学中的应用,80,在确定了初始单纯形的试验点后,即可根据这些试验点的因素水平做试验,得到n+1个目标(试验结果)值,再根据它们的优劣,舍去最差的点,按照单纯形试验法,逐一算出新的试验点,这样最终就达到了优化的目标。,2023/5/11,数理统计在化学中的应用,81,2、多因素试验点的安排对于n个因素来说,各个试验点的安排可以用一个矩阵来表示。如初始试验点为X0(a1,a2an),那么其余各点可以安排见表。,2023/5/11,数理统计在化学中的应用,82,多因素实验点的安排,2023/5/11,数理统计在化学中的应用,83,3、单纯形移动的计算规则,在基本单纯形法中,步长是不作改变的,称之为正规单纯形,因此在试验中最优点附近的收敛速度就显得不快,而且收敛精度也较差。在此基础上,又出现了改良形的单纯形法,即增加了步长可变的寻优步骤,使得寻优的收敛速度和精度都得到了改善。改良单纯形将不再是正规单纯形。改良单纯形法的基本计算方法和试验推移的规则如下:,2023/5/11,数理统计在化学中的应用,84,(1)试验者先根据化学知识和经验选取初始试验点X0和步长a,并计算出其余各试验点的试验水平,构成初始单纯形。(2)比较各试验点的指标值(亦可是函数值),确定最坏点(例如为X0)。,2023/5/11,数理统计在化学中的应用,85,(3)求重心X(e):去掉最坏点X(b),计算出其余各点的重心X(e),计算公式为,(4)求出反射点X(r):计算公式为 X(r)=X(e)+(X(e)-X(b),式中 通常取1,称延伸系数。,2023/5/11,数理统计在化学中的应用,86,(5)进一步试验的结果可以有三种情况:延伸:如实验结果f(X(r)f(X(g)f(X(t),则X(r)是当前最佳点,则在这方向上继续延伸至X(k),计算公式为 X(k)=X(e)+(X(r)X(e),相当于第(5)步的反射时候延伸系数取比1大的数,如=2,2023/5/11,数理统计在化学中的应用,87,这样就又形成新单纯形,X(g)X(t)X(k),再继续寻优。这时X(t)是最差点,所以继续的反射是先求X(g)和X(k)的重心,再做X(t)的反射点。,2023/5/11,数理统计在化学中的应用,88,改变方向:如试验结果是f(X(g)f(X(r)f(X(t),则X(r)为次佳点,则弃去f(X(t),改变试验方向,计算X(g)和X(r)的重心和X(t)的放射点,组成新单纯形,继续调优。收缩:如实验结果是f(X(g)f(X(t)f(X(r),则应舍去X(r),进行收缩。收缩又分两种情况:,2023/5/11,数理统计在化学中的应用,89,正收缩,(A)如果f(X(r)f(X(b),则可正收缩,如图。收缩点X(r)=X(e)+(X(e)-X(b),称为收缩系数,小于1,如可取=1/2。,2023/5/11,数理统计在化学中的应用,90,内收缩,(B)如果f(x(r)f(x(b),则需进行内收缩,如图此时收缩点 X(r)=X(e)(X(e)X(b),仍取1/2。,2023/5/11,数理统计在化学中的应用,91,压缩,(6)如收缩失败,则需压缩,即缩小单纯形。如可压缩至一半,其如图。压缩后的X(t)=(X(g)X(t)/2+X(t),X(b)=(X(g))X(b)/2+X(b)。,2023/5/11,数理统计在化学中的应用,92,改进的反射,(7)收缩之后,则做次差点(X(t)的反射:,2023/5/11,数理统计在化学中的应用,93,8)单纯形调优的结束,可用f(X(g):当前最优点的试验值f(X(b):当前最差点的试验值:为预先给定的允许误差对于多因素的调优,通常可根据单纯形法的算法流程用计算机来进行处理。,2023/5/11,数理统计在化学中的应用,94,加权形心法,基本单纯形和改进单纯形都是采用去掉点的反射方向为新试验点的搜索方向,这就意味着,去掉点的反射方向作为近似的优化方向,就是梯度变化最大的方向实际上,这个方向是一个近似的梯度最大方向,这样的搜索结果可能导致搜索次数的增加和搜索结果精度的降低为了解决这个问题,提出了加权形心法,加权形心法利用加权形心代替单纯的反射形心,使新点的搜索方向更接近实际的最优方向,2023/5/11,数理统计在化学中的应用,95,因素1,因素2,Worst,Best,C,O,E,E,O,形心点O和加权形心点O,2023/5/11,数理统计在化学中的应用,96,如图,使W、B、C三个顶点组成的一个二因素的优化过程的一个单纯形,并知W点的响应最坏,B的响应最好。如果搜索优化过程中函数不出现异常,那么搜索最优点的方向明显应当更靠近WB的方向,而不是靠近WC的方向。因此可以通过加权的办法来使搜索的方向由原来的WE(反射方向)变为WE方向(加权方向),此时用加权形心点O代替反射形心点O,2023/5/11,数理统计在化学中的应用,97,2023/5/11,数理统计在化学中的应用,98,2023/5/11,数理统计在化学中的应用,99,例 long对应用蔷薇苯胺测定SO2的条件进行优化,用分光光度法进行吸光度测定,以甲醛和盐酸二因素单纯形法调优,试验调优采用作图法,见图。图中数值为吸光度值,为试验次数。,2023/5/11,数理统计在化学中的应用,100,2023/5/11,数理统计在化学中的应用,101,2023/5/11,数理统计在化学中的应用,102,平均水平的单纯形法寻优,2023/5/11,数理统计在化学中的应用,103,例示波极谱法测定痕量Cu,Pb,Cd,用单纯形试验法选择支持电解质的试剂盐酸、盐酸羟胺、氯化钠的配比,以体积相同,重量百分比浓度不同的水平作试验,所取的试验水平列在下表,2023/5/11,数理统计在化学中的应用,104,2023/5/11,数理统计在化学中的应用,105,可见,起始单纯形的顶点很容易确定,不需计算。从表中可知,P0应舍弃,舍弃后的重心计算如下:,2023/5/11,数理统计在化学中的应用,106,反射点计算如下:P A=2 Pe P0=21.80.5=3.1(=1)P B=21.10.2=2.0 P C=21.51.0=2.0于是求得P4(3.1,2.0,2.0),此时P1 P2 P3 P4形成新单纯形,试验得P4的响应值,即可进行比较,再丢掉最坏点,就可实现单纯形连续推移,直到找到最佳点为止。,2023/5/11,数理统计在化学中的应用,107,怎么来分析各因素影响的大小呢,可以根据以下表来计算各因素的效应。,2023/5/11,数理统计在化学中的应用,108,由此可得 1A=11 2A+0.8B=15 1A+1.8B+1.5C=9 解得 A=11 B=-8.75 C=9.16因此,可知主要因素为A、C,而B为次要因素。,2023/5/11,数理统计在化学中的应用,109,例 用原子吸收法测定微量铬,由于气体燃助比,燃烧器高度和灯电流吸收值有明显的交互影响,因此用单纯形试验法对测定的条件进行优选。各因素试 验的范围,步长和水平值如下表:,2023/5/11,数理统计在化学中的应用,110,2023/5/11,数理统计在化学中的应用,111,解:采用平均水平法对火焰原子吸收测定铬的最佳条件单纯形调优过程及调优的部分结果见下表:,2023/5/11,数理统计在化学中的应用,112,2023/5/11,数理统计在化学中的应用,113,2023/5/11,数理统计在化学中的应用,114,8-7 最优化方法简介,一.单目标优化和多目标优化在试验设计中,有时用来衡量试验效果的目标只有一个,寻求这一目标最优值的试验设计就称为单目标优化。有时需要同时用几个目标来衡量试验效果,如在分析方法研究中,常常要同时用灵敏度、选择性、准确度作为目标,去寻求获得高灵敏度、高选择性、高准确度的实验条件,这就是多目标优化。,2023/5/11,数理统计在化学中的应用,115,二.同时试验与序贯试验,在试验设计中,根据试验方案和计划的安排不同,可分为同时试验法和序贯试验法两种方法。所谓同时试验法,就是对与目标有关的因素及因素水平进行预先的规划,根据规划的方案同时对各因素及因素水平进行试验,然后对试验得到的结果进行分析比较,找出最佳条件。如正交试验法就是一种同时试验的方法。所谓序贯试验法,则是先进行一次或少数几次试验,分析这少数几次试验的结果,根据这些结果的优劣,作出下一次试验的计划,这样逐步试验以寻得最优的实验条件。单纯形试验优化法就是典型的序贯试验。,2023/5/11,数理统计在化学中的应用,116,三、试验最优化和解析最优化,在多因素试验设计中,当各因素之间的函数关系为已知时,寻求目标y的最优值的试验设计和优化,可以用数学上求函数极值的方法得到,这就是解析最优化方法。在绝大多数的化学试验设计中,y与各因素xi之间的关系并没有解析表达式,在这种情况下,则要通过大量的实验得到目标y与因素之间关系的信息,以获得最佳的实验条件。,2023/5/11,数理统计在化学中的应用,117,这时可采用两种办法。一种是首先做一系列的试验,得到一系列不同因素水平下的目标y的观测值,然后用某一函数关系式来拟合这些数据,在得到目标y与各因素之间的函数关系的经验式后,再用解析的方法求得最优解,并用实验加以验证。另一种办法并不去寻求目标与因素之间的数学关系式,而仅通过一系列设计的试验,寻求使目标y取得最优值时的各因素的水平,这就是纯粹用实验方法的试验最优化的工作方式。,2023/5/11,数理统计在化学中的应用,118,总之,试验设计的目的是用尽可能少的试验次数取得关于目标与因素之间关系的尽可能多的信息。这就要求最有效地选择各个实验因素的水平,通过试验得到目标的观测值,并对试验数据进行分析,从而得到目标有最优值的实验条件。,2023/5/11,数理统计在化学中的应用,119,四.试验最优化方法,单因素试验1)0.618法菲波那奇数列1 1 2 3 5 Lim(Fn/Fn+1)=(5-1)/2=0.618世界上公认的人体比的标准值古希腊建筑(巴特农神殿)、雕塑(维纳斯)、绘画等都遵循之,2023/5/11,数理统计在化学中的应用,120,人体中指尖至脚与头至中指尖的比例基本符合1:1.618。五十年代北京工业设计院,为编写设计资料集曾对我国成年人体形进行了广泛调查,结果发现肩宽和臀宽的平均数为362mm,肩峰至臀底的高度为586mm,躯干的宽与高之比为1:1.618。世界各地种族的身高差别较大,但这一比例相差却很小。出现该比例的地方非常之多,例如人最舒适的温度就是一例。,2023/5/11,数理统计在化学中的应用,121,如某一区间为单峰函数,先取其0.618,再取其0.618的对称点,试验后弃差点,则下一步试验的寻优点为“加两头减中间”。,2023/5/11,数理统计在化学中的应用,122,2)抛物线法设 x1,x3,x3的试验结果y1,y2,y3,过三点可作抛物线:,2023/5/11,数理统计在化学中的应用,123,用Y近似目标函数f(x),求Y的最大值点:即下一试验点,并与相近的两个点构成新的抛物线。若新点与旧点相同,可取中间点或附近点安排试验。,202