《实验设计与数据处理第一部分.ppt》由会员分享,可在线阅读,更多相关《实验设计与数据处理第一部分.ppt(77页珍藏版)》请在三一办公上搜索。
1、实验设计与数据处理,2009.02,主讲:赵爽,课程性质实验设计和数据处理是一项通用技术,是当代科技和工程技术人员必须掌握的技术方法。课程任务使学生了解实验设计和数据处理的基本知识和基本概念,初步掌握常用的实验设计方法,初步掌握几种实验数据的分析方法,为毕业设计阶段结合实际研究内容进行化学实验设计和数据分析打下基础。,第一章 实验设计简介,1.1 实验设计的概念与意义 实验设计是以概率论与数理统计为理论基础,经济地、科学地制定实验方案以便对实验数据进行有效的统计分析的数学理论和方法。,设计一个好的实验方案,概率论与数理统计知识,广博的专业技术知识,丰富的实际经验,例 某农场想移植外地的优良品种
2、,选了A,B,C三种品种进行试验,看哪一种品种在本地更适合一些。,表 1.1 人造再生木材实验因素水平表,水平,因素,先固定B和C为B1、C1,变化A,例 某厂想用高压聚乙烯与木屑化合物加温加压试制“人造再生木材”,实验结果A3最好,然后固定A为A3、C为C1,变化B,实验结果B2最好,然后固定A为A3、B为B2,变化C,实验结果A2最好,于是下结论说A3B2C2最好。,简单对比法,简单对比法的优缺点:,优点:实验次数少缺点:(1)试验点不具代表性。考察的因素水平仅局限于局部区域,不能全面地反映因素的全面情况。(2)无法分清因素的主次。(3)如果不进行重复试验,实验误差就估计不出来,因此无法确
3、定最佳分析条件的精度。(4)无法利用数理统计方法对实验结果进行分析,提出展望好条件。,另一种方法叫全面实验法,就是把三个因素的所有水平都一一搭配起来,从而找出最好的实验条件。A1B1C1 A2B1C1 A3B1C1 A1B1C2 A2B1C2 A3B1C2 A1B1C3 A2B1C3 A3B1C3 A1B2C1 A2B2C1 A3B2C1 A1B2C2 A2B2C2 A3B2C2 A1B2C3 A2B2C3 A3B2C3 A1B3C1 A2B3C1 A3B3C1 A1B3C2 A2B3C2 A3B3C2 A1B3C3 A2B3C3 A3B3C3 共有3=27次实验。如图所示,立方体包含了27个
4、节点,分别表示27次试验。,全面实验法的优缺点:,优点:对各因素与实验指标之间的关系剖析得比较清楚缺点:(1)实验次数太多,费时、费事,当因素水平比较多时,实验无法完成。(2)不做重复实验无法估计误差。(3)无法区分因素的主次。例如选六个因素,每个因素选五个水平时,全面实验的数目是56 15625次。,实验设计可以帮助我们有效地解决如下问题:科学地、合理地安排实验,可以减少实验次数,缩短实验周期,节约人力、物力,提高经济效益,尤其当因素水平较多时,效果更为显著。通过对实验的设计和结果分析能使我们在众多的因素中分析主次,找出影响指标的主要因素。通过实验设计可以分析因素之间交互作用影响的大小。通过
5、方差分析,可以分析出实验误差影响的大小,提高实验的精度。通过实验设计能尽快地找出较优的设计参数或生产工艺条件,并通过对实验结果的分析、比较,找出达到最优化方案进一步实验的方向。能对最优方案的指标值进行预测。,1.2 实验设计的发展概况20世纪二三十年代,由于农业实验的需要,英国统计学家费歇耳(R.A.Fisher)在实验设计和统计分析方面做出了一系列先驱工作,从此开创了一门新的应用技术学科。20世纪三四十年代,英国、美国、苏联等国将实验设计法逐步推广到工业生产领域中。第二次世界大战期间,英美等国在国防工业实验中采用实验设计法取得显著效果。战后,日本把实验设计作为管理技术之一。20世纪五十年代,
6、田口玄一博士创造了用正交表安排分析实验的正交实验设计法,在方法解说方面深入浅出为实验设计的更广泛使用作出了巨大的贡献。,我国实验设计法的发展我国从20世纪50年代后期,在著名统计学家许宝禄教授引导下,数学工作者才深入实验设计这个领域。20世纪60年代末,我国研究人员编制了一套较为适用的正交表,创立了简单易懂的正交实验方法。自20世纪70年代以来,国内在研究和推广正交实验设计方面有了很大的进展,成果日渐增多,已经取得了至少上万项的好成果。为解决导弹弹道系统的指挥仪设计问题,1978年中科院王元院士和方开泰研究员提出了均匀设计,得到国际统计界的极大关注。,1.3 实验设计的常用术语实验指标:实验需
7、要考察的效果称为实验指标;可以直接用数量表示的叫定量指标;不能用数量表示的叫定性指标。实验设计时,应尽量使定性指标定量化。如按评定结果打分或者评出等级,以便用数量表示。因素:对实验指标有影响的参数称为因素,因素一般用大写英文字母来表示。水平:因素所处的不同状态称为因素的水平。水平通常用1,2,3表示。,安排任何一项实验,明确实验的目的是什么?用什么指标来衡量考核实验的结果?对实验指标可能有影响的因素是什么?为了搞清楚影响的因素,应当把因素选择在哪些水平上?,第二章 正交实验设计,正交实验设计兼顾全面实验法和简单对比法的优点,是利用正交表来合理安排和分析众多因素的实验方法。它可以用较少的实验次数
8、获得较优的结果。事实上,正交最优化方法的优点不仅表现在实验的设计上,更表现在对实验结果的处理上。正交实验设计是科研和生产中应用最多的实验研究方法之一,尤其用于生产改造、最优配方及最优工艺过程的研究。由于它方便、简洁而得到研究人员的认可。,2.1 概述 2.1.1 正交表,正交表是正交实验设计的基本工具,它是根据均衡分散的思想,运用组合数学理论在拉丁方和正交拉丁方的基础上构造的一种表格。它的形式和广泛的应用是与日本统计学家田口玄一的工作分不开的。,Ln(tq),正交表代号,正交表横行数代表实验次数,正交表列数因素数,因素的水平数代表表中数码数,2.1.2 正交表的特点,L9(34),正交性 正交
9、表中任意两列横向各数码搭配所出现的次数相同,这可保证实验的典型性。均衡性 任一列中不同水平个数相同,即任一列中每个数码出现的机会是均等的。独立性 没有完全重复的实验。任何两个实验间都有两个以上因素具有不同水平。,L8(27),列号,实验号,2.1.3 正交表的优点,(1)实验点代表性强,实验次数少。(2)不需做重复实验,就可以估计实验误差。(3)可以分清因素的主次。(4)可以使用数理统计的方法处理实验结果,提出展望好条件。,2.1.4 正交表的分类,规则表-各个因素具有相同的水平数。如L8(27),L9(34)不规则表(混合水平表)-每个因素的水平数不再严格相等,有的因素水平数多,而有的因素水
10、平数少。,L8(424),行号,列号,2.2 正交实验设计的基本方法,例“人造再生木材”提高抗弯强度实验。,1,2,明确实验目的,确定实验指标,实验目的:提高“人造再生木材”的抗弯强度。实验指标:再生木材的抗弯强调y为指标,且y越高越好。,制订因素水平表-根据以往经验和资料分析制订,水平,因素,3,选用合适正交表,首先根据因素的水平数,来确定选用几水平的正交表。然后再根据因素的个数来决定选择多大的表。,L9(34),4,设计实验方案,实验号,因素,“因素顺序上列,水平对号入座”,5,进行实验,并记录结果,因素,实验号,6,实验结果的计算与分析,通过对实验结果的计算、分析,可解决以下几个问题:分
11、清各因素对指标影响的主次顺序。找出最优化的方案。分析因素与指标的关系,找出指标随因素变化的规律和趋势,用于指出进一步的实验方案。,正交实验的数据处理方法有两种,及直观法(极差法)和方差法(统计分析法)。,6,进行分析 计算极差,I=因素所在的列中数码“1”所对应的指标值之和,II=因素所在的列中数码“2”所对应的指标值之和,III=因素所在的列中数码“3”所对应的指标值之和。全部实验数据的总和记为T。同一因素的I,II,III之和等于T。每个因素的极差R该因素的I,II,III中最大的与最小的之差。确定主次因素顺序:,极差R的大小反映了相应因素作用的大小。,R越大,说明该因素的水平变化对实验结
12、果指标影响越大,因而这个因素对实验指标就越重要。,主,次,A B C,选取较优方案:如果要求指标越大越好,则要取I,II,III中最大者所对应的水平;如果要求指标越小越好,则要取I,II,III中最小者所对应的水平。本例中,因素A中最优水平为水平1;因素B中最优水平为水平1;因素C中最优水平为水平2;最优水平组合为A1B1C2,6,进行分析,在选取最优方案时,还应考虑到因素的主次。对于主要因素,一定要按有利于指标的要求来选取该因素的水平。对于次要因素,可以选取有利于指标要求的水平,也可以按照优质、高产、低耗和便于操作等原则来选取水平。,6,进行分析,画趋势图:,有助于发现正交表中未列入而可能更
13、优的水平值,为下一轮正交实验确定水平值提供依据。,验证实验:验证实验的目的,在于考察较优方案的再现性。将已做过的实验中最好条件与计算分析得到的最优条件同时验证,以确定其中的优劣。在验证的基础上还可安排第二批、第三批实验(可根据趋势图安排)。,6,进行分析,正交试验设计中,因素可以定量的,也可以使定性的。而定量因素各水平间的距离可以相等也可以不等。,直接分析与计算分析的关系,对于大多数项目,计算分析的好条件不再已做过的实验中,将会得到超出直接分析的好条件。但有时会出现计算分析得出最优条件的效果不如直接分析好条件的效果。其原因:(1)可能是实验误差过大。(2)可能是另有影响因素没有考虑进去。(3)
14、可能是因素的水平选择不当。,正交实验设计的优点:,(1)实验点均衡分散,(2)实验数据整齐可比,方案均衡地分散在一切水平搭配的组合之中。,如对因素的各水平来说,因素、的三个水平都各出现了一次。即,当对表内某因素的同一水平所导致的实验结果之和进行比较时,其他条件是固定的。它是选取各因素最优水平的依据。,典型范例:2,4二硝基苯肼的工艺改革(1)试验目的:2,4二硝基苯肼是一种试剂产品。过去的工艺过程长,工作量大且产品经常不合格。北京化工厂改革了工艺,采用2,4二硝基氯化苯(以下简称氯化苯)与水合肼在乙醇作溶剂的条件下合成的新工艺。小的实验已初步成功,但收率只有45%,希望用正交实验法找出好的生产
15、条件,达到提高生产效率的目的。(2)实验指标:产率(%)与外观颜色。,(3)挑因素,选水平,制定因素水平表。,因素水平表,(4)设计实验方案,并实施方案。,(5)结果分析。,直接看,可靠又方便 算一算,重要又简单 可能好配合 A2B1C2D2E2F2,“直接看”和“算一算”的关系:如果生产上急需,通常应优先选择“算一算”的好条件。经过验证,如果效果真有所提高,就可将它交付生产上使用。(1)倘若验证后的效果比不上“直接看”的好条件,就说明该实验的现象比较复杂。(2)还有一种情况,实验时间较长,等不到验证实验的结果。对于这两种情况,生产上可先用“直接看”的好条件,也可结合具体情况做些修改;与此同时
16、,另行安排实验,寻找更好的条件。,(6)第二批撒小网。,在第一批实验的基础上,为弄清产生不同颜色的原因及进一步提高产率,决定再撒个小网。做第二批正交试验。,因素水平表,(7)利用正交表确定实验方案,(8)实验结果的分析,“直接看”:颜色加料速度是影响颜色的重要因素。2#实验产率最高,颜色合格。“算一算”的好条件与“直接看”的好条件一致。,正交实验设计不是一次简单利用正交表就可以顺利取得成功的,而应多次反复利用才能取得较佳的效果。,2.3 考虑交互作用的正交实验设计,交互作用有些因素间各水平的联合搭配对指标也产生影响,我们称这种联合作用为交互作用。,例:考虑氮肥(N)和磷肥(P)对豆类增产的效果
17、,P,从表中可以看出,加4斤磷肥,亩产增加50斤;加6斤氮肥,亩产增加30斤;而同时加两种肥料,亩产增加160斤,而不等于分别增加的503080斤。这就是交互作用,记作NP 这里NP起加强作用,大小为:(560400)(430400)(450400)=80(斤),“两列间的交互作用列表”的使用(以L8(27)为例),行号,列号,表中的所有数字都是L8(27)的列号。若要查第1,2列的交互列,则从(1)横着向右看,从(2)竖着向上看,它们的交叉点是3,则第3列就是第1列与第2列的交互作用列。如果第1列排A因素,第2列排B因素,第3列则需要反映它们的交互作用AB,就不能在第3列安排C因素或者其它因
18、素,这称为不能混杂。,有交互作用的正交实验及结果分析,例 乙酰苯胺磺化反应实验,目的在于提高乙酰苯胺的收率。影响因素有反应温度(A),反应时间(B),硫酸浓度(C)和操作方法(D)等。,考虑反应温度与反应时间可能会有交互作用,另外,反应温度与硫酸浓度也可能会有交互作用,即考虑AB、AC。,正交表的选择和表头设计,本例可选用L8(27)安排实验。(1)先把因素A排在第1列,因素B排在第2列,查交互作用表知,第1列与第2列的交互作用(AB)在第3列。(2)因素C排在第4列,第1列、第4列的交互作用在第5列,即AC在第5列。(3)第2列、第4列的交互作用在第6列,所以第6列要空出来,若B、C间无交互
19、作用,第6列可作误差列。(4)D只能安排在第7列,根据经验,搅拌与其他实验条件间不存在交互作用。,实验设计与结果,按方案进行实验,结果分析,实验结果,从极差可以看出,因素和交互作用主次为:,ABC,A,BD,AC,主,次,最优水平的确定,有交互作用的实验,选取水平时要区分两类因素:(1)不涉及交互作用的因素或交互作用影响较小的因素,它们水平的选取和以前一样,选取合计指标值较好的所对应的水平。(2)有交互作用的因素,它们的水平的选取不能单独考虑,而要列出二元表,根据各种搭配情况,选取对指标影响较好的水平组合。,因此,C可取C2,同理D可取D2。即硫酸浓度选27,操作方式选不搅拌。,因素A,B交互
20、作用分析二元表,显然,7271.569.564.5,即四种组合中以A1B2最好,但A2B1差别不大,即50、2h和70、1h的产率非常接近。而从生产效率上看,70、1h比50、2h要好。于是可得较优的水平组合,即反温度70;反应时间1h;硫酸浓度27;操作方法不搅拌。两点启示:(1)在安排表头时,应使要考虑的交互作用和因素不致发生混杂;(2)对实验结果的数据进行计算后,在优选各个因素的水平时,有交互作用的因素,他们的水平不能单独考虑,必须用二元表进行综合考虑。,另外,三水平表中两列间的交互作用是另外两列。一般地,m水平的正交表,两列间的交互作用要占m-1列。这样L9(34)就只能安排两个因素,
21、实际工作中一般也不在三水平以上的正交表中安排交互作用。也就是说,若要考虑交互作用,最好选择两水平表,如L8(27)。在实际应用中,要尽量减少混杂。原则上讲,即使有的交互作用影响事先估计不太大,但最好还是不要把它们和单独因素混在一起。,这张表印刷有错误,正确的L27(313):两列间的交互作用表见下页,2.4 多指标的实验,单指标试验:衡量实验效果的指标只有一个。多指标试验:衡量实验效果的指标有多个。多指标实验的数据处理方法有两种,分别为综合评分法和综合平衡法。2.4.1 综合评分法按照一定的评分标准,给多个指标打分求和,从而转化为一个指标(总分),用单一指标代表实验结果。综合评分法的关键是评分
22、。评分既要能反映各指标的要求,也要能反映出各个指标的重要程度。通常可采用“加权平均法”,即根据各个指标的重要性来确定相应指标的“权”,然后算出每个实验结果的总分。如:得分第1个指标值第1个指标的权+第2个指标值第2个指标的权+,例 白地霉核酸的生产工艺实验,目的是提高核酸的收率,考察的指标有两个即核酸泥纯度和纯核酸回收率。这两个指标都是越大越好。,因素和水平表,用L9(34)安排实验,本实验有两个指标,相对来说纯度更重要。根据经验,纯度提高1,相当于收率提高5,即纯度:收率5:1。因此,可将“纯度2.5+收率0.5”作为总分。,实验方案和结果,分数纯度2.5+收率0.5,2.517.8+0.5
23、29.8=59.4,由极差法计算所得结果可以看出,因素的主次为:,主,次,A D B C,所以,腌制时间A取A1(24h),加水量D取D1(1:2),pH值选取便于操作的水平C2(6.0),B取B3(核酸含量为6.2)。故,最优条件为:A1B3C2D1,2.4.2 综合平衡法,分别把各个指标按单一指标进行分析,然后再把各个指标计算分析的结果进行综合平衡,从而确定各因素水平的最优或较优组合。例 液体葡萄糖生产工艺的优选实验,考查液体葡萄糖的4个指标:(1)产量,越高越好;(2)总还原糖,在3240之间;(3)明度,比浊数越小越好,不得大于300mg/L;(4)色泽,比色数越小越好,不得大于20m
24、L。,因素和水平表,水平,因素,实验结果及极差法数据处理(1),用L9(34)安排实验,16 18 20 1.5 2.0 2.5 0 5 10 2.2 2.7 3.2,A B C D,产 量,因 素,指标(产量)随因素各水平的变化情况-1,实验结果及极差法数据处理(2),16 18 20 1.5 2.0 2.5 0 5 10 2.2 2.7 3.2,A B C D,还原糖,因 素,指标(还原糖)随因素各水平的变化情况-2,实验结果及极差法数据处理(3),16 18 20 1.5 2.0 2.5 0 5 10 2.2 2.7 3.2,A B C D,因 素,明 度,指标(明度)随因素各水平的变化
25、情况-3,实验结果及极差法数据处理(4),16 18 20 1.5 2.0 2.5 0 5 10 2.2 2.7 3.2,A B C D,色 泽,因 素,指标(色泽)随因素各水平的变化情况-4,综合考查四个指标。(1)还原糖含量,要求在3240之间,粉浆酸度影响最大,且只有2.0合适。而其余因素各个水平都可以保证实验要求。(2)从色泽看,也是粉浆酸度最重要,也是以pH=2.0为最好。粉浆浓度的影响也是相当明显的,粉浆浓度不能大于16。(3)从明度看,粉浆浓度最重要,而且不能用16。粉浆酸度的三个水平均满足要求,但也是以pH=2.0为最好。其他两因素影响不大,且基本满足要求。(4)从产量看,粉浆
26、酸度最不重要,但也是以pH=2.0为最好。因此,可以确定粉浆酸度pH=2.0是较好的。粉浆浓度也不重要,越低越好,但由于取16时明度不合格,因此可取18。稳压时间以5min最好,但5min时色泽不合格;其他两个指标没有要求,可取5min,但还应进一步实验。加水量影响最大,而且越大越好;但取3.2时,色泽最差,因此可取2.7,或进一步实验以获得更精确的结果。,综上所述,可得出最优工艺条件如下:粉浆浓度:18oB粉浆酸度:pH=2.0稳压时间:57min加水量:2.7kg/cm2,2.5 水平数不等的正交实验,2.5.1 水平数不相同(混合型)正交表正交表中,如果有两列水平数不相等的话,则称为水平
27、数不相同的正交表,或混合型正交表。,Ln(m1k1m2k2),正交表代号,正交表横行数代表实验次数,因素水平数,因素水平数,列数(最多安排k1+k2个因素),L8(424),行号,列号,例 某钢厂为降低钛合金的硬度,在冷加工工艺中需进行一次退火热处理。实验目的:寻找降低硬度的退火工艺参数。指标:硬度。,因素水平表,因素,水平,这是一个具有一个四水平因素和两个二水平因素的实验。故选用混合型正交表L8(424)。,表头设计,实验方案及实验结果计算分析,因素,实验号,这类实验的计算分析方法与同水平的实验类似,但计算分析时要注意以下两点。,(1)计算I,II,III及其平均值时,由于水平数的不同而略有
28、差别。例如:第1列:由于有四个水平数,就需要分别计算I,II,III和IV及四个相应的平均值。I31.60+31.0062.60第2,3列:由于只有两个水平数,就只需计算I和II及两个相应的平均值。,(2)极差的折算。当因素的水平数相同时,因素的主次顺序完全由R决定。但当因素的水平数不同时,直接比较R是不妥的。这是因为若两个因素对指标有影响,一般来说,水平数多的因素极差可能大些,因此,要用一个系数把极差折算后才能进行比较,极差的折算公式如下:,折算系数d,由折算后的极差R和指标与因素关系图可以看出:(1)各因素对硬度指标影响的主次顺序为(主次)BCA;(2)直接分析:好的条件为A4B2C1;(
29、3)计算分析:好的条件为A2B2C1;(4)验证实验:经该厂生产实践,生产条件A2B2C1即退火温度760,保温时间2h,冷却介质为空气时,效果良好。,2.5.2 使用拟水平正交表处理水平数不等的正交实验,对水平数不同的实验,如在现成的混合型正交表中找不到一张合适的正交表,或者即使能找到但需要做较多的实验,这时可将水平数较少的因素虚拟一些水平,使之安排在水平数较多的正交表中,这种方法作为拟水平设计。,如 某厂对零件进行热处理实验,可选L18(237)但实验次数多,可以把因素C凑足三水平使用L9(34)表安排实验。,表头设计,*把正交表中被改造水平少的那个列称为拟水平列,以“”符号表示,本例中因素C的第二水平(845)是平时认为比较好的水平,应予以重点考察,故虚拟第三水平为因素C的第二水平。在拟水平实验中,对于拟水平因素来说,各水平的水平重复数r不相等。如因素C的一水平r=3,而二水平则r=6,因此,在计算K的平均值时需不同处理。,正交实验直观分析法,优点:简单明了,计算工作量小,便于普及推广缺点:(1)不能把实验过程中实验条件改变引起的数据波动与实验误差引起的数据波动区分开。(2)对影响实验结果的各因素的重要程度,不能给以精确的数量估计。,方差分析可弥补直观分析法的不足。,
链接地址:https://www.31ppt.com/p-6157705.html