实验方法与试验设计.ppt
实验方法与试验设计,问题的提出,任何自然科学都离不开实验,大多数学科(化工、化学、轻工、材料、环境、医药、热工等)中的概念、原理和规律大多由实验推导和论证的。如最佳的配方、工艺条件,产品性能的优化,对产品质量、环境质量作出评价等。,同时,在生产、生活活动中,也常常遇到一些需要通过实验来解决的问题,因此就涉及到要运用什么样的实验方法,来解决该问题,也即要进行试验设计。一般情况下,实验分为:验证性实验:对已知的理论进行验证,以加深对理论的认识 探索性实验:为了揭示尚未完全认识的事物,发现其发生与发展的规律,以完成工程与科研任务,具有很强的探索性(工程中经常碰到),实验过程,实验准备实验实验数据分析处理1实验准备 提出问题,弄清实验目的 设计实验方案(试验设计)拟订实验大纲 实验设备、测试仪器的准备2实验(1)测试(2)记录3实验数据的分析、处理 通过一定的方法对实验数据进行整理、分析,去伪存真,提炼出我们需要的信息,以发现事物的规律。4提交实验报告或科研报告,例如:为探讨因素A、B、C在某问题中所扮演的角色,就得明确你拟研究的目的是什么,以及是要弄清哪些因素是主要因素、哪些是次要因素呢?还是这三种因素分别对该问题有什么样的影响规律呢?还是别的什么。因此,只有明确了研究目的之后,才能选取适当的研究方法,也即试验方法。,第一章 正交试验设计,1.1多因素的试验问题 1.1.1 问题的提出,例1.1 为提高某化工产品的转化率,选择了三个有关因素进行条件试验,反应温度(A),反应时间(B),用碱量(C),并确定了它们的试验范围:A:80-90B:90-150分钟C:5-7试验目的是搞清楚因素A、B、C对转化率有什么影响,哪些是主要的,哪些是次要的,从而确定最适生产条件,即温度、时间及用碱量各为多 少才能使转化率高。,这里,对因子A,在试验范围内选了三个水平;因子B和C也都取三个水平:A:Al80,A285,A3=90B:Bl90分,B2120分,B3=150分C:Cl5,C26%,C37%当然,在试验设计中,因子可以是定量的,也可以是定性的。而定量因子各水平间的距离可以相等,也可以不相等。试制定试验方案。,在已有的试验方法中,对这个三因子三水平的条件实验最基本、最普遍使用的是:(1)全面试验法:取三因子所有水平之间的组合,即AlBlC1,A1BlC2,A1B1C3,A3B3C3,共有33=27 次试验。用图表示就是图1.1 立方体的27个节点。,全面试验对各因子与指标间的关系剖析得比较清楚。但试验次数太多。特别是当因子数目多,每个因子的水平数目也多时,试验量大得惊人。如选六个因子,每个因子取五个水平时,如欲做全面试验,则需5615625次试验,这实际上是不可能实现的。,(2)简单比较法:变化一个因素而固定其他因素,如首先固定B、C于Bl、Cl,使A变化之:A1B1C1 A2 A3(好结果)如得出结果A3最好,则固定A于A3,C还是Cl,使B变化之:B1A3C1 B2(好结果)B3 得出结果以B2为最好,则固定B于B2,A于A3,使C变化之:C1A3B2C2(好结果)C3 试验结果以C2最好。于是,9次试验后就认为最好的工艺条件是A3B2C2。,这种方法一般也有一定的效果,但缺点很多:首先,这种方法的选点代表性很差,如按上述方法进行试验,试验点完全分布在一个角上,而在一个很大的范围内没有选点。因此这种试验方法不全面,所选的工艺条件A3B2C2不一定是27个组合中最好的。提供的信息不够丰富。其次,用这种方法比较条件好坏时,是把单个的试验数据拿来,进行数值上的简单比较,而试验数据中必然要包含着误差成分,所以单个数据的简单比较不能剔除误差的干扰,必然造成结论的不稳定。不能估计误差的干扰。最后,采用不同的轮换法,最后的结论可能不同。不能考察交互作用。,(3)为具有(1)和(2)的优点,能否减少试验次数,而又不影响试验效果呢?怎样安排实验、采取什么样的试验方法呢?对应于A有Al、A2、A3三个平面,对应于B、C也各有三个平面,共九个平面。则这九个平面上的试验点都应当一样多,即对每个因子的每个水平都要同等看待。具体来说,每个平面上都有三行、三列,要求在每行、每列上的点一样多。这样,作出如图1.2所示的设计,试验点用表示。我们看到,在9个平面中每个平面上都恰好有三个点而每个平面的每行每列都有一个点,而且只有一个点,总共九个点。这样的试验方案,试验点的分布很均匀,试验次数也不多。,当因素和水平都不太多时,尚可通过作图的办法来选择分布得很均匀的试验点,但因素水平多了,作图的方法就不行了。试验工作者在长期的工作中总结出一套办法,创造出所谓的正交表。按照正交表来安排试验,既能使试验点分布得很均匀,又能减少试验次数。,试验设计是指为节省人力、财力、迅速找到最佳条件,揭示事物内在规律,根据实验中不同问题,在实验前利用数学原理科学编排实验的过程。,20世纪初:英国生物统计学家费歇尔(1890-1962)首次提出了“试验设计”术语。实验设计方法最早应用于农业、生物学、遗传学方面。在农业方面主要是进行品种对比、施肥对比等。20世纪40年代,英美两国开始在工业生产中应用,如改变原料配比或工艺生产条件,寻找最佳工况。50、60年代:日本田口玄博士创造了正交试验设计法。日本电讯研究所研制的“线形弹簧继电器”,使电话机收听效果大为改进,为日本电讯事业的发展起到了不可估量的作用。50年代:我国中科院数学研究所在正交实验设计的观点、理论和方法上有了新的创见,编制了一套较为适用的正交表,简化了实验程序和实验结果分析方法。,正交试验设计方法,简称正交设计,是试验设计的重要组成部分,该方法由日本的田口玄一于1949年创立。正交试验设计方法是从全面试验中挑出部分有代表的点进行试验,这些代表点具有“均匀”和“整齐”的特点.正交试验设计是部分因子设计(fraction factorial designs)的主要方法,具有很高的效率.目前,实验设计已广泛应用于各个领域。,1.1.2 用正交表安排实验一、指标、因素、水平实验中的基本要素指标 用来衡量试验效果好坏的特征值。因素 对实验指标有影响的原因或要素。水平 因素在实验中所处的不同状态,可 能引起指标的变化。,1)指标用来衡量试验效果好坏的特征值指标分类:a)定量指标(数量指标,如强度、重量、产量、合格率、成活率、废品率、转化率等。)b)定性指标(非数量指标,如颜色、味道、光泽等)指标的选择要求:选择客观性强的指标,选择易于量化即经过仪器测量而获得的指标;选择灵敏度高的指标,选择精确性强的参数作为指标。,2)因素对实验指标有影响的原因或要素 因素也称为因子,它是在进行实验时重点考察的内容。因素一般用大写字母ABC来标记,如因素A、因素B、因素C等。因素分类:a)可控因素(温度、时间、种类、浓度)b)不可控因素(风速、气温、),选择因素的原则 a)抓住主要因素(将影响较大的因素选入试验)同时要考虑因素之间的交互作用。b)找出非主要因素,并使其在实验中保持不变,以消除其干扰作用。,3)水平因素在实验中所处的不同状态 选择水平的一般原则:水平宜取三水平为宜 水平应是等间隔的原则 水平是具体的 水平的选择必须在技术上现实可行。,二、正交表符号的意义 为了叙述方便,用L代表正交表,正交表记为 Ln(mk),m 是各因素的水平,k(列数)是因素的个数,n 是安排试验的次数(行数)。常用的有L8(27),L9(34),L16(45),L8(424),L12(211),等等。L8(27)中各数字的意义如下:7为此表列的数目(最多可安排的因子数)2为因子的水平数8为此表行的数目(试验次数)L18(237)有7列是3水平的有1列是2水平的 L18(237)的数字告诉我们,用它来安排试验,做18个试验最多可以考察一个2水平因子和7个3水平因子。,三、正交表的正交性,正交表具有两条性质:(1)均匀性:每一列中各数字出现的次数都一样多。如各列中的l、2、3都各自出现3次。均匀分散;(2)整齐性:任何两列所构成的各有序数对出现的次数都一样多。如任何两列,例如第3、4列,所构成的有序数对从上向下共有九种,(1,1),(1,2),(1,3),(2,1),(2,2),(2,3),(3,1),(3,2),(3,3),它们各出现一次,既没有重复也没有遗漏。其他任何两列所构成的有序数对也是这九种各出现一次。这反映了试验点分布的均匀性,也称之正交表的正交性。整齐可比。因此,用正交表来安排试验时,各因素的各种水平是搭配均衡的。,四、用正交表安排试验 下面通过例1.1来说明如何用正交表进行试验设计。因素顺序上列、水平对号入座,明确实验目的,确定实验指标;挑选因素,选取水平;选定正交表;实验点安排。,几点说明:1、表中各列的性质、地位一致;2、试验顺序要随机;3、因素的水平要随机;4、根据试验要求选取正交表。,1.1.3 正交试验的结果分析极差分析,由以上计算结果,可得出以下结论:(1)各因素对指标的影响 A C B 主 次(2)最优生产条件 a、先从因素主次的角度看:温度越高转化率越好,以90为最好;反应时间以120分转化率最高;用碱量以6转化率最高;所以最适水平是A3B2C2。,b、再从因素极差值的角度看:B因素是次要因素,为从节约的立场出发,选取A3B1C2也是可行的。(3)最优生产条件的验证 由于表中没有A3B2C2和A3B1C2这两个组合,因此要对该结论进行验证。经验证,得到A3B2C2的转化率为74%,A3B1C2的为75%,表明A3B1C2是最好的组合。,小结:正确的实验设计不仅节省人力、物力和时间,并且是得到可信的实验结果的重要保证。即经过设计的实验,效果大大提高,与不经过设计的实验相比,情况大不相同。,拓展:对下一步实验的指导意义,(1)温度的取值范围还应向高温延展;(2)可以不再考虑时间的影响,改换其它的因素;(3)。,1.1.4多指标的分析方法 在例1.1中,试验指标只有一个,考察起来比较方便,但实际问题中,需要考察的指标往往不止一个,有时有两个、三个或更多。如何评价考察指标呢?一般情况下有两种方法:a)综合平衡法 b)综合评分法,a)综合平衡法通过具体的例子来加以说明 例1.2 某陶瓷厂为了提高产品质量,要对生产的原料进行配方试验。需检验3项指标:抗压强度、落下强度和裂纹度,前两个指标越大越好,第3个指标越小越好。根据以往的经验,配方有3个重要因素:水分、粒度和碱度,它们各有3个水平。试进行试验分析,找出最好的配方方案。,将3个指标分别进行计算分析后,得出3个好的方案:对抗压强度是A3B3C1;对落下强度是A1B3C2;对裂纹度是A3B3C1,这3个方案不完全相同,对一个指标是好方案,而对另一个指标却不一定是好方案,如何找出对各个指标都较好的一个共同方案呢?,(1)粒度B对抗压强度和落下强度来讲,极差最大,是最大的影响因素。从上图中看出三个指标B均取8为最好即取B3。(2)碱度C,极差不大,次要因素。由上图分析,取1.1时两个指标好,1个指标稍差,对三个指标综合考虑,C取1.1即取C1。(3)水分A,对裂纹度影响极差最大,A取9最好,由上图综合考虑A取9即取A3。,通过各因素对各指标影响的综合分析,得出较好的试验方案是:B3:粒度取第3水平,8;C1:碱度取第1水平,1.1;A2:水分取第3水平,9。,b)综合评分法 对多指标的问题,真正做到好的综合平衡,有时很困难,这是综合平衡法的缺点。综合评分法可以克服这个缺点。综合评分法是根据各个指标的重要性的不同,按照得出的试验结果综合分析,给每一个试验评出一个分数,作为这个试验的总指标。根据这个总指标作进一步的分析。,因此,在总指标的计算,根据指标的重要性进行加权计算,尤其重要。综合评分法是将多指标的问题,通过加权计算总分的方法化成一个指标的问题,这样对结果的分析计算都比较方便、简单。但如何合理地评分,是最关键的问题。这一点只能依据实际经验来解决,单纯从数学上是无法解决的。,1.1.5 拟水平法 今有某一试验,试验指标只有一个,它的数值越小越好,这个试验有4个因素A、B、C、D,其中因素C是2水平的,其余3个因素都是3水平的。试安排试验,并对试验结果进行分析,找出最好的试验方案。,设想:假若C有3个水平,就变成4因素3水平的问题了。如何将C变成3水平的因素呢?从C中的1和2水平中选一个水平让它重复一次作为第3水平,这就叫虚拟水平。取哪一个水平作为第3水平呢?一般说,都是要根据实际经验,选取一个较好的水平。比如,如果认为第2水平比第1水平好,就选第2水平作为第3水平。,1.1.6实例2,4-二硝基苯肼的工艺改革 目的:2,4-二硝基苯肼是一种试剂产品。过去的工艺过程长,工作量大且产品经常不合格。北京化工厂改革了工艺,采用2,4-二硝基氯化苯与水合肼在乙醇作溶剂的条件下合成的新工艺。小试已初步成功,但收率只有48%,希望找到更好的生产条件,提高生产效率。,(1)因素主次 B C F D A E 主 次(2)最优条件 因素主次A1B1C2D2E1F2 极差值大小A2B1C2D2E2F2,最终:A 不加乙醇 B 水合肼用量2倍 C 回流温度 D 2 h E 粗品 F 快速 G 慢加料,1.2有交互作用的正交试验设计1.2.1 问题的提出一、交互作用例1.3 有4块试验田,土质情况基本一样,种植同样的作物。现将氮肥、磷肥采用不同的方式分别加在4块地里,收获后算出平均亩产,记在下表中:,二、自由度和正交表的选用正交表自由度的确定:(1)每列的自由度 f列水平数1(2)两因素交互作用列的自由度 fABfAfB(两因素自由度的乘积)(3)正交表的总自由度 f总=试验次数-1原则:要考察的因素及交互作用的自由度的总和不大于所选用的正交表的总自由度。,表头设计:(1)先安排交互作用不可忽略的因素;(2)再安排其它无交互作用的因素。,三、有交互作用的正交试验及结果分析(1)2水平 某产品的产量取决于3个因素A、B、C,每个因素都有两个水平。这三个因素每两个因素都有交互作用,必须考虑。试验指标为产量,越高越好。试安排试验,这是3因素2水平的试验。3个因素A、B、C要占3列,它们之间的交互作用AB、B C、A C又各占3列,共占6列,可以用正交表L8(27)来安排试验。若将A、B放在第1、2列,从表1.11查出AB应在第3列,因此C就不能放在第3列,否则就要和AB混杂。现将C放在第4列,由表1.11查出AC应在第5列,BC应在第6列。得到表头:,讨论:,(2)3水平,讨论:二元图的意义,练习:抗氧剂“303”是一种高分子多元阻碍酚,用作橡胶、高溶点润滑油和聚烯烃等的抗氧剂。试验目的是寻求较好的反应条件以提高反应收率。BC、BD、DE,1.3 正交试验的方差分析一、方差分析的必要性 方差分析法是将因素水平(或交互作用)的变化所引起的试验结果间的差异,与误差的波动所引起的试验结果间的差异区分开来的一种数学方法。如果,因素水平变化所引起的试验结果变动落在误差范围内,或都与误差相差不大,就可以判断这个因素水平的变化并不引起试验结果的显著变动;相反,会引起试验结果的显著变动。,二、单因素方差分析(一)变差平方和的分解,S1总变差平方和S2组内变差平方和 误差引起S3组间变差平方和 水平引起,(二)自由度 f1=所有数据个数-1 f3=水平数-1 f2=f1-f3(三)均方(四)显著性检验,三、正交试验的方差分析(一)无交互作用,S=W-P=23484-22500=984(总变差平方和),讨论:1 因素的主次2最佳组配3检验,(二)有交互作用,小结:计算离差的平方和a 总变差平方和STb 各因素的变差平方和S因c 试验误差的变差平方和SE(2)计算自由度(3)计算平均离差平方和(均方)求F比(5)对因素进行显著性检验,(三)其它正交表A混合型正交一表的方差分析B拟水平法的方差分析 与一般水平相同,注意各列水平数的差别!C重复试验的方差分析 总体试验误差平方和 SE 由两部分构成:第一类误差,即空列误差 SE1;第二类误差即重复试验误差 SE2,四、缺落数据的弥补,(一)数学模型,总平均:x=89.6a1=90-89.6=0.4a2=94-89.6=4.4a3=95-89.6=5.4a4=85-89.6=-4.6a5=84-89.6=-5.6L11=90-89.6-0.4=0L12=92-89.6-0.4=2L13=88-89.6-0.4=-2,(二)计算,五、正交表的构造法正交拉丁方的方法定义:用 n 个不同的拉丁字母排成一个 n 阶方阵(n26),如果每个字母在任一行、任一列中只出现一次,则称这种方阵为 nn 拉丁方,简称为 n 阶拉丁方。,3列,4列,L8(424)正交表的构造:1)先列出正交表L8(27);2)取出L8(27)中的1,2列,将数对(1,1)(1,2)、(2,1)、(2,2)与单数字1,2,3,4依次对应,作为新表第1列;3)去掉12的第3列(交互作用列);4)4,5,6,7列左移,依次变为新表的2,3,4,5列。,第二章 t检验,统计推断是根据样本和假定模型对总体作出的以概率形式表述的推断,它主要包括假设检验(test of hypothesis)和参数估计(parametric estimation)二个内容。,假 设 检 验 又叫 显著性 检验(test of significance)。显著性检验的方法很多,常用的有t检验、F检验和2检验等。尽管这些检验方法的用途及使用条件不同,但其检验的基本原理是相同的。本节以两个平均数的差异显著性检验为例来阐明显著检验的原理,介绍 几种t检验的方法。,一、显著性检验的意义 随机抽测A区10点和B区10点,资料如下:A:11,11,9,12,10,13,13,8,10,13 B:8,11,12,10,9,8,8,9,10,7,五、实例分析1.,2.在实际工作中还经常会遇到推断两个样本平均数差异是否显著的问题,以了解两样本所属总体的平均数是否相同。对于两样本平均数差异显著性检验,因试验设计不同,一般可分为两种情况:一是非配对设计或成组设计两样本平均数差异显著性检;二是配对设计两样本平均数差异显著性检。,一、非配对设计两样本平均数的差异显著性检验 非配对设计或成组设计是指当进行只有两个处理的试验时,将试验单位完全随机地分成两个组,然后对两组随机施加一个处理。在这种设计中两组的试验单位相互独立,所得的二个样本相互独立,其含量不一定相等。,二、配对设计两样本平均数的差异显著性检验 非配对设计要求试验单位尽可能一致。如果试验单位变异较大,如试验动物的年龄、体重相差较大,若采用上述方法就有可能使处理效应受到 系统 误 差的影响而降低试验的准确性与精确性。为了 消除试验单位 不一致对试验结果的影响,正确地估计处理效应,减少系统误差,降低试验误差,提高试验的准确性与精确性,可以利用局部控制的原则,采用配对设计。,配对设计是指先根据配对的要求将试验单位两两配对,然后将配成对子的两个试验单位随机地分配到两个处理组中。配对的要求是,配成对子的两个试验单位的初始条件尽量一致,不同对子间试验单位的初始条件允许有差异,每一个对子就是试验处理的一个重复。配对 的 方式有两种:自身配对与同源配对。,1、自身配对 指同一试验单位在二个不同时间上分别接受前后两次处理,用其前后两次的观测值进行自身对照比较;或同一试验单位的不同部位的观测值或不同方法的观测值进行自身对照比较。如观测某种疾病治疗前后临床检查结果的变化;观测用两种不同方法对食品中毒物或药物残留量的测定结果变化等。,2、同源配对 指将来源相同、性质相同的两个个体配成一对,如将畜别、品种、窝别、性别、年龄、体重相同的两个试验动物配成一对,然后对配对的两个个体随机地实施不同处理。,第三章 相关与回归分析,一、相关与回归分析的基本概念(一)相关的概念 事物或现象间在数量上存在着相互依存、相互制约的关系。可分为两种类型:确定性关系和非确定性关系。,确定性关系:现象间存在着一一对应的严格的数量依存关系。对于某一个变量的每一个数值,都有另一个变量的确定数值与之对应,又称为函数关系。非确定性关系:现象间存在的不严格的数量依存关系。对于某一个变量的每一个数值可以有另一个变量的若干个数值与之对应,又称为相关关系,简称相关。,函数关系与相关关系的联系:(1)由于测量误差存在,现实生活中函数关系常表现为相关关系;(2)由于现象间数量关系规律性,相关关系常借助函数关系近似描述。对现象间相关关系的研究,称为相关分析。,(二)回归的概念 将具有相关关系的各个变量区分为自变量和因变量,研究自变量数值的变化对因变量数值的影响,根据自变量的数值推算因变量的数值,揭示相关关系现象间数量变动的统计规律性。回归的分类,相关分析与回归分析的区别 1.在相关分析中,不必确定自变量和因变量;而在回归分析中,必须事先确定哪个为自变量,哪个为因变量,而且只能从自变量去推测因变量,而不能从因变量去推断自变量。2.相关分析不能指出变量间相互关系的具体形式;而回归分析能确切的指出变量之间相互关系的具体形式,它可根据回归模型从已知量估计和预测未知量。3.相关分析所涉及的变量一般都是随机变量,而回归分析中因变量是随机的,自变量则作为研究时给定的非随机变量。,二、回归设计 古典的回归分析方法只是被动地处理已有的试验数据,对试验的安排不提任何要求,对如何提高回归方程的精度研究很少。后果:盲目增加试验次数,而这些试验结果还不能提供充分的信息,以致在许多多因子试验问题中达不到试验目的。,对模型的合适性有时无法检验,因为在被动处理数据时在同一试验点上不一定存在重复试验数据。为了适应寻求最佳工艺、最佳配方、建立生产过程的数学模型等的需要,人们就要求以较少的试验次数建立精度较高的回归方程。,为此,要求摆脱古典回归分析的被动局面,主动把试验的安排、数据的处理和回归方程的精度统一起来考虑,即根据试验目的和数据分析的要求来选择试验点,不仅使得在每一个试验点上获得的数据含有最大的信息,从而减少试验次数,而且使数据的统计分析具有一些较好的性质。这就是二十世纪五十年代发展起来的“回归设计”所研究的问题。,回归设计的分类:根据建立的回归方程的次数不同,回归设计有一次回归设计、二次回归设计、三次回归设计等;根据设计的性质又有正交设计、旋转设计等。本章仅介绍一次回归、二次回归的正交设计。,(一)一次回归正交设计利用二水平正交表来安排试验的设计方法。其主要步骤如下:1确定因子水平的变化范围,例:硝基蒽醌中某物质的含量y与以下三个因 子有关:z1:亚硝酸钠(单位:克)z2:大苏打(单位:克)z3:反应时间(单位:小时)为提高该物质的含量,需建立y关于变量z1,z2,z3的回归方程。,(1)确定因子取值范围,并对它们的水平进行编码 本例的因子水平编码表,(2)数据分析,(3)方程和系数的检验,(4)零水平处的失拟检验 上述用一次回归正交设计方法求得一次回归方程是简单、易行的,但是否能真实反映实际呢?由于试验是在各因子的上水平(+1)与下水平(1)处进行的,即使模型在这些边界点上拟合得很好,但是在因子编码空间的中心拟合是否也好呢?这可在零水平处增加若干重复试验,再通过检验来判断。,含交互作用的模型 当变量间存在交互作用时,我们可以更一般地考虑建立含两个因子间交互作用的模型,其交互作用用两个因子的编码值的乘积表示,按同样的计算便可求得诸回归系数,并对它们进行检验。,习题:为研究贮藏温度(Z1)、氧气浓度(Z2)和二氧化碳浓度(Z3)对苹果硬度的影响,采用一次正交设计进行试验。已知:Z21=4 Z11=8 Z22=2 Z12=10 Z23=12 Z13=38次实验结果为:500,467.35,462.65,462.3,463.15,463.5,460.5,429.86次0水平结果为:462.5,465.85,462.75,460,463.35,458.35,(二)二次回归正交设计,例 为提高钻头的寿命,在数控机床上进行试验,考察钻头的寿命与钻头轴向振动频率F及振幅A的关系。在试验中,F与A的变动范围分别为:125 Hz,375Hz与1.5,5.5,采用二次回归正交组合设计,并在中心点重复进行三次试验。,2试验计划与试验结果 本例的试验计划见下表,在试验随机化后所得试验结果列在该表的最右边一列。试验计划与试验结果,