实验设计(DOE).ppt
《实验设计(DOE).ppt》由会员分享,可在线阅读,更多相关《实验设计(DOE).ppt(130页珍藏版)》请在三一办公上搜索。
1、DOE(实验设计)2007年10月,欢迎光临6sigma世界,实践中的问题,化学家需要找到最佳的合成条件(温度、压力、浓度等),使得某种产品的产出率达到最高。电子工程师需要对各电子元件的规格以及电路的排布方式进行选择,使的电子产品最大程度地抵抗各种干扰。教练想研究最佳的训练方案(营养、运动类型、运动量等)人事部研究销售人员的业绩与销售人员个人特性的关系(相貌、性格、沟通技巧、技术背景、诚信度),以便在今后的招聘中确立正确的标准。银行家使用各种方法催收利息和欠款,但要研究综合哪些方法可以保证银行的最大利益但又不至于丢失客户。,Y=f(x1,x2,x3,.),1.随机试验2.单因子试验3.全因子试
2、验4.部分因子试验5.计算模拟试验,试验方法,不同试验方法各有千秋,传统的实验方法,Best-guess Approach经验试验,优点:经验和知识 快捷,缺点:当经验和知识与实际情况有偏差时,反复试验都不成功,浪费时间和金钱 通常找不到最佳点,屡败屡战,屡战屡败,学术的实验方法,单因子试验One Factor At A Time,优点:对单个因子研究很仔细,缺点:耗时间金钱 不能发现因子之间的相互作用,未来的实验方法,Computer Simulation&Test计算机模拟与验证,优点:快速准确,局限:需要大量的人力物力来确定物理模型.目前的知识水平还不能提供足够的物理模型,统计实验方法,
3、可测量的输出响应Ys可控输入因子Xs误差项error中包含 1)不可控的输入因子(可能是离散型或连续型)造成的波动或误差;2)模型本身的不准确(失拟),试验设计的基本概念与模型,根据试验目的选择试验类型,统计实验方法,统计实验方法,PG-1-17施肥间隔和气温对产量的影响的试验两因子DOE只需11次试验可以得出相应曲面、因子与响应的关系和最优值,能给出均值和波动。而OFAT找到的却不是真正的最优值。,统计实验方法,1、统计试验设计:系统规划、执行试验计划、统计分析2、从中你能获得其它试验分析方法得不到的结果:响应曲面、交互因子、扩展范围、假设检验、波动范围(置信区间)、预测结果3、能找出变差发
4、生的原因4、能用有效的计划试验来减少波动的影响5、能用假设检验和置信区间来分析、解释获得的数据6、适用于:新产品、新设计、新过程、新工艺 当确定新目标后,一定要仔细先做好试验规划,以求用最少的试验次数获得最多的信息,从而进行筛选因子或寻求因子的最优设置。,DOE的起源与发展,上世纪30年代,Ronald A.Fisher 将统计学用于实验设计。首先用于农业和生物研究 接着用于纺织印染、化学工业、机械制造 进而用于电子工业 第二次世界大战后在日本得到长足进展 中国曾在70-80年代推广,全因子试验(DOE),通过少量的实验来研究多个因子各自的作用快捷、节省费用 易于计划和分析对定量因子和定性因子
5、都实用均衡全面有利于确定因子之间的相互作用,2k Full Factorials,K个因子,每个因子取两个变化水平试验次数:2k,LOW,HIGH,HIGH,Two Factors,4 Runs,A,B,HIGH,HIGH,HIGH,LOW,LOW,LOW,Three Factors,8 Runs,B,A,C,4 Levels of Factor A3 Levels of Factor B,3 Levels of Factor A2 Levels of Factor B2 Levels of Factor C,B,A,B,C,A,多水平下的试验次数,abcd-1-1-1-11-1-1-1-11
6、-1-111-1-1-1-11-11-11-1-111-1111-1-1-1-111-1-11-11-1111-11-1-1111-111-11111111,2x2 Design,2x2x2 Design,如果用+1,-1来代表两个水平,平衡,正交 Orthogonal,0 对于每个因子,0 对于所有的数对,X,i,S,=,X,i,X,j,S,=,B,低 高,A,(L,H)(-1+1)b,(H,H)(+1,+1)ab,(L,L)(-1,-1)(1),(H,L)(+1,-1)a,高低,对于全部的实验点(Xi,Xj),实验方案的正交性,23 全因子试验示例,某化工产品的合成产率与温度(Temper
7、ature)、原材料的浓度(Concentration)和催化剂的类型(Catalyst)有关.试验时选择的条件为:温度:160o C(-1),180o C(1)浓度(%):20(-1),40(1)催化剂:A型(-1),B型(1)试验设计表如下,Factor TrialABC1-2+-3-+-4+-5-+6+-+7-+8+,计算温度的影响,高设下的平均值,71.00,低设下的平均值,49.25,影响(),21.75,温度影响 Effect=,(56+55+88+85)(54+47+51+45),4,4,=71.00-49.25=21.75,可以理解为温度升高对产率有利,(,),(,),浓度的影
8、响,=,47,+,55,+,45,+,85,4,-,+,+,+,=,-,54,56,51,88,4,4.25,表明浓度从20%升高到 40%,产率将下降约 4 个点,Temp,Conc,Catalyst,Yield,-1,-1,-1,54,1,-1,-1,56,-1,1,-1,47,1,1,-1,55,-1,-1,1,51,1,-1,1,88,-1,1,1,45,1,1,1,85,计算浓度的作用,催化剂效能,=,4,(_,_,_,_,),_,_,_,_,_,(,),4,计算催化剂的效果,因子之间的交互作用,用主体因子的两列进行线性相乘,就可得到交互作用的列.,主体因子的实验方案,交互作用,Tx
9、C=TempConc,X,=,因子之间的相互作用计算,图示各主体因子的作用,主体因子的影响,将该因子所有处于(-1)时的输出结果加起来并计算均值,将均值画在图上将该因子所有处于(+1)时的输出结果加起来并计算均值,将均值画在图上将两点联起来催化剂的影响已经画好,请将另外两个画出来,Temp,(-1),(+1),Conc,(-1),(+1),Cat,(-1),(+1),50,70,60,65,55,图示交互作用,TempxConc,ConcxCat,TempxCat,以温度与浓度的交互作用为例对于温度为-1,将浓度为 1时的结果进行平均对于温度为+1,浓度为 1时的结果进行平均将两点画在图中,并
10、用直线相连同样地,计算并画出浓度为+1时的一条直线,Temp,(-1),(+1),Temp,(-1),(+1),Conc,(-1),(+1),Temp-1,Conc-1=(54+51)/2=52.5Temp+1,Conc-1=(56+88)/2=72Temp-1,Conc+1=(47+45)/2=46Temp+1,Conc+1=(55+85)/2=70,45,75,55,65,Conc=+1,Conc=-1,DOE的基础概念,试验设计基础概念:随机化Randomization;区组化Blocking;重复 Replication;试验误差Experimental Error;试验单元Exper
11、imental Unit(EU)。,随机化Randomization:随机化是在试验研究中重新分配试验材料和安排试验顺序的一种试验设计技巧。随机化的目的是消除和减小因不可控和/或已知讨厌因子对响应可能产生的系统影响。随机化可以通过随机数据表或计算机随机数产生器完成。随机化的结果是保证某一次试验既不受前面的试验的影响,也不影响后面的试验,或者说试验是独立的。随机化不能减少试验误差即噪音,但可以减小不可控的、讨厌因子可能引起的系统影响。,DOE的基础概念,下图的Run Order是随机化(Randomization)后的试验次序:,随机试验顺序,本章将介绍用Minitab产生随机数以进行试验顺序随
12、机化。,DOE的基础概念,区组化Blocking:区组化是一种孤立已知系统影响的试验设计技巧,目的是防止已知系统影响掩盖重要输入因子的效应。区组化与随机化的不同之处在于区组化可以减小试验噪音,而减小试验噪音不是随机化的目标。区组可以视作可控因子或变量,但是是讨厌因子,我们不能或不应该将其固定在一个水平上。可能的区组包括不同原材料、操作者、机器、批次等。区组效应可以集中任何系统效应并从感兴趣的因子效应中分析出来。比较方法中的配对比较就是最简单的区组例子。,DOE的基础概念,下图飞机模型试验中对项目成员进行区组的例子:,按项目成员区组化,上述为区组化的例子,但注意上述安排不好,容易与BOTFOLD
13、混杂,处理办法在后续章节介绍。,区组化是试验设计很有用的工具,可以用于全因子和部分因子试验中减少“噪音”。尽量区组化,不能区组化再随机化.,DOE的基础概念,重复Replication:试验设计中需要重复的理由有两点:1)对过程的根本变差有个估计;2)提高主效应和交互效应估计的精度。重复是指除正常试验次数外在相同输入因子水平组合下独立安排一次和多次试验(注意不是同一次试验下的重复测量),为了保证独立性,需要将包括重复试验的多有试验次数进行随机化。如果重复被用于全因子试验,所有因子水平组合通常被重复相同次数。举例:飞机模型是23全因子试验,连同重复有16次试验,每个因子水平组合做两次,通过16次
14、试验的随机化可以减小讨厌因子的系统影响。,DOE的基础概念,重复Replication举例:,注意上表中每个因子水平组合重复了一次,共16次试验,这16次试验的实施顺序还需要随机化才行。,DOE的基础概念,误差(Error)包含两部分:试验误差和失拟误差.对于飞机模型可以建立的模型为:,上式中Y响应变量,x1,x2,x3为输入因子,Error为总误差。它包含:1)试验误差Experimental Error:试验误差是模型不能准确预测响应反映的误差。试验误差包括受不可控和已知讨厌因子引起的试验“噪音”和模型失拟。试验误差是同一因子水平组合下独立重复时体现的变差。,注意测量误差是试验误差的一个来
15、源,在做试验设计前,对所有响应进行测量系统分析是十分重要的,这样才能保证测量误差足够小。,由于时间、资源等因素,不太可能全部重复时,最少要在一个因子水平组合下重复或者在连续型因子的中间点重复。,DOE的基础概念,误差(Error):,试验单元Experimental Unit:试验单元是一次试验和一个因子水平组合所需要的试验材料,试验单元必须独立获取。试验单元可能包括人、试验、动物、电路板、半导体晶片等。,对于重复试验,同一因子水平组合的重复要安排不同的试验单元,不同的试验单元安排要是随机的以避免未知的和不受控的因子引起系统偏差。,DOE的基础概念,试验具有多种试验单元的情况举例:,右图所示是
16、半导体晶片制造,需要经过化学除锈和抛光两步,前者多个Wafer一起处理,后者单独处理,这种情况就是多种试验单元的情况.,DOE的基础概念,正交代码,因子的水平取决于因子类型、因子范围和因子量纲。我们将每个因子的两水平(低与高)编代码为1和1,称为正交代码。连续变量的正交代码 对于连续变量我们关心的是整个区间而不仅仅是试验的两个水平,例如一个因子的实际区间是(100,200),两个代码为:代码值 1 0 1 实际值 100 150 200 注意:150是中心点,代码值为0。问题:如果代码值为0.5,那么实际值是多少?,正交代码算法,正交代码方程式 实际值(最大值最小值)/2(最大值最小值)/2
17、记 A实际值 C代码值 m(最大值最小值)/2 d(最大值最小值)/2 则 A m C=或 AmCd d,代码值,正交代码优点,连续变量正交代码的好处 每个因子两水平编码即设计因子试验的方法,2k设计的分析和解释将被应用于任何因子,不管它的类型、范围和量纲。通过对因子水平进行1和1编码,模型中所有因子“份量”相同,“大小”相同。所有因子都没有量纲,因子效应可直接比较。在一系列代码组成的模型中,模型的均值(截距)就是响应的均值并且在设计“空当”的中心。当我们分析直升机数据并且建立一个飞行时间(机翼长度、宽度、底部折叠)的模型时,可以图解效应。正交代码去除了主效应估计与交互效应估计之间的相关性。,
18、使用 Minitab来设计实验方案,按 StatDOECreate Factorial Design进入 1-选定因子的个数2-点击 Designs 选择键,1.,2.,3.点击 Full Factorial(全因子实验);点击 OK.,4.点击 Factors 钮,5.输入各因子的名称.,6.点击“OK”,实验方案就出现在数据窗口内.,本例中的选择,Data Matrix,1.,3.,4.,2.,打乱实验顺序:1.防止漏掉一些随时间而变化的因子.2.统计学上要求这样做,以便体现统计的意义.3.对于由主观判断进行的测量,必须这么做.4.常常使实验的安排变得困难些.,如果点击Option,随机化
19、选择,数据窗口中的结果,StdOrderRunOrderBlocksTempConcCat161-1-1-12711-1-1311-11-144111-1581-1-116511-11721-111831111,StatDOEDisplay DesignStandard Order,分析 DOE,StatDoeAnalyze Factorial Designs,1.输入实验的结果,2.,3.,4.,Analyzing a DOE Continued,5.,6.,7.,实验设计的分析工具Analysis Tools for Factorial Designs,ANOVA 方差分析,鉴定因子的影响
20、以及它们的相互作用 是否显著Regression 回归分析,建立因子与结果之间的数学关系.Residual Analysis 残差分析,从统计学角度证实模型的真实性,Fractional Factorial FitEstimated Effects and Coefficients for yield(coded units)Term Effect CoefConstant 60.125 temp 21.750 10.875 conc-4.250-2.125 catalyst 14.250 7.125 temp*conc 2.250 1.125 temp*catalyst 16.750 8.3
21、75 conc*catalyst-0.250-0.125 temp*conc*catalyst-0.750-0.375 Analysis of Variance for yield(coded units)Source DF Seq SS Adj SS Adj MS F PMain Effects 3 1388.38 1388.37 462.792*2-Way Interactions 3 571.38 571.38 190.458*3-Way Interactions 1 1.12 1.12 1.125*Residual Error 0 0.00 0.00 0.000Total 7 1960
22、.88,分析的结果,这些是我们前面计算出来的结果,显著性判断-正态性检验,A(温度Temp),C(催化剂Catalyst)和 A*C(Temperature*Catalyst)交互作用偏离正态直线,表明他们的作用不是简单的随机变化,他们是影响结果的显著因子和交互作用.,在直线附近的点为属于正态分布的噪音波动,偏离直线较远的为显著因子或交互作用,显著性判断-Pareto,在排列图中,以t检验显著性几率 p0.10 作为界线,可以看到A,C和 A*C 交互作用是显著的,图示主体因子的影响,StatDOEFactorial Plots,1.选择查看主体因子,2.,4.选择要查看的因子,4.,3.选择
23、实验结果所在的列,各因子单独对产率的影响(图表),图示交互作用,StatDOEFactorial Plots,1.点击选择查看交互作用,2.,4.选择要查看的因子,4.,3.选择结果所在的数据列,因子之间相互作用图,温度受催化剂的影响,建立初步的预测关系方程式,Yield=60.125+10.875(Temp)-2.125(Conc)+7.125(Cat)+1.125(T*C)+8.375(T*K)-0.125(C*K)-0.375(T*C*K),使用计算出来的系数:,注意:上面的方程式中使用的是代码(1)作为两个水平.例如温度代码与真实温度的关系为:可以尝试一下预测的结果,假设温度为160,
24、浓度为30%并采用催化剂 A,Plan,Design,Conduct,Analyze,Confirm,DOE 后续工作,验证预测关系方程式进一步DOE 单因子试验,找到每个因子的最佳设置 最终确定工艺窗口,实例2:断裂的弹簧,问题:一家弹簧厂收到很多客户投诉,投诉他们的新品种弹簧在使用中会断裂.该问题已经出现好几个月了,工程师尝试了许多办法都没能解决问题,他们分析问题的原因可能集中在三个主要的因素上:T:钢材进行冷却处理之前的温度.C:钢材中碳的含量.O:冷却油温Temperature of the quenching oil.他们还做了一些单因子试验,但是还没有找到最佳条件设置.,问题小组决
25、定使用全因子试验来了解并优化过程,特别是要看看因子之间有无交互作用.试验方案:两水平,全因子三个因子8次试验水平设置如下,T,C,O,%弹簧断裂百分比,1,2,3,4,5,6,7,8,2,3,-,-,-,+,-,-,-,+,-,+,+,-,-,-,+,+,-,+,-,+,+,+,+,+,实验结果,图示实验结果,67,79,61,75,59,90,52.,87,钢温,1450 F,1600 F,.7%,.5%,油温,70 F,120 F,碳含量,各因子及其交互作用的效果,效果(高 低),T,C,O,TC,OC,TO,23.0,-5.0,1.5,1.5,0.0,10.0,82.75,59.75,6
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 实验设计 DOE
链接地址:https://www.31ppt.com/p-5344479.html