实验设计与数据处理第二部分.ppt
《实验设计与数据处理第二部分.ppt》由会员分享,可在线阅读,更多相关《实验设计与数据处理第二部分.ppt(46页珍藏版)》请在三一办公上搜索。
1、第三章 方差分析,3.1 数据处理的概念和意义,数据处理主要研究实验测量或观察数据分析计算的处理方法,从而得出可靠或规律性的结果。依据这个规律和结果对工业生产、农业生产、天气、地震等进行预报和控制,从而掌握和主宰客观事物的发展规律,使之服从和服务于人类。数据处理的方法很多,如参数估计、假设检验、方差分析和回归分析等。,3.2 方差分析的概述,方差分析(Analysis of Variance)由英国统计学家首创,为纪念Fisher,以F命名,故方差分析又称 F 检验。,3.2.1 方差分析的概念和意义,方差分析的中心点是把实验观测数据总的波动分解为反映因素水平变化引起的波动和反映实验误差引起的
2、波动两部分。方差分析亦即把实验观测数据的总的偏差平方和(ST)分解为反映必然性的各个因素的偏差平方和(SA、SB、SN)与反映偶然性的误差偏差平方和(Se),并计算比较它们的平均偏差平方和,以找出对实验观测数据起决定性影响的因素作为进行定量分析判断的依据。,方差分析能把实验过程中实验条件改变所引起的数据波动与实验误差引起的数据波动区分开,同时对影响实验结果的各因素的重要程度给以精确的数量估计。方差分析类型很多,概括起来有以下几种:(1)单因素实验的方差分析(2)多因素实验的方差分析(3)正交实验设计的方差分析(4)SN比实验设计法,3.2.2 单因素实验的方差分析,在一项实验中,若只有一个因素
3、的水平在改变,而其他因素的水平固定不变,这就叫做单因素实验。3.2.2.1 方差分析的基本思想例 3.1 考察生产某化工产品时反应温度A()对收率y()的影响。为此,比较两个反应温度A130,A240。,实验号,水平,表 3.1 某化工产品收率实验数据表,条件误差:由于实验条件的不同而引起的差异叫“条件误差”。实验误差:即同一条件(同水平)下,存在偶然因素而引起的差异叫“实验误差”,即“随机误差”。为了考察某个因素对指标的作用,必须将总误差分解为条件误差和实验误差,并比较之,作出因素对指标的作用是否显著的结论,这种分析方法称为方差分析法。,条件误差、实验误差、总误差之间有什么关系呢?,用全部1
4、0个实验数据与总的平均值(75.7)之差的偏差平方和来估计总的误差,这个平方和称为总的偏差平方和,记为ST,即 ST(75-75.7)2+(78-75.7)2+(85-75.7)2 1294.10用同一条件(水平)下5次实验的数据与其平均值之差的偏差平方和来估计实验误差,即 对A1(30)条件下:S1(75-71.4)2+(78-71.4)2+(83-71.4)2 429.20 对A2(40)条件下:S2(89-80.0)2+(62-80.0)2+(85-80.0)2 680.00 这两个偏差平方和相加,反映了实验误差的大小,称为组内偏差平方和或误差平方和(Se):Se S1+S2 429.2
5、0+680.00 1109.20,用每种条件(水平)的数据平均值与总的平均值差的偏差平方和来估计条件误差。因每种条件重复了5次,故将此平方和5倍,称为组间偏差平方和或因素的偏差平方和(SA):SA5(71.4-75.7)2+5(80.0 75.7)2 184.90 可以看出,此处有ST SA+Se 184.90+1109.20 1294.10即总的偏差平方和可以分解为组间偏差平方和与组内偏差平方和。,有了SA和Se之后,是否就能直接比较出由于因素水平的变化引起的数据波动与实验误差引起的数据波动之间的差异呢?,偏差平方和不仅与数据本身有关,而且还与数据的个数有关。为此,必须消除数据个数的影响,采
6、用平均偏差平方和SA/fA(组间方差)与Se/fe(组内方差)进行比较,并以此作出推断。其中,fA和fe分别称为SA与Se的自由度(即偏差平方和式中独立数据的个数)。对Se而言,因为其中的10个数据满足两个关系式(75+78+60+61+83)/5=71.4(89+62+93+71+85)/5=80.0 所以Se的自由度fe=10-28.,对SA而言,因为其中的2个数据有一个关系式(71.4+80.0)/2=75.7 所以SA的自由度fA=2-1=1.对ST而言,因为其中的10个数据有一个关系式(75+78+60+61+83+89+62+93+71+85)/10=75.7 所以ST的自由度fT
7、=10-1=9.显然 fT=fA+fe=1+8=9.如果平方和是由n项组成,它的自由度就是n1,如果一个平方和是由几部分的平方和组成,则总的自由度等于各部分自由度之和。,计算F值:,然后对因素进行显著性检验。F值的大小,可以用来判断因素水平对考察指标影响的显著性。F值接近1,说明因素水平改变对考察指标的影响在误差范围内,即水平间无显著差异;F值越大,说明因素水平的改变对指标的影响超过了实验误差造成的影响,即条件误差相对实验误差大得多。,F多大时,可以说因素的水平改变对考察指标的影响是显著的呢?小到多小,认为实验结果的误差主要是实验误差引起的,这就需要有一个标准。这个标准由F表给出。,在F表上,
8、横行n1代表F值中分子的自由度,竖行n2代表F值中分母的自由度,相交后的数值即为F比的临界值。,本例中,因,对0.05,查得F0.05(1,8)5.3,为置信度(显著水平),表示在作出某种判断时犯错误的概率。因F1.335.3,故可以认为在水平0.05下,反应温度A对指标收率的影响不显著,或反应温度30和40对收率的影响没有显著差异,实验结果出现的波动主要是由实验误差造成的。,3.2.2.2 单因素实验方差分析的一般步骤,设有一单因素实验,因素A有m个水平,每个水平均重复k次实验,水平Ai的第j次实验值为xij(i=1,2,m;j=1,2,k)。,表3.2 数据计算表,Ti表示Ai水平下k次实
9、验数据的合计,表示Ai水平下k次实验数据的算术平均值。,共进行了mk次实验,令n=mk,用T表示n个实验值的总和,即,用 表示n个实验值的总平均值,即,1.偏差平方和的分解,把整个实验结果所得的每一个观测值xij对其总平均值 求偏差平方和,用ST表示,可用下式计算:,I,II,III,式中I项是在同一条件(水平)下,k次实验的数据与其平均值的偏差平方和,称为组内偏差平方和,因为它反映了实验过程引起的误差,所以也称误差平方和,用Se表示。,式中II项,式中III项是每一种条件(水平)下,k次实验数据的平均值与km次实验总的平均值的偏差平方和,称为组间偏差平方和,因为它反映了条件(水平)引起的误差
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 实验设计 数据处理 第二 部分
链接地址:https://www.31ppt.com/p-6157700.html