方差分析包括三因素.ppt
1,方差分析,2,如某种农作物的收获量受作物品种、肥料种类及数量等的影响;选择不同的品种、肥料种类及数量进行试验,,日常生活中经常发现,影响一个事物的因素很多,希望找到影响最显著的因素,3,看哪一个影响大?并需要知道起显著作用的因素在什么时候起最好的影响作用。,方差分析就是解决这些问题的一种有效方法。,4,因素(因子)可以控制的试验条件因素的水平 因素所处的状态或等级单(双)因素方差分析讨论一个(两个)因素对试验结果有没有显著影响。,第一节 概述,5,例如:某厂对某种晴棉漂白工艺中酸液浓度(g/k)进行试验,以观察酸液浓度对汗布冲击强力有无显著影响。,序号,冲击强力,浓度,1 2 3 4 5 6,A1 16.2 15.1 15.8 14.8 17.1 15.0,A2 16.8 17.5 17.1 15.9 18.4 17.7,A3 19.0 20.1 18.9 18.2 20.5 19.7,方差分析就是把总的试验数据的波动分成,1、反映因素水平改变引起的波动。2、反映随机因素所引起的波动。,然后加以比较进行统计判断,得出结论。,6,方差分析的基本思想:把全部数据关于总均值的离差平方和分解成几部分,每一部分表示某因素诸水平交互作用所产生的效应,将各部分均方与误差均方相比较,从而确认或否认某些因素或交互作用的重要性。用公式概括为:总变异=组间变异+组内变异,各因素引起,由个体差异引起(误差),种类:常用方差分析法有以下4种1、完全随机设计资料的方差分析(单因素方差分析)2、随机区组设计资料的方差分析(二因素方差分析)3、拉丁方设计资料的方差分析(三因素方差分析)4、R*C析因设计资料的方差分析(有交互因素方差分析),7,第二节 单因素方差分析,一、假设检验 设:A1、A2、A3、为三个总体X1、X2、X3,每个总体有6个样本Xi1、Xi2、Xi6(i=1,2,3)。注:要判断酸液浓度的3种水平对汗布的冲击强力是否有显著影响,实质上就是检验3种不同水平所对应的3个总体是否有显著差异的问题。即检验3个总体数学期望是否相等。以后就是求解问题,为了说明一般解的公式(方法),如下作一般分析。,8,一般形式:,序号,结果,水平,1 2 n,A1 X11 X12 X1n,A2 X21 X22 X2n,A3 Xm1 Xm2 Xmn,。,假定:数据满足正态性、独立性、方差齐性。(进行方差分析的条件)要检验因素A对指标是否显著影响,就是检验假设:H0:1=2=m 接受H0:即认为来自同一总体,差异由随机因素所造成。若拒绝H0:表明它们之间差异显著,差异有因素水平的改变所引起。做法:为了检验假设H0,要从总的误差中将系统误差和随机误差分开。,9,二、离差平方和的分解与显著检验 记:,将Q进行分解:,由于,10,故:,下面通过比较QE和QA来检验假设H0。在假设H0成立的条件下,可以证明:,相互独立,11,方法:(检验方法)(1)当H0:1=2=m 成立时。(2)统计量:,即:,12,(3)给定显著性水平,查表得临界值(4)由样本观察值计算出F(5)若F,则拒绝H0。(说明因素A各水平间有显著性差异)(6)若F,则接受H0。(说明因素A各水平间无显著性差异),三、计算的简化1、对Q、QE、QA计算简化。(给出一个简化的计算公式和数据简化的方法)令:,13,同样可推出:,2、数据的简化:试验数据经过变换,数据简化后对F值的计算没有影响,不会影响检验的结果,四、方差分析表,方差来源 离差平方和 自由度 F值 F0.05 F0.01 显著性,因素A QA m-1,试验误差 QE m(n-1),总误差 Q mn-1,14,例:前例题 1、对数据的简化,得下表:,序号,冲击强力,浓度,1 2 3 4 5 6,A1-8-19-12-22 1-20-80 1454,A2-2 5 1-11 14 7 14 396,A3 20 31 19 12 35 27 144 3820,由表中数据可算出,15,计算,计算出F值:,16,方差来源 离差平方和 自由度 F值 F0.05 F0.01 显著性,因素A 4217.3 2 28.38 3.68 6.38*(十分显著),试验误差 1114.7 15,总误差 5332 17,列表:,说明:,说明酸液浓度对汗布冲击强力有十分显著的影响。,17,五、各水平下试验次数不等时的方差分析,设第 i个水平试验次数为ni,则有,自由度分别为f=n-1,fE=n-m,fA=m-1.检验统计量为,式中:,18,第三节 双因素方差分析,例如:某厂对生产的高速钢铣刀进行淬火工艺试验,考察回火温度A和淬火温度B两个因素对强度的影响。今对两个因素各3个水平进行试验,得平均硬度见表:,Bj,Ai,试验结果,B1(1210C)B2(1235C)B3(1250C),A1(280C)64 66 68,A2(300C)66 68 67,A3(320C)65 67 68,假设:美中不足组合水平下服从正态分布、互相独立、方差相等。所需要解决的问题是:所有Xij的均值是否相等。,19,假设检验:,1)在假设H0成立的条件下。2)统计量,3)给定显著水平,查表得临界值,4)由样本观察值计算FA、FB5)若 时,接受H0,因素的影响不显著。若 时,拒绝H0。对因素B同理说明。,20,方差分析表:,方差来源 离差平方和 自由度 F值 F0.05(2,4)F0.01(2,4)显著性,因素A 1.56 2 FA=1.01 6.94 18.0,因素B 11.56 2 FB=7.46 6.94 18.0*,试验误差 3.1 4,总误差 16.22 8,A影响不显著。,B影响显著,由于,高速钢洗刀的硬度越大越好,因此因素B可取B3水平,即淬火温度1250C为好,因素A水平的确定,应考虑经济方便,取A1水平为好。,21,SAS系统中区分两种情况:1、每组观测数据相等,可用ANOVA过程处理以上四种情形的方差分析。2、若每组观测数据不相等,可用GLM过程处理以上四种情形的方差分析。,22,均衡数据的方差分析(ANOVA过程)过程说明:1、PROC ANOVA;2、CLASS 变量表;3、MODEL 因变量表=效应;4、MEANS 效应/选择项;5、ALPHA=p 显著性水平(缺省值为0.05),CLASS和MODEL是必需的,CLASS必须的MODEL之前。,可以是数值型和字符型,是指因变量与自变量效应,模型如下:1、主效应模型 MODEL y=a b c;(a b c是主效应,y是因变量)2、交互模型 MODEL y=a b c a*b a*c b*c a*b*c;3、嵌套效应 MODEL y=a b c(a b);4、混合效应模型号 MODEL y=a b(a)c(a)b*c(a);,输出因变量均数,对主效应均数间的检验。,23,例:1、单因素方差分析 某劳动卫生组织研究棉布、府绸、的确凉、尼龙四种衣料内棉花吸附十硼氢量。每种衣料做五次测量,所得数据如下。试检验各种衣料见棉花吸附十硼氢量有没有显著差别?,棉布 府绸 的确凉 尼龙,2.33 2.48 3.06 4.00 2.00 2.34 3.06 5.13 2.93 2.68 3.00 4.61 2.73 2.34 2.66 2.80 2.33 2.22 3.06 3.60,24,单因素方差分析SAS程序的输入:,循环语句,删除变量,CLASS和MODEL语句是必需的,CLASS必须出现在MODEL语句前。,25,组间占总的比例,单因素方差分析SAS程序输出结果:,结论:在CLASS语句中指出的P值。P0.003,可得出各衣料组间有非常显著差异。,26,2、两因素方差分析例:用4种不同方法治疗8名病者,其血浆凝固时间的资料如表,试分析影响血浆凝固的因素。,受试者编号(区组),处理组,1 2 3 4,8.4 9.4 9.8 12.2 12.8 15.2 12.9 14.4 9.6 9.1 11.2 9.8 9.8 8.8 9.9 12.0 8.4 8.2 8.5 8.5 8.6 9.9 9.8 10.9 8.9 9.0 9.2 10.4 7.9 8.1 8.2 10.0,27,两因素方差分析SAS程序的输入:,28,两因素方差分析SAS程序输出结果:,结论:总误差:F=14.04,P0.0001,故总体有非常显著差异。A因素:F=6.62,P0.0025,故认为因素A(治疗方法)对血浆凝固时间影响很大。B因素:F=17.2,P0.0001,故认为因素B(不同病者)对血浆凝固时间影响很大。,29,3、三因素方差分析(交互作用不存在)例:五种防护服,由五人各在不同的五天中穿着测定脉搏数,如表。试比较五种防护服对脉搏数有无不同。,试验日期,受试者,甲 乙 丙 丁 戊,A129.8 B116.2 C114.8 D104.0 E100.6 B144.4 C119.2 D113.2 E132.8 A115.2 C143.0 D118.0 E115.8 A123.0 B103.8 D133.4 E110.8 A114.0 B 98.0 C110.6 E142.8 A110.6 B105.8 C120.0 D109.8,30,三因素方差分析SAS程序的输入:,31,三因素方差分析SAS程序输出结果:,结论:因F=6.80,P0.0011,故总体有非常显著差异。其中K因素影响极大F=16.27,P0.001。因素P、C都无显著差异。,32,4、有交互因素的方差分析 例:治疗缺铁性贫血病人12例,分为4组给予不同治疗,一个月后观察红细胞增加(百万/mm),资料如表。试分析两种药物对红细胞增加的影响。,甲药(A)不用(A0)用(A1),乙药(B),不用B0用 B1,0.8 0.9 0.7 1.3 1.2 1.10.9 1.1 1.0 2.1 2.2 2.0,33,有交互因素方差分析SAS程序的输入:,34,有交互因素方差分析SAS程序输出结果:,结论:因F=98.75,P=0.00010.01,故总体有非常显著的差异,因素A、B、A*B都对红细胞增加数有非常大的影响。,35,非平衡数据的方差分析(GLM过程)在SAS/STAT中GLM(General Linear Models)过程分析功能最多。包括:1、简单回归(一元)2、加权回归3、多重回归及多元回归4、多项式回归5、方差分析(尤其不平衡分析)6、偏相关分析7、协方差分析8、多元方差分析9、反应面模型分析10、重复测量方差分析,36,GLM过程在方差分析中的应用:MODEL语句反映因变量与自变量的模型,其形式:,模型说明 模型类型,MODEL Y=A B;主效应ODEL Y=A B A*B;交互效应MODEL Y=A B A(B);嵌套效应ODEL Y1 Y2=A B;多元方差分析MODEL Y=A X;协方差分析,,是分类变量,是连续型变量。,37,、不平衡单因素方差分析例:健康男子各年龄组淋巴细胞转化率()如表,问各组淋巴细胞转化率的均数之间的差异是否显著?,健康男子各年龄组淋巴细胞转化率(),11-20岁58 61 61 62 63 68 70 70 74 7841-50岁54 57 57 58 60 60 63 64 6661-75岁 43 52 55 56 60,38,不平衡单因素方差分析SAS程序的输入:,39,不平衡单因素方差分析SAS程序输出结果:,40,2、不平衡二因素方差别分析假设如下数据作二因素方差分析,因素 b1 b2 b3,因素,a1a2,3.3 2.6 1.5 3.6 3.1 1.9 0.8 1.6 3.2 2.6 5.2 4.72.2 1.3 4.2 4.3 5.3 2.8 2.0 2.9 4.4 3.8 4.4 5.13.9 2.9 3.1 2.9 3.5 4.9 2.5 4.8 4.6 5.6 3.9 3.0,41,不平衡二因素方差分析SAS程序的输入:,42,不平衡二因素方差分析SAS程序输出结果:,结论:GLM按两种方法输出1、按有交互作用输出2、按主效应输出。,