方差分析-最常用的统计学分析.ppt
《方差分析-最常用的统计学分析.ppt》由会员分享,可在线阅读,更多相关《方差分析-最常用的统计学分析.ppt(60页珍藏版)》请在三一办公上搜索。
1、方差分析,第五节 多个方差的齐性检验,第二节 单因素方差分析,第三节 双因素方差分析,第四节 多个样本均数间的两两比较,第一节 方差分析的基本思想,第六节 变量变换,第4章方差分析,第1页,第四章 方差分析,学习要求:1。掌握方差分析的基本思想;2。掌握单因素、双因素方差分析的应用条件、意义及计 算方法;3。熟悉多个均数间两两比较的意义及方法;4。了解方差齐性检验和t检验的意义及方法;5。熟悉变量变换的意义和方法。,第4章方差分析,第2页,第一节 方差分析的基本思想,一、方差分析的用途及应用条件方差分析(analysis of variance,缩写为ANOVA)是常用的统计分析方法之一。其应
2、用广泛,分析效率高,节省样本含量。主要用途有:进行两个或两个以上样本均数的比较;可以同时分析一个、两个或多个因素对试验结果的作用和影响;分析多个因素的独立作用及多个因素之间的交互作用;进行两个或多个样本的方差齐性检验等。方差分析对分析数据的要求及条件比较严格,即要求各样本为随机样本,各样本来自正态总体,各样本所代表的总体方差齐性或相等。,第4章方差分析,第3页,二、方差分析的基本思想 处理因素可分为若干个等级或不同类型,通常称为水平。在不同的水平下进行若干次试验并取得多个数据,可以将在每个水平下取得的这些数据看作一个样本。若某个因素有四个水平,每个水平的数据代表一个样本,则获得四个样本的数据。
3、设有k个相互独立的样本,分别来自k个正态总体X1,X2,Xk,且方差相等,即要求检验假设为 此假设的意义为,在某处理因素的不同水平下,各样本的总体均数相等。,第4章方差分析,第4页,1。设某因素有多个水平,即试验数据产生多个样本。由多个样本的全部数据可以计算出总变异,称为总的离均差平方和。即SS总。2。数理统计证明,SS总可以由几个部分构成。单因素方差分析中,SS总由组间变异和组内变异构成。SS总SS组间SS组内。3。组间变异主要受到处理因素和个体误差两方面影响,组内变异主要受个体误差的影响。当H0 为真时,由于处理因素不起作用,组间变异只受个体误差的影响。此时,组间变异与组内变异相差不能太大
4、。,第4章方差分析,第5页,表42 PCNA在三种不同胃组织中的表达结果,第4章方差分析,第6页,4。各种变异除以相应的自由度,称为均方,用MS表示,也就是方差。当H0为真时,组间均方与组内均方相差不大,两者比值F值约接近于1。即 F组间均方组内均方1。5。当H0不成立时,处理因素产生了作用,使得组间均方增大,此时,F1,当大于等于F临界值时,则P0.05。可认为H0不成立,各样本均数不全相等。,第4章方差分析,第7页,三、方差分析的类型1。单因素方差分析(one-way ANOVA)也称为完全随机设计(completely random design)的方差分析。该设计只能分析一个因素下多个
5、水平对试验结果的影响。2。双因素方差分析(two-way ANOVA)称为随机区组设计(randomized block design)的方差分析。该设计可以分析两个因素。一个为处理因素,也称为列因素;一个为区组因素,也称为行因素。,第4章方差分析,第8页,3。三因素方差分析 也称为拉丁方设计(Latin square design)的方差分析。该设计特点是,可以同时分析三个因素对试验结果的作用,且三个因素之间相互独立,不能有交互作用。4。析因设计(factorial design)的方差分析 当两个因素或多个因素之间存在相互影响或交互作用时,可用该设计来进行分析。该设计不仅可以分析多个因素的
6、独立作用,也可以分析多个因素间的交互作用,是一种高效率的方差分析方法。,第4章方差分析,第9页,5。正交试验设计的方差分析 如果要分析的因素有三个或三个以上,可进行正交试验设计(orthogonal experimental design)的方差分析。当分析因素较多时,试验次数会急剧增加,用此设计进行分析则更能体现出其优越性。该设计利用正交表来安排各次试验,以最少的试验次数,得到更多的分析结果。,第4章方差分析,第10页,四、方差分析的基本步骤1。计算总变异:指所有试验数据的离均差平方和。,2。计算各部分变异:单因素方差分析中,可以分出组间变异(SS组间)和组内变异(SS组内);双因素方差分析
7、中,可以分出处理组变异(SS处理),区组变异(SS区组)或称为配伍组变异(SS配伍)及误差变异(SS误差)。,第4章方差分析,第11页,3。计算各部分变异的均方 在方差分析中,方差也称为均方,是各部分的离均差平方和除以其相应的自由度,用MS表示。基本公式为:MSSS。4。计算统计量F值 F值是指两个均方之比。一般是用较大的均方除以较小的均方。故F值一般不会小于1。5。确定P值,推断结论 根据分子1,分母2,查F界值表(方差分析用),得到F值的临界值(critical value),即:如果FF界值,则P0.05,在=0.05水准上拒绝H0,接受H1。可以认为各样本所代表的总体均数不全相等。如果
8、想要了解哪两个样本均数之间有差异,可以继续进行各样本均数的两两比较。,第4章方差分析,第12页,第二节 单因素方差分析,1。特点 单因素方差分析是按照完全随机设计的原则将处理因素分为若干个不同的水平,每个水平代表一个样本,只能分析一个因素对试验结果的影响及作用。其设计简单,计算方便,应用广泛,是一种常用的分析方法,但其效率相对较低。该设计中的总变异可以分出两个部分,即SS总SS组间SS组内。2。常用符号及其意义(1)Xij 意义为第i组的第j个数据。其中下标 i 表示列,j 表示行。(2)意义为将第i组的全部j个数据合计。,第4章方差分析,第13页,(3)将第i组的j个数据合计后平方,再将所有
9、各i组的平方值合计。(4)变异来源 SS总:表示变异由处理因素及随机误差共同所致;SS组间:表示变异来自处理因素的作用或影响;SS组内:表示变异由个体差异和测量误差等随机因素所致。,第4章方差分析,第14页,计算公式,第4章方差分析,第15页,三。计算实例例4.1 科研人员研究细胞增殖核抗原(PCNA)在胃癌组织(A组),胃癌旁组织(B组)及正常胃粘膜组织(C组)中的表达状况。检测结果用表达指数来表示。数据见表42。试分析PCNA在三种胃组织中的表达有无差异。,第4章方差分析,第16页,表42 PCNA在三种不同胃组织中的表达结果,第4章方差分析,第17页,检验步骤及方法建立检验假设H0:PC
10、NA在三种组织中的表达指数相同,123;H1:PCNA在三种组织中的表达指数不全相同。0.05,计算检验统计量F值 由表4-2的数据计算有:校正系数 C(X)2N(874)22728291.70 SS总X2C39236-28291.70=10944.3总N1=27-1=26,第4章方差分析,第18页,组间k-1=3-1=2SS组内SS总SS组间10944.3-8965.98=1978.32,第4章方差分析,第19页,(3)列方差分析表 见表4-3。(4)确定P值 根据0.05,1组间2,2组内24,查附表4,F界值表,得F界值:F0.01(2,24)=5.61。本例F54.39,大于界值F0.
11、01(2,24)=5.61,则P0.01。(5)推断结论 由于P0.01,在0.05水准上拒绝H0,接受H1,差异有统计学意义。可以认为PCNA在三种不同胃组织中的表达指数不全相同。该结论的意义为,至少有两种组织的PCNA表达指数不同。如果想确切了解哪两个组织的PCNA表达指数有差异,可进一步作多个样本均数的两两比较。,第4章方差分析,第20页,表43 方差分析表,第4章方差分析,第21页,第三节 双因素方差分析,一、特点及意义1.特点 按照随机区组设计的原则来分析两个因素对试验结果的影响及作用。其中一个因素称为处理因素,一般作为列因素;另一个因素称为区组因素或配伍组因素,一般作为行因素。两个
12、因素相互独立,且无交互影响。双因素方差分析使用的样本例数较少,分析效率高,是一种经常使用的分析方法。但双因素方差分析的设计对选择受试对象及试验条件等方面要求较为严格,应用该设计方法时要十分注意。该设计方法中,总变异可以分出三个部分:SS总SS处理SS区组SS误差,第4章方差分析,第22页,2.常用符号及其意义:将第i个处理组的j个数据合计后平方,再将所 有i个处理组的平方值合计。:将第j个区组的i个数据合计后平方,再将所有j 个区组的平方值合计。各种变异来源 SS总:总变异,由处理因素、区组因素及随机误差的综合作用而形成。SS处理:各处理组之间的变异,可由处理因素的作用所致。SS区组或SS配伍
13、:各区组之间的变异,可由区组因素的作用所致。SS误差:从总变异中去除SS处理及SS区组后剩余的变异。此变异由个体差异和测量误差等随机因素所致。,第4章方差分析,第23页,计算公式,第4章方差分析,第24页,三、计算实例例4.2 某医院研究五种消毒液对四种细菌的抑制效果。抑制效果用抑菌圈直径(mm)表示。数据见表4-5。试分析五种消毒液对细菌有无抑制作用,对四种细菌的抑制效果有无差异。,第4章方差分析,第25页,表45 消毒液对不同细菌的抑制效果,第4章方差分析,第26页,检验步骤及方法(1)建立检验假设1)对处理因素作用的检验假设 H0:五种消毒液的消毒效果相同,12345;H1:五种消毒液的
14、消毒效果不全相同。0.052)对区组因素作用的检验假设H0:四种细菌的抑菌圈直径相同,1234;H1:四种细菌的抑菌圈直径不全相同。0.05,第4章方差分析,第27页,(2)计算统计量F值 由表45数据计算,有:校正系数 C=(X)2/N=(348)2/20=6055.2SS总X2C67166055.2660.8总N120119处理k1514,第4章方差分析,第28页,区组b1413SS误差SS总SS处理SS区组 660.8 31.3 566=63.5误差(k-1)(b-1)(51)(41)12,第4章方差分析,第29页,误差总处理区组(41)(51)12MS处理SS处理 处理(31.3)47
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 方差分析 常用 统计学 分析
链接地址:https://www.31ppt.com/p-6581980.html