卫生统计学-卫统9方差分析PPT精选文档课件.ppt
26.03.2023,1,Analysis of variance,第九章,方差分析,统计与流行病学教研室,26.03.2023,2,第一节 方差分析的基本思想和应用条件第二节 完全随机设计的方差分析第三节 随机区组设计的方差分析第四节 多个样本均数的两两比较第五节 交叉设计的方差分析 第六节 析因设计的方差分析第七节 重复测量设计的方差分析,26.03.2023,3,方差分析(analysis of variance,ANOVA)是20世纪20年代发展起来的一种统计方法,最早由英国著名统计学家R.A.Fisher提出,故又称F检验(F test),用于多个 均数的比较。,第一节 方差分析的基本思想和应用条件,26.03.2023,4,方差分析的基本思想,方差分析的含义方差是描述研究对象变异程度的一种指标方差分析是一种假设检验的方法,就是对变异的分析方差分析的基本思想根据资料的设计类型(即变异的不同来源),将全部观察值之间的变异(总变异)分解为两个或多个部分,除随机误差外其余每个部分的变异都可由某个因素的作用加以解释,通过比较不同变异来源的均方,借助F分布作出统计推断,以了解某因素对观察指标是否有影响或某因素是否有效应。,26.03.2023,5,方差分析的基本思想,【例9-1】某研究者为研究煤矿粉尘作业环境对尘肺的影响,将24只Wistar 大鼠随机分到甲、乙、丙三个组,每组8只,分别在地面办公楼、煤炭仓库和矿井下染尘,12周后测量 大鼠全肺湿重(g),数据见表9-1。,26.03.2023,6,样本均数的差异,可能有两种原因所致:可能由随机误差所致,随机误差包括两种成分:个体间的变异和测量误差两部分;可能是由于各组所接受的处理不同,不同的处理引起不同的作用和效果,导致各处理组之间均数不同。,26.03.2023,7,本研究关心三组大鼠的全肺湿重有无差别?即三个处理组(不同环境)总体均数之间是否相等。从表中所有大鼠的全肺湿重测量值,可以分析出三种不同的变异:总变异组间变异组内变异,26.03.2023,8,总变异的分解,组间变异,总变异,组内变异,26.03.2023,9,总变异24只大鼠的全肺湿重大小各不相等,它们之间的变异称为总变异。其大小可以用每个观察值与总均数的离均差平方和来表示,称为总离均差平方和SS总,26.03.2023,10,组间变异三组之间的各样本均数也大小不等,它们之间的变异称为组间变异。可以用各处理组均数与总均数的离均差平方和来表示,称为组间离均差平方和SS组间,26.03.2023,11,组内变异(variation within groups)各组内观察值亦大小不等,这种变异称为组内变异,组内变异仅反映随机误差,故又称误差变异。其大小可用各组内每个测量值与该组均数的离均差平方和表示,记为SS组内。,26.03.2023,12,数理统计可以证明,上述三种变异及相应自由度的关系为:以上各离均差平方和均与自由度有关,为了便于比较,可将各离均差平方和除以相应的自由度,得各自的均方(mean square,MS)均方MS反映平均变异的大小,26.03.2023,13,将组间均方除以组内均方即得方差分析的统计量F 理论上若处理因素无效应,F=1 反之,若处理因素有效应,则组间变异不仅反映随机误差,还包括处理因素的效应,此时组间均方应明显大于组内均方,即F1。,26.03.2023,14,F值要大到何种程度才有统计学意义呢?或者说,F值要大到何种程度才能认为各组均数间的差异是由处理因素引起而非随机误差呢?可以通过查F界值表,根据P值作出统计推断在附表7(F界值表)中,纵标目为组间自由度,横标目为组内自由度,表中给出了 时供方差分析时用的单侧F界值,用 表示。,26.03.2023,15,26.03.2023,16,结果判断若,则,按 水准拒绝H0,接受H1,差别有统计学意义,可以认为各总体均数不等或不全相等(处理因素有效应)反之,则差别无统计学意义,尚不能认为各总体均数不等或不全相等(尚不能认为处理因素有效应)。,26.03.2023,17,方差分析的基本思想将所有观察值之间的变异(称总变异)根据离均差平方和划分的原理,按设计和需要分解成两个或多个部分。每一部分变异都反映了研究工作中某种特定的内容(如某种处理因素的作用、随机误差的影响等),通过对平均变异(MS)的比较,做出相应的统计判断。,26.03.2023,18,方差分析的应用条件任何统计分析方法都有其适用条件,对于方差分析来说,理论上要求数据满足以下条件:各样本须是相互独立的随机样本(独立性)各样本来自正态分布总体(正态性)各总体方差相等(方差齐性),26.03.2023,19,第二节 完全随机设计的方差分析,完全随机设计(completely random design)又称成组设计。在实验研究中,按随机化原则将受试对象随机分配到某一研究因素的多个水平中去,然后观察实验效应;在调查研究中,按一个研究因素的不同水平分组,比较各组的效应。目的都是推断不同水平下各组均数之间的差别是否有统计学意义。这种完全随机设计的多个样本均数的比较可用完全随机设计的方差分析,26.03.2023,20,26.03.2023,21,26.03.2023,22,26.03.2023,23,第三节随机区组设计的方差分析,随机区组设计(randomized block design)又称配伍组设计,是配对设计的扩展。其设计方法是将全部受试对象按某种或某些特征分为若干个区组,使每个区组内研究对象的特征尽可能接近,然后分别使每个区组内的观察对象随机地接受研究因素某一水平的处理。,26.03.2023,24,变异的分解,26.03.2023,25,随机区组设计总变异SS总和处理组间变异SS组间的计算与完全随机设计的方差分析相同SS区组 的计算,26.03.2023,26,数理统计上可以证明,随机区组设计的总变异和自由度可以分解为三部分:用k表示处理组数,b表示区组数;实验观察值下标i(i=1,2,k)表示组别,下标j(j=1,2,b)表示区组序号。,26.03.2023,27,26.03.2023,28,随机区组设计资料的方差分析的基本步骤,26.03.2023,29,26.03.2023,30,26.03.2023,31,26.03.2023,32,随机区组设计的方差分析 总变异 和完全随机设计的方差分析相比,误差减小了,检验效率提高了。,处理组间变异,区组间变异,误差,26.03.2023,33,第四节 多个样本均数的两两比较,如果要进一步判断三组中究竟哪两组总体均数有差别,需要在前述方差分析的基础上进行多个样本均数的两两比较,而不能直接用t检验进行比较。,26.03.2023,34,如果将上述资料用t检验进行两两比较,需进行3次t检验。若检验水准为0.05,则每次检验判断正确的概率为0.95,根据概率乘法法则,全部判断正确的概率为0.953=0.857,犯类错误的概率为 1-0.857=0.143,远远大于0.05的检验水准。,26.03.2023,35,介绍常用的两种方法:SNK(Student-Newman-Keuls)检验也称q检验,适用于探索性研究,对任意两个样本均数都进行检验。LSD-t(least significant difference)最小显著性差异检验适用于某一对或某几对在专业上有特殊意义的均数间的比较,如多个处理组与对照组的比较,或某几个处理组间的比较,一般在设计阶段确定哪些均数需进行多重比较。,26.03.2023,36,SNK-q 检验 检验统计量q的计算公式为:,式中 为两个对比组的样本均数,是方差分析中的误差均方(或组内均方),为两对比组的样本例数。v误差 为方差分析中误差均方的自由度。,26.03.2023,37,26.03.2023,38,26.03.2023,39,26.03.2023,40,3.确定P值,做出统计推断 q界值不但考虑自由度,而且考虑组数a,即任意两对比组包含的组数。以组数a 和 查附表8(q 界值表)。,26.03.2023,41,LSD-t检验适用于某一对或某几对在专业上有特殊意义的均数间的比较,如多个处理组与对照组的比较,或某几个处理组间的比较,一般在设计阶段确定哪些均数需进行多重比较。检验统计量t值的计算公式为:,26.03.2023,42,26.03.2023,43,26.03.2023,44,26.03.2023,45,第五节 交叉设计的方差分析,交叉设计(cross-over design)医学研究中多用于止痛、镇静、降压等药物疗效的研究,可分为两阶段交叉设计和多阶段交叉设计。两阶段交叉设计方差分析的变异分解为:,26.03.2023,46,26.03.2023,47,26.03.2023,48,交叉设计的方差分析 总变异,处理组变异,个体变异,误差,阶段变异,26.03.2023,49,26.03.2023,50,从表9-13可知,两个阶段之间差异无统计学意义,尚不能认为A、B两种方案治疗高血压的疗效有差别。,26.03.2023,51,【知识点9-5】二阶段交叉设计方差分析的总变异可以分解为处理组间变异、阶段间变异、个体变异和误差变异四部分交叉设计可以采用完全随机设计或配对设计方法来安排受试对象 交叉实验的处理是单因素,但影响实验结果的因素还有非人为控制的受试者间的个体差异和试验阶段这两个因素。因此,交叉实验实际上是一个实验因素和两个重要的非实验因素的多因素试验。,26.03.2023,52,第六节 析因设计的方差分析,26.03.2023,53,26.03.2023,54,析因设计(factorial design)资料的方差分析包含主效应分析、交互效应分析和单独效应分析3个层次。单独效应(simple effect)是指其他因素的水平固定时,同一因素不同水平间的差别。主效应(main effect)是指某一因素各水平间的平均 差别。交互效应(interaction)是指当某因素的各单独效应随另一因素水平的变化而变化时,则称这两个因素间存在交互效应。,第六节 析因设计的方差分析,26.03.2023,55,2.1 2.2 2.0 1.3 1.2 1.1 0.8 1.2 1.0 0.8 0.9 0.7,A因素(2水平)A1 A2,B因素(2水平)B1 B2,22(或22)析因设计是析因设计中最简单的一种,表示有2种处理因素,每种处理因素有2个水平,有4种处理组合:,A1B1 A1B2 A2B1 A2B2,26.03.2023,56,变异分解,26.03.2023,57,26.03.2023,58,两因素析因设计资料方差分析的基本步骤,26.03.2023,59,26.03.2023,60,26.03.2023,61,26.03.2023,62,A、B两因素交互效应:AB=(A1B1A2B1)(A1B2 A2B2)/2=(1.1 0.4)/2=0.35。,26.03.2023,63,知识点析因设计是将两个或多个实验因素的各水平进行交叉分组的方法,其被广泛应用于需要分析交互效应和选择最佳组合的实验研究中 析因设计不但可以分析主效应和交互效应,也可以分析单独效应,故效率较高。但当因素太多时,所需的样本含量会很大对析因设计资料,应先分析交互效应。若交互效应有统计学意义,应进一步分析各因素的单独效应;反之,若交互效应无统计学意义,则因素间的作用相互独立,分析某一因素的作用只需考察该因素的主效应,26.03.2023,64,第七节 重复测量设计的方差分析,重复测量设计(repeated measurement design)是指在给予一种或多种处理后,在多个时间点上重复测量同一受试对象某一观察指标的值。重复测量研究的目的是探讨同一研究对象在不同时点上某指标的变化情况。该设计在临床试验和流行病学研究中较常见,如药效研究中观察给药后不同时点血药浓度。,26.03.2023,65,重复测量设计与随机区组设计的区别:重复测量设计中的处理因素在受试对象间为随机分配,但受试对象内(看成区组)的各时间点是固定的,不能随机分配。随机区组设计资料中每个区组内的受试对象彼此独立,处理只在区组内随机分配,同一区组内的受试对象接受的处理各不相同。,26.03.2023,66,重复测量设计中同一受试对象的数据彼此不独立,无论患者采用哪种麻醉诱导方法,同一个患者的收缩压在T0、T1、T2、T3、T4这5个时相的重复测量结果存在某种程度的相关性。,26.03.2023,67,26.03.2023,68,两因素重复测量的方差分析变异分解,受试对象间变异,个体间误差变异,时间因素变异,处理组间变异,受试对象内变异,处理和时间交互作用变异,个体内误差变异(重复测量变异),总变异,26.03.2023,69,26.03.2023,70,重复测量设计方差分析的前提条件需满足一般方差分析的条件,即要求资料满足正态性和方差齐性还应满足协方差阵(covariance matrix)的球形性(sphericity)或复合对称性(compound symmetry),球对称性通常采用Mauchly检验(Mauchlys test)来判断。,26.03.2023,71,如果资料不满足球对称性,可用以下方法:用“球对称”系数乘以受试对象内各变异的自由度,然后查F界值表作出统计推断。“球对称”系数常用的估计方法Greenhouse-Geisser、Huynh-Feldt和Lower-bound三种方法。采用多变量方差分析的方法,26.03.2023,72,26.03.2023,73,本节要求掌握方差分析的基本思想和应用条件熟练应用完全随机设计的方差分析、随机区组设计的方差分析及多个样本均数的两两比较了解交叉设计的方差分析、析因设计的方差分析和重复测量的方差分析,