华北理工卫生统计学教案07方差分析.docx
摘要第七章方差分析授课题目(章、节)第一节方差分析的用途和基本思想第二节完全随机设计资料的方差分析【目的要求】掌握:方差分析的用途及基本思想;完全随机设计方差分析总变异和自由度的分解。熟悉:方差分析的应用条件。了解:完全随机设计方差分析计算过程。【重点】1.方差分析的用途及基本思想;2.完全随机设计方差分析中总变异的分解。【难点】方差分析的基本思想。内容【本讲课程的引入】通过上一章的学习,同学们了解了假设检验中的常用方法之一一t检验,t检验的用途之一就是可以用于两个小样本均数的比较,科研和实际工作中收集的资料经常会涉及到两个以上均数的比较,比如例87。该例中的问题就是需要进行三个均数的比较,如何分析呢?能否采用t检验进行三次两两比较呢?对此我们通过另一个例子来分析一下能否这样做。从已知正态总体N(10,52)进行随机抽样,共抽取10组样本,每组样本含量均为20,对每组样本均数进行两两比较的t检验,需比较45次。分析结果显示:若=0.05,则在45次比较中,发现有5次为拒绝H。,差别有统计学意义,认为这些样本的总体均数不等。从理论上讲10个样本均来自同一正态总体,应当无差别,但我们用两样本比较的t检验时,规定a=0.05,其实际犯第一类错误的概率为5/45=0.11,显然比所要控制的0.05要大。由此提示:两个以上样本均数的比较,若采用t检验进行两两比较,则会增加犯一类错误的概率。一般两个以上样本均数的比较,可以采用方差分析。【本讲课程的内容】笫八章方差分析一Analysisofvariance(ANOVA)笫一节方差分析的用途和基本思想强调用途和条 件一、方差分析的用途及条件(一)方差分析的用途1 .两个及其两个以上样本均数的比较2 .回归方程的线性假设检验(二)方差分析的应用条件(均数的比较)1.正杰2方差齐与t检验相同二、方差分析的基本思想(一)方差、均方S?=E(x工)2v*方差也称均方(meanofsqiCIre-MS)MS=(xx)2/V(二)方差分析的基本思想把全部观察值之间的变异一总变异按设计和需要分解成两个或多个组成部分,每一部分变异都来源于一定因素的作用,其中总有一部分变异来源于随机误差的作用,通过对误差变异与其余各部分变异的比较,得出F值作出推断结论。总变异的分解:总变异(totalvariance)用方差S2也就是均方MS表示,各部分变异也用MS表示。总变异的分解也就是对MS中的Z(X-W)2与V分解,F值也就是各部分MS与误差MS的比值。例7-1.总变异:三个组共36只大白鼠喂养前后体重的差值大小不等;该变异既包含随机误差,又包含了三组饲料含钙剂量即处理的不同。总变异分解为:两部分组间变异(variationbetweengroups)-饲料中含钙量不同及误差作用。组内变异(variationwithingroups)个体差异及随机误差的作用。SSM=SSMH+SS«1内U4=UMK+Ufll内MS通M=SSarUmMS俎内=SS3Uq内F=MS出间/MS国内尸VF%(402)、p>,不同处理因素(三种饲料)的作用相同尸星凡小2)、PWa,不同处理因素(三种饲料)的作用不同。第二节完全随机设计资料的方差分析单因素方差分析.完全随机设计资料的方差分析用于完全随机设计(成组设计)的多个样本均数的比较。该分析中仅涉及一个研究因素,此因素有K(K22)个水平或状态。无论是实验还是观察,研究目的都是比较不同水平下,各组平均值之间的差别是否具有统计学意义,这种多个样本均数的比较都可用单因素方差分析。例7T一、完全随机设计资料方差分析中总变异的分解两部分:组间变异(误差的作用)组内变异(处理因素+误差的作用)二、分析过程建立假设:H0:多个总体均数均相等。讲授举例讲授注意Hl的建立H1:多个总体均数不等或不全相等确定检验水准:a表7-2完全随机设计方差分析的计算公式F=MS汨"MS俎内确定P值并作出推断结论:以分子的自由度V组间=2为vl,分母的自由度V组内=33为V2,查附表3.1,方差分析用F界值表,Fo.o5(2.34)=3.28,Fo.om2.34)=5.29,F=31.36>Fo.oi(2.33)=5.29,P<0.01o在=0.05水准上拒绝Ho,接受H1可以认为三个总体均数不全相同。注意:以上结论表明,总的说三个总体均数有差别,但并不能说明任何两个均数均有差别。只能说可能至少有两组的体重差值有差别,可能有的组间没有差别。要了解哪些组均数间有差别,哪些组均数间没有差别,需要进一步做两两比较。【本讲课程的小结】【本讲课程的作业】1 .方差分析与t检验的区别与联系。2 .方差分析的基本思想。3 .完全随机设计方差分析如何进行总变异的分解?4 .预习本章第三节、第四节。摘要第七章方差分析第三节随机区组设计资料的方差分析授课题目(章、节)第四节多个均数间的多重比较第五节方差分析的前提条件与变量变换【目的要求】掌握:随机区组设计资料的方差分析、多个样本均数间的多重比较的意义和方法。熟悉:随机区组设计资料的方差分析、SNkq检验的分析过程和结果。了解:随机区组设计、多个方差的齐性检验、变量变换。;了解:【重点】1.随机区组设计资料方差分析总变异的分解。2.多个样本均数间的多重比较。【难点】多个样本均数间的多重比较方法。内容【本讲课程的引入】在上一次课的学习中,同学们已经了解了方差分析的用途与适用条件、方差分析的基本思想。方差分析的基本思想就是将全部观察值之间的变异一总变异按设计和需要分解成两个或多个组成部分,每一部分变异都来源于一定因素的作用,其中总有一部分变异来源于随机误差的作用,通过对误差变异与其余各部分变异的比较,得出F值作出推断结论。而总变异的分解是以设计类型为依据的,这是不同设计类型资料方差分析的区别所在,也是学习方差分析应该重点掌握的主要内容。在上一次课中同学们了解了完全随机设计资料方差分析时总变异分解为两部分,是因为该设计类型涉及的研究因素只有一个,那么其他设计类型的方差分析总变异又是如何分解的呢?今天这次课将介绍随机区组设计以及析因设计类型资料的方差分析。【本讲课程的内容】第七章方差分析笫三节RS机区组设计资料的方差分析随机区组设计的多个样本均数的比较可用多个样本均数比较的两因素方差分析。两因素是指主要的研究因素和配伍组(区组)因素,研究因素有k个水平,共有n个区组。一、随机区组设计(randomizedblockdesign)随机区组设计亦称配伍组设计,是配对试验的扩大。该设计是将受试对象先按配比条件(如动物的性别、体重,病人的病情、性别、年龄等非实验因素)配成b个区组,每个区组有k个受试对象,再按随机化原则分别将各区组中的受试对象、分配到各个处理组。该类设计是按配比条件将受试对象配成区组,从而排除了诸多非处理因素对实验的影响,保证了各组间的可比性,减少了抽样误差,同时增加了区组信息,可以减少样本含量,提高统计效率。该设计类型包含两个因素:区组因素、处理因素。例7-2:为探索丹参对肢体缺血再灌注损伤的影响,将30只纯种新西兰实验用大白兔,按窝别相同、体重相近划分为10个区组。每个区组间3只大白兔随机采用A、B、C三种处理方案即在松止血带前分别给予丹参2ml/kg、Iml/kg、生理盐水2mlkg在松止血带前及松后1小时分别测定血中白蛋白含量(gL),算出白蛋白减少量如下表77,问A、B两方案分别与C方案的处理效果是否不同?二、随机区组设计方差分析总变异的分解三部分一一处理组间变异:处理因素不同水平之间的影响及随机误差。区组间变异:区组因素不同水平之间的影响及随机误差。误差变异:误差的作用SS*=SSa<+SS区=+SSUjt=U处+Uft+U««MS处W=SS纭</U处.MS区铝=SS区,/口EttF÷<5=MSft,MS处理产区组=MSsMS区里产及理值的大小表明处理因素不同水平之间的差异是否有统计学意义,尸区级表明区组因素不同水平之间的差异是否有统计学意义。三、随机区组设计方差分析的过程例8-2建立假设:分别针对处理因素、区组因素假设对于处理组:H0:三个总体均数全相等,即UI=2=P3Hl:三个总体均数不等或不全相等对于区组:HO:十个总体均数全相等H1:十个总体均数不等或不全相等确定检验水准:。尸仕理=MS仕理/MS深是尸区出二MS区姐/MS误确定P值并作出推断结论以分子的自由度V处理=2为vl,分母的自由度V误差:18为V2,查附表3,方差分析用F界值表,FO.05(2,18)=2.62,F处理=32.639>F0.05(2,18)=2.62,P<0.05o在=0.05水准上拒绝H0,认为三种方案的处理有差别.以分子的自由度V区组=9为vl,分母的自由度V误差=18为V2,查附表3,方差分析用F界值表,F0.05(9,18)=2.00,F处理=0.825<F0.05(9,18)=2.00,P>0.05o在a=0.05水准上不拒绝H0,还不能认为十个区组间有差别.笫四节多个样本均数间的多重比较一、多个样本均数间多重比较的意义1 .意义:方差分析结果拒绝了原假设,其结论是:多个均数之间总的说来有差异,但究竟哪些组之间有差异、哪些组之间没差异并未明了,若要明确多个均数之间的关系,需进行多个均数间的多重比较。2 .比较的两种情况(1)检验某几个特定的总体均数是否相等:其HO为部分相等,即某几个组所对应的总体均数相等。多为研究者对实验结果有一个大致的设想,在设计阶段就根据研目的或专业知识决定了某些均数间的两两比较,常见于事先有明确假设的证实性实验研究。Dunnett-t检验等。(2)检验全部k个总体均数是否相等:其HO为假设所有各组所对应的总体均数都相等,即IIl=U2=u3=uk。例如在研究设计阶段对实验结果知之不多的探索性研究,或经数据结果的提示后,才决定的多个均数间的两两比较,这类情况往往涉及到每两个均数的两两比较。SNK-q检验等。二、多个样本均数间的两两比较-SNK-q检验H0:任两对比组的总体均数相等,即UA=UBH1:任两对比组的总体均数不等,即AB第五节方差分析的前提条件与变量变换方差分析的前提条件为各样本是相互独立的随机样本,均服从正态分布且各样本的总体方差相等。在进行方差分析时,实际资料有时不能完全满足任何观察值都独立地来自具有等方差正态总体的假定,此时进行方差分析时,可能导致F值偏大,从而有增大第一类错误的危险。在样本例数较多的情况下,数据可看成近似正态分布,此时,方差分析对总体的非正态性并不苛求;当每组样本例数相等时,方差分析对于方差的非齐性并不苛求,故在方差分析时,最好采用每组例数相等的平衡设计方案。一、方差齐性检验LBartIett检验:要求资料正态分布2. Levene检验二、变量变换(一)目的:1 .使各组达到方差齐性;2 .使资料转换为正态分布,以满足方差分析和t检验的应用条件。通常情况下,一种适当的函数转换可使上述两个目的同时达到。3 .直线化。常用于曲线拟合。常用的变量变换方法:(二)常用的变量变换方法:1 .对数变换:即将原始数据X的对数值作为新的分析数据。常用于:2 .平方根变换:即将原始数据X的平方根作为新的分析数据。常用于:3 .倒数变换:即将原始数据X的倒数作为新的分析数据。常用于:资料两端波动较大的资料,可使极端值的影响减小。4 .平方根反正旋变换:即将原始数据X的平方根反正旋值做为新的分析数据。【本讲课程的小结】今天这次课的主要内容是:随机区组设计资料与多个均数的多重比较。要求同学们掌握随机区组设计资料的方差分析总变异和自由度分解为三部分:处理组间、区组间、误差,相应的F值有两个:F处理与F区组,分别说明处理组间与区组间的差异有无统计学意义。掌握多个样本均数间的多重比较的意义和方法,熟悉SNkq检验的分析过程和结果,了解多个方差的齐性检验方法以及变量变换的意义和方法。【本讲课程的作业】1 .随机区组设计方差分析如何进行总变异的分解?2 .多个均数多重比较的目的与意义。