重复测量方差分析.ppt
方差分析,重复测量设计,单因素方差设计只涉及一个处理因素该因素至少有两个水平,有两水平时:称为两样本均数比较两水平以上:称多个样本均数比较的方差分析,知识点:多重比较时有特定的方法,不能用两样本均数比较,此时容易加大类错误(把本无差别的两个总体判为有差别)的概率。,为什么?Why?,举例:,有4个样本均数,如果用t检验每次比较选0.05,不犯错误的概率16次不犯错误(1)6总的水准:1(1)6 1(10.05)6=0.26比0.05大多了!比较的次数越多犯错误的概率越大!把无差别的结果判为有差别,完全随机设计,如比较4种饲料对小鼠体重增加量的影响,处理因素是饲料,有4个水平(不同饲料)。完全随机设计是将n个小鼠随机分为4组。,随机区组设计,是将n个小鼠按出生体重相近的原则,4个一组相配(称为区组)后,再随机分不同的水平组,称为两因素方差分析。,应用条件,1.各样本是相互独立的随机样本,均服从正态分布。2.相互比较的各样本的总体方差相等,具有方差齐性。,重复测量设计,一、重复测量资料的数据特征当对同一受试对象在不同时间重复测量次数p3时,称为重复测量设计或重复测量数据。,图例,重复测量资料,是同一受试对象的同一观察指标在不同时间点上进行多次测量所得的资料,常用来分析该观察指标在不同时间点上的变化。有时是从同一个体的不同部位(或组织)上重复测量获得的指标的观测值。,目的:就是比较不同时间点动态变化趋势的特征,问题?,想一想?同一观察单位具有多个观察值,而这些观察值来自同一受试对象的不同时点(部位等),这类数据间往往有相关性存在,违背了方差分析要求数据满足独立性基本条件。,在这种情况下:,若使用一般的方差分析,就不能充分揭示出内在的特点,有时甚至会得出错误结论。,所以重复测量资料需要采用专门的统计分析方法,该方法是近代统计学研究的热点之一。,实际中:重复测量资料比独立资料更多见。,临床研究中,需要观察病人在不同时间的某些生理、生化或病理指标的变化趋势,研究不同时间或疗程的治疗效果。流行病学研究中,观察队列人群在不同时间上的发病情况。研究不同职业、性别人群实施某种控制后,不同时间的多次效果考察。卫生学研究中,纵向观察儿童生长发育规律等,不同地区和环境营养状况。,提醒大家,重复测量数据在医学研究中十分常见,在医学类杂志上约占四分之一,而且统计表达和分析误用情况严重。,主要优点,减少样本含量控制个体变异非实验因素(干扰因素),重复测量设计与随机区组设计的区别?,1.随机区组设计要求每个区组内实验单位彼此独立,区组号 A营养素 B营养素 C营养素 1 50.10 58.20 64.50 2 47.80 48.50 62.40 3 53.10 53.80 58.60 4 63.50 64.20 72.50 5 71.20 68.40 79.30 6 41.40 45.70 38.40 7 61.90 53.00 51.20 8 42.20 39.80 46.20,表 A、B、C 3种营养素喂养 小白鼠所增体重(克),处理因素只能在区组内随机分配每个实验单位接受处理是不同的见左表:,2.重复测量设计区组内实验单位彼此不独立,见表12-3,但同一受试的血样重复测量结果是高度相关的,见表12-6:,提示:分析存在一定的复杂性。,二、重复测量资料分类repeated measurement data,单变量重复测量方差分析 多变量重复测量方差分析,单变量重复测量方差分析,1.单组重复测量指同一组内(或接受同一种处理)的多个受试者,在多个时间点上的反应变量所作的测量,又称为单变量重复测量。,2.多组重复测量(多组并不等于多因素),指将受试者按处理的不同水平分为几个组,对这些组内的每一受试者,都在不同时间点对他们的反应变量进行测量。,表3.1(余松林),1.单组重复测量数据方差分析2.两组重复测量数据方差分析,单变量重复测量方差分析,三、重复测量资料分析的前提条件和基本步骤,1.前提条件:首先要求样本是随机的,除了满足一般方差分析条件外,特别强调满足协方差阵(covariance matrix)球形性。,sphericity,概念:,协方差阵的球对称性是指该对角线元素(方差)相等、非主对角线元素(协方差)为零,若球对称性得不到满足,方差分析的F值是有偏的,会增大类错误的概率,2.用Mauchly法检验协方差阵的球形性质,如果P值大于,说明协方差阵的球对称性质得到满足。否则,必须对与时间有关的F统计量的分子和分母自由度进行调整,减少类错误的概率。调整系数为:(读:epsilon),3.自由度常用调整方法,Greenhouse-Geisser 法,简称:G-G法Huynh-Feldt 法,简称:H-F法Lower-bound法,简称:L-B下界法以上前两种方法较复杂,采用软件计算。,4.举例:单组重复测量数据的方差分析,观察10名慢性乙型肝炎患者治疗前、治疗12周、24周、36周四个时间点上谷丙转氨酶(ALT)水平的变化趋势,结果见下表,试进行统计推断。,分析:数据结构上与完全区组设计相似但实质不同,各观测点时间顺序是固定的,不能随机分配;不同观测点数据彼此不独立或不完全独立,存在一定的相关性。,SAS结果中包括偏相关阵,例题 1.建立假设,确定检验水准0.01,2.进行球对称性检验,球对称性通常采用Mauchlys test检验标准来判断,3.调整时间点F值的自由度调整原则:,当资料满足“球对称”(Sphericity)条件时(P),不作调整。当资料不满足“球对称”条件时(P),时间点间F值的自由度需要调整。常用的调整方法,4.计算F值,球对称性通常采用Mauchlys test检验来判断,其结果按0.1水准检验,不满足球对称性,对系数进行校正,其结果如下:,结果显示:治疗前与治疗后不同时间转氨酶平均水平不同。,5.单组重复测量方差分析数据结构,6.基本程序格式,Nouni 不打印输出单变量分析结果Printe 产生Mauchly 球性检验的统计量2、P值,分析:单组重复测量数据分析的缺陷只能分析观察对象的观测值在不同时间点的差别。,专业认为:不同时间点上的观测值变化可能是“处理”的作用,也可能是患者病情的自然变化,与“处理”无关,如果要分析“处理”效应,必须设立一个平行对照组,通过组间差别的大小说明“处理”组效应的大小。两独立样本重复测量设计是将N个受试对象随机地等分两组,一组作为实验组,另一组作为对照组。,为研究国产某药品与同类型进口药品对慢性乙型肝炎患者谷丙转氨酶(ALT)水平的影响,将20名慢性乙型肝炎患者随机分为两组,一组服用国产药作为实验组,一组服用进口药作为对照组。对每一患者在治疗前、治疗后12周、24周、36周重复4次测量ALT水平,实验结果见下表。问两种药物对慢性乙型肝炎患者的ALT水平影响是否不同?,5.举例:两组重复测量数据方差分析,表,国产药,进口药,分析结果,同一患者重复测量值就是组间差异患者之间的个体差异就是组内误差,两样本重复测量数据方差分析结果,程序如下,两组重复测量数据结构,相关分析结果,球对称性检验结果,方差分析结果,结果显示汇总,总结论为:不同药物对ALT水平未见不同,但两药物在不同时间点ALT有差别,药物与时间的交互作用无意义。,问题?,从以上分析可见:无论单组或两组分析,我们仅算出总的有差别,两两比较未知的?分析方法与一般方差分析不同。,Contrast(1)产生不同水平间同括弧内指定的参考水平对比检验Summary 定义每个对比组生成方差分析表,后多个重复测量时间点与前第1时间点比,原程序如下:,结果分析,两组比较数据分析,所关注的结果如下,Contrast(1)结果比较结构,有时试验仅对先后两个时间点的比较感兴趣,也希望比较水平1与2、2与3、3与4比可用选择项profile,程序如下:,proc glm data=SASfeng.p178;model time0 time12 time24 time36=A/nouni;repeated time profile/printm summary;run;,提示:显示不同水平比较时的结构,显示不同水平比较时的结构,当兴趣在于1个水平与以后的所有水平的比较时,可选helmert,.;repeated time helmert/printm summary;.;,小结:两两比较参数选择,repeated time?/?m summary;,实习六教材P125 例题46 P129 习题4,1.重复测量数据的主要特征是什么?2.重复测量SAS数据录入结构?3.球对称性检验?4.不同水平间与不同组间比较选项?5.推断结论?,两组,一组给予曲明片十模拟曲明胶囊,另一组给予曲明胶囊十模拟曲明片。所有患者每天坚持服药,共服药6个月(24周),受试期间禁用任何影响体重的药物,而且受试对象行为、饮食及运动与服药前的平衡期均保持一致。分别于平衡期(0周)、服药后的8周、16周、24周测定肥胖患者的体重(kg)得表9-13的资料。,例题 为研究减肥新药盐酸西布曲明片和盐酸西布曲明胶囊的减肥效果是否不同,以及肥胖患者服药后不同时间的体重随时间的变化情况。采用双盲双模拟随机对照试验,将体重指数BMI27的肥胖患者40名随机等分成,表9-13,可以看出重复测量资料中同一受试对象(看成区组)的数据高度相关,无论哪位受试对象服用曲明片剂或是胶囊,其服药后8周、16周和24周的体重均和前面时间点(含服药前的0周)的体重相关。不同时点数据其相关性较强。,重复测量资料方差分析的基本步骤,分为三步:,计算检验统计量:使用统计软件进行计算结果如下:,确定P值,做出推断结论:,根据专业知识和假设检验,直接由计算机所给 P值做出推断结论。,按=0.05水准,减肥药剂型k(片剂和胶囊),剂型k与时间i的交互效应ki均不拒绝H0,无统计学意义,还不能认为曲明不同剂型的减肥效果不同,也还不能认为剂型k与时间i间有交互效应。而时间因素i拒绝H0,接受H1,有统计学意义,可认为服用减肥药盐酸西市曲明前后不同时间(8周、16周和24周)的平均体重不全相同。,重复测量资料方差分析的前提条件,重复测量资料的方差分析,除了满足一般方差分析的条件外,还要满足协方差阵的球形性或复合对称性。若条件不能满足,F值有偏性,通常采用Mauchly检验来判断,通过软件选参数计算。,校正后的结果:,两组重复测量数据结构,SAS程序,显示该资料不满足球对称性,参看校正结果。,结果表明经G-G和H-F调整后,按0.05检验水准,A(不同药物)和A与TIME(时间)无统计学意义,后者无交互作用,而时间因素间有统计学意义。,例4 用丹参注射液治疗7例慢性肾功能衰竭患者,治疗前后不同时间各患者的血尿素氮(BUN)的变化,如表所示。试比较治疗前后不同时间各患者血尿素氮的变化是否不同?,表4-5 丹参注射液治疗慢性肾衰患者 不同时间的BUN(mg/dl)变化 治 疗 后不同患者 治疗前 第2周 第4周 第6周 1 60.7 41.0 34.5 36.2 2 65.2 44.7 41.2 39.4 3 66.3 42.4 40.5 37.7 4 67.1 49.1 43.3 40.2 5 62.8 38.5 40.1 35.8 6 72.5 52.3 44.6 37.6 7 58.0 35.0 38.6 37.2,题意分析:本题要探讨治疗前后“不同时间”,又要研究“不同患者”的血尿素氮的变化,是属于按两因素分组的多个均数间比较的重复测量方差分析,首先在Insight中建立数据集,本题变量FL为不同治疗时间的分组变量,如治疗前为1,治疗后第2周为2,第6周为4。X为BUN的测定值。建好结构录入数据,格式如图4-17所示,数据集名为L2,存入SASUSER库中,备用。,如图所示:,