5 SPSS重复测量的统计分析课件.ppt
2022/11/16,1,outline,Part :Introduction(简介)What are repeated measurementsHow are they different Why are they importantPart :Methods(统计分析方法)Repeated measures ANOVA- General Linear Model mixed effects mode1s generalized linear models,GLMs GEEMultilevel Models for Repeated Measurement Data,2022/11/16,2,Part :Introduction重复测量资料(repeated measurements),重复测量资料(repeated measurements)重复测量设计-受试者内设计(within-subject design)是指同一观察对象的某观察指标在相继的不同时间点上进行的多次观察。,2022/11/16,3,Part :Introduction重复测量的数据结构1,固定重复时间 t1t2t3t4t5t6ID1 ID2 ID3 ID4 ,2022/11/16,4,Part :Introduction重复测量的数据结构2,不固定重复时间 ID1 t11 t12 t13 t14 t15 t16 ID2 t21 t22 t23 t24ID3 t31 t32 ID4 t41 t42 t43 t44 t45 t46,2022/11/16,5,Part :Introduction重复测量资料的特点,在相继的不同时间点上进行的多次观察不是随机确定的;重复测量值之间具有相关性-即数据是非独立的。,独立?!非独立数据?!,2022/11/16,6,Part :Introduction重复测量资料的特点,由于重复测量资料不同时点的测量值之间具有相关性,且随机误差分布于不同的层次,其不同于以往我们所熟悉的数据形式独立数据结构。,2022/11/16,7,Part :Introduction重复测量概念的推广,重复测量的概念不仅仅是时间上(temporal)的,也可以推广到空间(spatial)。例如:同一母鼠所生的仔鼠;同一家庭的不同成员;同一患者的两个不同膝关节;同一肿瘤患者的不同肿块;同一条河流的不同采样点。,2022/11/16,8,Part :Introduction非独立数据 (non-independent data),非独立的数据(non-independent data),是指数据中某观察指标(某变量)在个体与个体之间、或同一个体的每次观察间不独立或不完全独立。 非独立性的大小可以用组内相关(intra-class correlation)来度量 。重复测量资料属于非独立数据中的一种。常见的非独立数据:纵向数据(Longitudinal data)、多中心试验数据、遗传学数据等,2022/11/16,9,Part :Introduction重复测量数据、非独立数据,日益重要应用广泛,2022/11/16,10,important,Randomized Controlled TrialNon-randomized Controlled TrialCohort StudyCross-sectional, case-control studyCase SeriesCase Report,Most Reliable,Least Reliable,2022/11/16,11,Annual searches for keyword longitudinal in online citation databases,Widely Use,2022/11/16,12,Part :Introduction重复测量数据、非独立数据组内相关结构,等相关(exchangeable, compound symmetry) 相邻相关(stationary 1-dependence) 自相关(autocorrelation) 非确定相关(unstructured, general structure),2022/11/16,13,Part :Introduction相关结构1,等相关(exchangeable, compound symmetry),2022/11/16,14,Part :Introduction相关结构2,相邻相关(stationary 1-dependence),2022/11/16,15,Part :Introduction相关结构3,自相关(autocorrelation),2022/11/16,16,Part :Introduction相关结构4,非确定相关(unstructured, general structure),2022/11/16,17,Part :Method传统方法及其弊端,对平衡的重复测量资料,分别在各时间点上进行分析。孤立地看待各时点数据,增加I型误差。将各个体的几次不同观察值相加,得到该个体的一个综合值,再进行比较分析(aggregated analysis)。人为地减少误差,它忽略了对不同来源的变异的分析;未考虑观察值在时间上的变化规律,也未考虑其他协变量与时间的交互作用对结果的影响。损失了很多信息。将n个患者的几次不同观察均作为因变量,时间以及其他变量作为自变量,样本含量为 ,拟合线性(或广义线性)模型。将非独立数据当做独立数据看待,增加假阳性。,2022/11/16,18,Part :Method目前常用的统计分析方法(一),重复测量资料的方差分析一般线性模型(general linear model) 前提条件:正态性方差齐独立性协方差阵满足球形条件不满足球形条件:Greenhouse-Geisser校正系数和Huynh-Feldt矫正系数,最小极限矫正系数。,2022/11/16,19,2022/11/16,20,2022/11/16,21,2022/11/16,22,Part :Method目前常用的统计分析方法(一),重复测量资料的方差分析该方法的弊端 球形条件 在很多临床试验中,一般不允许出现交互作用? ? ?不允许出现缺失值时间等距 数据平衡不满足球性检验的资料,当结果与其他方法有差异时,下结论应慎重。,2022/11/16,23,Part :Method目前常用的统计分析方法(一),重复测量资料的方差分析不等距重复测量资料的统计分析方法:如果将不等距重复测量设计资料按等距处理,不仅会损失数据中所蕴涵的关于重复测量因素的信息,而且会造成变化趋势分析结果的偏性,甚至会出现错误的分析结论。,2022/11/16,24,Part :Method目前常用的统计分析方法(一),不等距重复测量资料的统计分析方法:应用spss程序GLMtime1time K BY treat/ WSFACTOR=time k Polynomial(t1tk) /METHOD=SSTYPE(3)/PLOT=PROFILE (time*treat)PRINT=ETASQ HOMOGENEITY/CRITERIA=ALPHA (.05)/WSDESIGN=time/DESIGN=treat,2022/11/16,25,Part :Method目前常用的统计分析方法(一),重复测量资料的方差分析趋势分析(trend analysis)一般采用正交多项式(polynomial)分析某处理因素的均数随时间的变化情况。正交多项式变换的对比方法:将两组资料转变为两条正交多项式曲线,检验这两条曲线的参数是否来自同一总体。,2022/11/16,26,各时间点的平均值不等,两种剂型血中浓度相同,2022/11/16,27,Part :Method目前常用的统计分析方法(一),重复测量资料的方差分析趋势分析(trend analysis)注意事项首先检查最高阶次的参数在两对比组之间是否具有统计学意义。如果组间差异具有统计学意义,则可以认为包括本阶次及其余各阶次之间都具有不同的趋势。否则,应继续对次高阶次的参数作评价。如果在任何阶次上差异都不具有统计学意义,说明这两条曲线的变化趋势是一致的。,2022/11/16,28,2022/11/16,29,Part :Method目前常用的统计分析方法(二),混合效应模型(mixed effects mode1s ) 固定效应(fixed effect)和随机效应(random effect) 模型:固定效应模型(fixed effects models) 随机效应模型(random effects models) 混合效应模型 (mixed effects mode1s) 采用SAS或SPSS的Mixed程序进行计算,程序中采用约束最大似然估计算法。,2022/11/16,30,Part :Method目前常用的统计分析方法(二),混合效应模型(mixed effects mode1s ) 优点:允许规定不同的协方差矩阵 允许缺失值结果具有更好的外推性缺点:不能处理分类资料,2022/11/16,31,Part :Method目前常用的统计分析方法(三),广义线性模型(generalized linear models,GLMs) 优点:资料可以是连续性的或离散性的 打破了经典线性模型中应变量是自变量的线性预测 广义估计方程 ( generalized estimation equation, GEE )Liang & Zeger(1986)提出SAS 软件包的GENBMOD 程序调用结果,2022/11/16,32,Part :Method目前常用的统计分析方法(四),多水平模型(Multilevel Models )一般情况分为两个水平水平2:个体水平1:重复测量低水平嵌套在高水平中,且低水平间具有相关性采用统计软件:多水平模型专用软件(MLwin),2022/11/16,33,Thank You,