回顾性临床研究的设计和分析报告课件.ppt
回顾性临床研究的设计与数据分析,文毅临床流行病学研究员上海罗氏制药医学部,1,NP-OBC-2015.11-002 Valid Until 2017.11,目标受众:专业资料,仅供医药卫生专业人士参考,回顾性临床研究的设计与数据分析文毅1NP-OBC-2015,声明,本资料为仅用于学术会议或活动的专业资料,旨在促进医药信息的沟通和交流,仅供医药卫生专业人士参考。内容可能含有未在中国批准的临床适应症。处方请参考国家食品药品监督管理总局批准的药品说明书,2,专业资料,仅供医药卫生专业人士参考,声明本资料为仅用于学术会议或活动的专业资料,旨在促进医药信息,前瞻性 vs.回顾性,时间顺序性研究问题 vs. 数据收集暴露因素 vs. 研究结局数据的分析永远是回顾性的数据的产生永远是前瞻性的,3,专业资料,仅供医药卫生专业人士参考,前瞻性 vs.回顾性时间顺序性3专业资料,仅供医药卫生专业人,常见的回顾性研究设计,一般为观察性研究回顾性队列研究(因 果)病例对照研究( 果 因)横断面研究,4,专业资料,仅供医药卫生专业人士参考,常见的回顾性研究设计一般为观察性研究4专业资料,仅供医药卫生,队列研究,暴露,一组人,前进,5,专业资料,仅供医药卫生专业人士参考,队列研究暴露时间轴一组人前进结局5专业资料,仅供医药卫生专业,队列研究,暴露,一组人,前进,现在,回顾性,现在,前瞻性,6,因 果,专业资料,仅供医药卫生专业人士参考,队列研究暴露时间轴一组人前进结局现在回顾性现在前瞻性6因 ,队列研究可以回答哪些问题?,疾病(事件)的发生情况:发生率疾病(状态)的流行或分布:百分数疾病(事件、状态)发生、流行和分布的影响因素:比(Hazard Ratio, Rate Ratio),7,专业资料,仅供医药卫生专业人士参考,队列研究可以回答哪些问题?疾病(事件)的发生情况:发生率7,确定研究终点,确定暴露因素,随访起止点,确定研究人群,队列研究的设计要素,一组人,8,前进,确定研究问题,专业资料,仅供医药卫生专业人士参考,确定研究终点确定暴露因素随访起止点确定研究人群队列研究的设计,随访,起点:暴露或者风险发生的起点过去的某个时间点终点: 事件发生失访或脱落研究结束,9,过去的某个时间点,现在 or 过去的某个时间点,专业资料,仅供医药卫生专业人士参考,随访起点:9过去的某个时间点现在 or 过去的某个时间点专业,确定研究人群,目标人群源人群研究人群,10,目标人群,源人群,研究人群,实际入组的研究人群,进行研究对象招募的人群,希望进行结果推广的人群,从研究起点(过去)进行选择,专业资料,仅供医药卫生专业人士参考,确定研究人群 目标人群10目标人群源人群研究人群实际入组的研,确定暴露状态,根据研究对象在研究起点(过去)的暴露状态而确定的暴露组对照组根据研究问题清晰定义有/无(治疗方案)按暴露程度(剂量)按暴露的Pattern(顺序),11,专业资料,仅供医药卫生专业人士参考,确定暴露状态根据研究对象在研究起点(过去)的暴露状态而确定的,对照组的选择,除了暴露因素外,应与暴露组相似内部对照从同一地点,同一时间内选择。如从同一家医院,在同一个时间段内选择外部对照不同地点,不同时间需要更强的相似性假设,12,专业资料,仅供医药卫生专业人士参考,对照组的选择除了暴露因素外,应与暴露组相似12专业资料,仅供,暴露组与对照组的可比性,观察性研究的特性决定了暴露组与对照组是不可比的基线的背景风险不同(选择性入组)脱落者与在访者的背景风险不同(选择性脱落)忽略这种不同会影响我们对结果的解读“选择性偏倚”,13,随机(Randomization),专业资料,仅供医药卫生专业人士参考,暴露组与对照组的可比性观察性研究的特性决定了暴露组与对照组是,举例:死亡率指标,“二、三级综合医院医疗服务能力标准”征求意见稿,14,专业资料,仅供医药卫生专业人士参考,举例:死亡率指标“二、三级综合医院医疗服务能力标准”征求意见,“差异”的校正和控制,研究设计上研究实施上数据分析上结果解读上,15,专业资料,仅供医药卫生专业人士参考,“差异”的校正和控制研究设计上选择内部对照减少因失访导致的信,队列研究的终点/结局,事件的发生(已知)Time-to-event (OS, PFS)Disease incidence随访终点(已知)一个队列研究可观察多个研究结局,16,专业资料,仅供医药卫生专业人士参考,队列研究的终点/结局事件的发生(已知)16专业资料,仅供医药,结局和暴露状态的测量,基本原则:独立与客观研究结局不应影响暴露状态的判断暴露状态不应影响研究结局的判断观察性研究中不存在完全的独立与客观测量的误差会影响研究结果,无法校正“信息偏倚”,盲法(Blinding),17,专业资料,仅供医药卫生专业人士参考,结局和暴露状态的测量基本原则:独立与客观盲法(Blindin,回顾性队列研究中的选择性偏移与信息偏移,选择性偏移选择性入组和脱落回顾性数据的完整性信息偏移回顾性数据的准确性回忆的准确性暴露状态对结局的影响相对较小,18,专业资料,仅供医药卫生专业人士参考,回顾性队列研究中的选择性偏移与信息偏移选择性偏移18专业资,关于失访,观察性研究的失访无法避免对临床研究的影响减少了样本量,降低研究的效力造成选择性偏倚应对措施补充数据,减少失访造成的信息缺失接受现实、评估可能的影响、谨慎解读结果,19,专业资料,仅供医药卫生专业人士参考,关于失访观察性研究的失访无法避免19专业资料,仅供医药卫生专,病例对照研究,研究结局(果) 暴露状态(因)Step 1: 根据结局确定“病例”与“对照”Step 2: 确定各自的暴露状态Step 3: 计算,20,专业资料,仅供医药卫生专业人士参考,病例对照研究研究结局(果) 暴露状态(因)20专业资料,,病例对照研究,21,专业资料,仅供医药卫生专业人士参考,病例对照研究21专业资料,仅供医药卫生专业人士参考,病例对照研究,22,病例,专业资料,仅供医药卫生专业人士参考,病例对照研究22病例专业资料,仅供医药卫生专业人士参考,病例对照研究,23,病例,对照,专业资料,仅供医药卫生专业人士参考,病例对照研究23病例对照专业资料,仅供医药卫生专业人士参考,结局 暴露,24,病例:对照:,专业资料,仅供医药卫生专业人士参考,结局,Odds Ratio (OR),25,OR=,专业资料,仅供医药卫生专业人士参考,暴露非暴露病例对照Odds Ratio (OR)2544,病例对照研究可以回答哪些问题?,疾病或状态的影响因素(比较性问题)保护因素风险因素唯一的产出:OR,26,专业资料,仅供医药卫生专业人士参考,病例对照研究可以回答哪些问题?疾病或状态的影响因素(比较性,病例对照研究的设计要素,确定研究问题确定研究人群病例的选择对照的选择判断暴露状态,27,专业资料,仅供医药卫生专业人士参考,病例对照研究的设计要素确定研究问题27专业资料,仅供医药卫生,病例的选择,理论上,人群中所有病例均应作为case实际中,选择部分病例作为case一般选择新发病例而非既往病例不同时期的诊断水平存在差异,28,专业资料,仅供医药卫生专业人士参考,病例的选择理论上,人群中所有病例均应作为case28专业资料,对照的选择,在选择时没有发生研究结局与病例来自同一人群如果发生了研究结局,那么对照符合病例的入选标准对照的选择不受暴露因素的影响除了暴露因素外,对照应与病例类似病例对照比例:1:11:4,29,专业资料,仅供医药卫生专业人士参考,对照的选择在选择时没有发生研究结局29专业资料,仅供医药卫生,判断暴露状态,往往是回顾性的基于已有病例档案(完整性?)基于回忆(准确性?),30,专业资料,仅供医药卫生专业人士参考,判断暴露状态往往是回顾性的30专业资料,仅供医药卫生专业人士,病例对照研究中的偏倚与混杂,选择性偏倚不恰当的选择对照(受暴露状态的影响)病例与对照来自不同人群信息偏倚(暴露信息不准确)回顾性的数据收集方式回忆偏倚研究者引入的偏倚混杂风险因素数据不完整或缺失,31,专业资料,仅供医药卫生专业人士参考,病例对照研究中的偏倚与混杂选择性偏倚31专业资料,仅供医药,病例对照研究中的偏倚与混杂的控制,较队列研究更难控制可用的方法配对尽可能收集风险因素使用客观测量结果分析:分层、多因素分析承认其存在以及研究的局限性,32,专业资料,仅供医药卫生专业人士参考,病例对照研究中的偏倚与混杂的控制较队列研究更难控制32专业,研究问题:MKK4基因多态性与结直肠癌的相关性研究设计:病例对照,33,专业资料,仅供医药卫生专业人士参考,研究问题:33专业资料,仅供医药卫生专业人士参考,病例与对照的选择,病例2002年6月2008年12月广州地区6所医院706名组织病理学确诊CRC患者对照相同时间段广州地区健康体检人群随机选择723名无CRC研究对象年龄、性别配对,34,Yisheng Wei, et al. Int. J. Cancer: 125, 18761883 (2009),专业资料,仅供医药卫生专业人士参考,病例与对照的选择病例34Yisheng Wei, et al,暴露因素测量,问卷:吸烟、饮酒、家族史采集血样进行基因分析,35,Yisheng Wei, et al. Int. J. Cancer: 125, 18761883 (2009),专业资料,仅供医药卫生专业人士参考,暴露因素测量问卷:吸烟、饮酒、家族史35Yisheng,36,专业资料,仅供医药卫生专业人士参考,36专业资料,仅供医药卫生专业人士参考,横断面研究,37,了解某种疾病或状态在特定时间、某个人群中的分布状态(流行率),流行率,专业资料,仅供医药卫生专业人士参考,横断面研究37了解某种疾病或状态在特定时间、某个人群中的分布,横断面研究,特殊的病例对照研究所有的non-case均选为control相关因素分析(OR),38,专业资料,仅供医药卫生专业人士参考,横断面研究特殊的病例对照研究38专业资料,仅供医药卫生专业人,横断面研究的设计要素,确定研究人群在哪个人群切?确定数据收集/产生时间在什么时候切?结局与暴露的测量数据收集,39,人群的切面,专业资料,仅供医药卫生专业人士参考,横断面研究的设计要素确定研究人群39人群的切面专业资料,仅供,数据收集/产生时间,日历时间(calendar time)X年X月X年X月事件时间(event time)就诊、诊断、治疗、死亡,40,专业资料,仅供医药卫生专业人士参考,数据收集/产生时间日历时间(calendar time)40,数据收集,同时收集暴露与结局信息(一次性收集)收集方式:面对面访谈邮寄调查问卷电话访谈自我填写的调查问卷医学检查(实验室检查)已有档案回顾,41,专业资料,仅供医药卫生专业人士参考,数据收集同时收集暴露与结局信息(一次性收集)41专业资料,仅,横断面研究的偏倚与混杂,选择性偏倚:研究对象不具代表性信息偏倚:基于回忆或自我报告混杂:风险因素缺失或未收集,42,专业资料,仅供医药卫生专业人士参考,横断面研究的偏倚与混杂选择性偏倚:研究对象不具代表性42专业,研究人群:2010/7-2012/7就诊乳腺癌患者,数据收集:病理科档案,43,专业资料,仅供医药卫生专业人士参考,研究人群:数据收集:43专业资料,仅供医药卫生专业人士参考,常用的分析方法,描述性分析(Descriptive analysis)描述研究人群的基本特征组间比较(Subgroup comparison)了解可能存在的组间差异回归分析(Regression analysis)偏倚与混杂的校正,分析影响因素,44,常用的分析方法描述性分析(Descriptive analy,描述性分析,根据变量类型选择分析方法,45,描述性分析根据变量类型选择分析方法变量类型描述性分析连续变量,组间比较,比较组间基线特征差异t检验(连续变量)卡方检验(分类变量)“我该使用哪种检验方法?”,http:/www.ats.ucla.edu/stat/mult_pkg/whatstat/default.htm,46,组间比较比较组间基线特征差异http:/www.ats.u, Dependent Variable: 因变量(年龄) Independent Variable: 自变量(治疗方案) Nature of Depend VariableIntervalNormalOrdinalCategorical,47,使用的检验方法,四种统计软件的操作方法, Dependent Variable: 47使用的,回归分析,根据研究设计和因变量(结果变量)种类选择回归分析方法生存分析(Cox回归):time-to-event变量Logistic回归:0,1结果变量线性回归:连续性结果变量Poisson回归:非负的计数性结果变量单变量 vs. 多变量,48,回归分析根据研究设计和因变量(结果变量)种类选择回归分析方法,单因素与多因素分析,单因素分析:Y=+X1生存状态=+*治疗方案粗估,未考虑其他因素对Y的影响多因素分析:Y=+1X1+2X2+3X3+nXn生存状态=+ 1*治疗方案+2*年龄+3*并发疾病校正后估计,考虑其他因素对Y的影响,49,单因素与多因素分析单因素分析:49,多变量分析中变量的选择,统计学方法Backward, Forward, StepwiseAIC, BIC, Adjusted-R2临床意义风险因素“All models are wrong, but some are useful”,50,多变量分析中变量的选择统计学方法50,总结,根据研究问题选择研究设计是否需要前瞻性的收集数据(数据积累)省时高效正确认识回顾性研究的局限性,51,专业资料,仅供医药卫生专业人士参考,总结根据研究问题选择研究设计51专业资料,仅供医药卫生专业人,Doing now what patients need next,专业资料,仅供医药卫生专业人士参考,52,Doing now what patients need n,知识回顾Knowledge Review,知识回顾Knowledge Review,谢 谢!,放映结束 感谢各位的批评指导!,让我们共同进步,谢 谢! 放映结束 让我们共同进步,