七年制医学课件流行病学5病例对照研究.ppt
第五章第二节 病例对照研究(case-control study),一、概述(一)概念 病例对照研究的基本思想是比较某病患者人群(病例组)与非患者人群(对照组)暴露于某些可疑危险因素的差异,从而检验该暴露因素与所研究疾病间是否存在联系。,暴露(exposure)是流行病学的一个术语。它是指研究对象接触于某些因素或具备某些特征或处于某种状态,这些因素、特征、状态即为暴露因素。暴露因素可以是有害的(危险因素),也可以是有益的(保护因素),有人称之为研究变量(variable)。,病例,对照,+,+,比较 人数 暴露 疾病,调查方向:收集回顾性资料,aa/(a+c)c bb/(b+d)d,(二)基本原理 病例对照研究基本原理示意图:,比较暴露率差异,因 果,(三)病例对照研究的特点 1、该研究属于观察性研究中分析流行病学研究方法之一,必须设立比较组;2、从时序上看,是一种回顾性的,从果至因的研究;3、只能分析暴露与疾病是否存在联系,不能证实该联系是否是因果联系。,二、病例对照研究的设计与实施 研究对象的选择 对照的设置 样本含量的估计 收集暴露资料,(一)研究对象的选择1、病例的选择(1)首先制定统一、明确的诊断和入选标准 如肺癌 诊断标准:规定影像学诊断还是病理组织学诊断;入选标准:对其它特征的规定如年龄、病情轻重等。(2)来源 以医院为基础 门诊及住院病人。易获得、合作性好、节省费用,但易发生选择必性偏倚。以社区为基础 从社区一般人群的普查或抽查获得病人。(3)种类 包括新发病例、现患病例与死亡病例。优先选择新发病例,其原因:发病时间较近,对暴露史回忆较为准确;尚未受到决定生存的因素影响;现患病例由于多年患病,可能已经改变了自身的暴露情况;死亡病例的暴露信息由家属提供,准确性较差。,2、对照组的选择(1)原则 有代表性,能代表产生病例的人群的总体;有可比性,除研究因素外,其他条件尽量与病例组一致。(2)来源 研究的总体人群或抽样人群中具代表性的非病例;医院内其他疾病患者;病例的同胞、亲属、配偶、同事、同学等;(3)对照的设置 成组对照 即为一组病例选择一组对照,对照组的人数应等于或多于病例组。配比(matching)采用特殊的限制性方法,强制对照与病例在某些特征上保持一致,达到控制混杂偏倚的目的。,配比因素 需要在病例与对照间保持一致的那些特征,常常是一些可疑的混杂因素。配比方式:频数配比 个体配比(1:1、1:2、1:3、1:4)过度配比(overmatching)将不需要配比的因素也作为匹配变量,甚至将欲研究的危险因素也进行匹配而导致研究失败的情况称为配比过度。,例:1:4 配比病例对照研究Vincent 医院 Herbst妇产科医师,8例阴道腺 癌病例,32个对照,(同一医院,出生时间不超过5天的人),母亲年龄 哺乳 孕期X线 流产史 怀孕出血史孕期服用过己烯雌酚,(OR=28.0,P0.01),(二)样本含量的估计公式:(Z2pq+Zp1q1+p2q2)2N=(p1 p2)2 式中:p1为对照组的暴露率 q1=1-p1 p2为病例组的暴露率 q2=1-p2 p=(p1+p2)/2 q=1-p 另:p2=ORp1/(1-p1+ORp1),(三)暴露资料的收集 在病例对照研究中,主要靠询问调查对象、填写调查表来收集信息资料,有时需辅以查阅档案、采集样品进行化验或实地查看加以记录等手段。无论用什么方式和手段收集资料,都应实行质量控制,以保证调查质量,如抽取一定比例样本作二次调查,然后进行一致性分析。对欲调查的暴露因素应有明确的定义,尽量进行量化或分级。,三、资料的整理与分析(一)资料的整理 查漏补缺,去除不合格资料,并进行分组、归类。(二)数据的分析 1、描述性分析(1)一般特征 如性别、年龄等基本情况。(2)均衡性检验 针对主要混杂因素,评估偏倚可能性。2、统计性推断 基本步骤:三步曲 判断E与D之间有无关联 比较组间暴露率差异有无显著性,若有则有关联,常用卡方检验;估计E与D的联系强度 用OR来反映;总体OR95%CI(可信限)的估计。,比值比(odds ratio,OR)又称比数比、优势比。比值(Odds)是指某事物发生的可能性与不发生的可能性之比。病例组的暴露比值为:(5.6)对照组的暴露比值为:(5.7)比值比(OR)OR的含义 与RR相同,反映暴露组的疾病危险性为非暴露组的多少倍。OR1“正关联”,危险因素。OR1 无关联。OR1“负关联”,保护因素。,分析步骤及计算公式:判断有无关联 x2=(ad-bc)2n/(a+b)(b+d)(c+d)(a+c)估计关联强度 OR=ad/bc OR假设检验 总体OR的可信区间 a.Woolf自然对数转换法 Var(lnOR)=1/a+1/b+1/c+1/d 求其反自然对数即得出。,b.Miettnen法可信区间不包括1.0,可认为该OR值在0.05或 0.01水平上有显著性。举例:如表5-7表5-7 口服避孕药(OC)与心肌梗死(MI)关系的病例对照研究结果,判断有无关联 x2=(ad-bc)2n/(a+b)(b+d)(c+d)(a+c)=7.70(X2 0.01,1)=6.63,x2=7.706.63,则P0.01 结论为拒绝无效假设,即两组暴露率差异有统计学显著性差异,研究因素E与疾病D之间存在关联。估计关联强度 OR=ad/bc=2.20 总体OR的可信区间 a.Woolf自然对数转换法 Var(lnOR)=1/a+1/b+1/c+1/d=0.0826 Exp(1.3218,0.2252)=3.75,1.25 OR95%C.I.=1.253.75 b.Miettnen法,不匹配分层的资料分析 资料整理形式:如表5-8表5-8 病例对照研究分层资料整理表,举例:如表5-9表5-9 按年龄分层的结果 OR1=2.80 OR2=2.78,表5-10 年龄与OC的关系,表5-1 年龄与MI的关系,OR=3.91,X2=8.89,说明年龄与口服避孕药也有联系。,OR=0.48,X2=7.27,说明年龄与MI有联系(小年龄有保护)。,分层资料分析方法:)对各层单独分析 计算方法同不匹配不分层资料。)计算总的卡方值 x2MH=ai-E(ai)2/V(ai)(5.11)式中:E(ai)为 ai 的理论值(Eai=m1in1i/ti)(ai)为 ai 的方差 x2MH=11.79(X2 0.05,3)=7.81,(X2 0.01,3)=11.34,)计算总的值,ORMH=(aidi/ti)/(bici/ti)(5.10)ORMH=2.792.20(分层前的值)4)总体OR95的可信区间表明由于混杂因素(年龄)的作用,减弱了联系强度。分层的方法按混杂因素的有无进行分层。分层的目的控制混杂因素的混杂作用。,2.2 检验,用McNemar公式计算。2=(b-c)2/(b+c)3.OR值的计算:OR=c/b 4.计算OR值95%可信区间:仍用Miettinen方法。,四、病例对照研究的优缺点(一)优点 1、节省人力、物力,较易于组织实施。2、得结果快,适用于慢性病的研究。3、所需样本量较少,适用于罕见病的研究。4、可同时研究多种因素与某疾病间的关系。(二)缺点 1、容易产生各种偏倚,选择病例时容易发生选择偏倚,收集资料时容易出现信息偏倚。2、由于是从果到因的回顾性研究,并且暴露与疾病的时间先后有时难以判断,不能直接得到因果联系的结论。,