《病例对照研究非常好的课件.ppt》由会员分享,可在线阅读,更多相关《病例对照研究非常好的课件.ppt(69页珍藏版)》请在三一办公上搜索。
1、2013-9-122,病例对照研究(二)Case-Control Study,北京协和医学院流行病学系 韩慧君,2013-9-122,病例对照研究,主要内容概述-基本原理研究的设计与实施主要偏倚及控制研究的优缺点病例对照研究的衍生类型,2013-9-122,复习上节内容,2013-9-122,选择确诊患某种特定疾病的病人作为病例选择不患该病但具有可比性的个体作为对照通过询问、实验室检查或复查病史,搜集既往危险因素暴露史测量并比较两组各因素的暴露比例,经统计学检验暴露因素与疾病之间是否存在统计学关联,进而建立因果假说。,病例对照研究的基本原理,2013-9-122,研究对象选择的基本原则,病例与
2、对照来自一个总体(源人群)。所调查的病例足以代表总体中所有该病病例。所选择的对照足以代表非病例的总体。代表的是暴露的分布。,2013-9-122,病例的选择,病例标准:患者内部、外部特征的限定病例类型:新发病例、现患病例和死亡病例病例来源:医院/社区,2013-9-122,代表性:理想状态下,应为目标人群的随机抽样的样本,即对照的暴露水平应与目标人群的暴露水平相同可比性:与病例组在研究因素以外的其他因素方面具有可比性,对照的选择原则,2013-9-122,对照设置类型选择来源,对照的选择,成组对照配比对照,群体匹配个体匹配,当地全人口医院其他病例病例的配偶、同胞、亲戚、同事或邻居,2013-9
3、-122,“不匹配”设对照-成组对照,方法:当对照来源确定后,用抽样方法从该人群中随机选择足够的人数。,2013-9-122,匹配,要求:对照在某些因素或特征上与病例保持一致。目的:对两组进行比较时排除匹配因素干扰。适用条件:病例的某特征构成特殊,随机抽取的对照组难与病例组均衡可比。匹配因素:混杂因素与暴露因素有关与疾病有关不是暴露与疾病因果链上的某一环节,2013-9-122,匹配,注意:匹配过程本身并不去除混杂!所有的匹配因素都要在分析中予以控制!合理匹配使控制混杂下检验因果关联的效率提高。注意若混杂为连续变量,匹配资料分析后仍旧可能有残余混杂!优点:提高研究效率(同等样本量,增加分析时统
4、计学检验能力)。控制混杂因素。缺点:配比因素多,对照难找,费人、时、力;配比资料分析复杂;不能研究配比因素与疾病的关系或其与暴露间的交互作用。,2013-9-122,警惕“匹配过度”:配比了“不该匹配的因素”如“非混杂”因素或“因果链上中间环节”,导致暴露疾病关联降低或统计效率降低,耗费人力财力。匹配中间环节:导致暴露疾病关联降低,结果偏倚;匹配那些与暴露无关只与疾病有关的因素:统计效率降低,结果不会混杂;匹配那些与暴露有关却与疾病无关的因素:匹配行为引入混杂,结果偏倚!都属于画蛇添足行为,耗费人力财力!,匹配,2013-9-122,样本量估计的注意事项,不同匹配方式,样本量的估计公式不同如果
5、病例对照研究中同时研究多个危险因素与疾病的关联,样本量估算时,应当基于研究最感兴趣的主要指标中:因果关联最小(OR 最接近1)P0 最远离50的指标来计算。然后对次要指标计算:此样本量下检测次要指标预期强度的因果关联的power。,2013-9-122,资料的分析-Step 1.描述性分析,描述研究对象的一般特征 描述研究对象的人数及各种特征的构成。(2)均衡性检验 两组间构成比有无差异可用2检验。,2013-9-122,1.病因问题暴露与疾病有无统计学关联?关联方向?强度大小?如何解释?2.公卫问题暴露组发生疾病的风险中有多少是因为暴露因素所导致的?,资料的分析-Step 2.推断性分析,2
6、013-9-122,不同类型病例对照资料的分析,不匹配资料无需控制混杂时:不分层分析需控制混杂时:分层分析(注:频数匹配资料分析与此相同)分级暴露资料的分析个体匹配资料的分析,2013-9-122,OR的计算方法,2013-9-122,Woolfs 自然对数转换法 Miettnen氏卡方值法,计算OR的可信区间,2013-9-122,OR=ad/bc=(39154)/(24114)=2.20含义:口服避孕药使用者发生心肌梗死的危险是未使用者的2.2倍。,不分层分析,2013-9-122,按可能的混杂因素分层,每层整理一个四格表,计算每层的卡方和OR值;判断是否为混杂因素;如果两层OR值接近,谓
7、之同质,可计算并报告合并卡方值,合并OR值(ORMH)及其95%CI;如果两层不同质,不能合并,分别报告;,分层分析,2013-9-122,前述关于口服避孕药与心肌梗死的病例对照研究,按年龄分为40岁和40岁两层,如下表(OR粗=2.2),(2)计算各层的OR:(分层的X2检验略)OR40=(2159)/(1726)=2.80OR40=(1895)/(788)=2.78,分层OR OR粗,分层分析,2013-9-122,判断分层因素是否为混杂因素:分层因素与疾病关系(在未暴露组检查);分层因素与暴露的关系(在对照组检查)。,分层分析,2013-9-122,判断年龄是否为混杂因素:年龄与心肌梗死
8、(MI)有联系年龄与口服避孕药(OC)有联系理论上,年龄不是OC与MI联系的中间环节可判断年龄为研究OC与MI关系时的“混杂”因素。应当报告分层分析中去除年龄混杂的OR值。,分层分析,2013-9-122,判断各层是否同质。若各层同质,可对各层的OR值进行合并报告总的OR值;同理,报告总的2检验结果。若各层不同质,应对各层的OR和2分别报告。,分层分析,2013-9-122,采用 Mantel-Haenszel 提出的公式:计算总的OR:计算总的卡方值:,分层分析,2013-9-122,个体匹配资料的分析,对子,2013-9-122,计算OR值计算95C.I.,个体匹配资料的分析(1:1匹配)
9、,卡方检验McNemar公式:,2013-9-122,病例对照研究的其他分析,公共卫生意义,归因危险百分比(AR%)暴露人群某疾病的发病中,由该暴露引起的发病占全部发病的比例;停止该暴露,暴露人群减少发病比例。,人群归因危险百分比(PAR%)全人群某疾病的发病中由该暴露引起的发病占全部发病的比例;停止该暴露,全人群减少发病比例。,PAR%=(Ip-I0)/Ip Pe(OR-1)/Pe(OR-1)+1,AR%=(Ie-I0)/Ie(OR-1)/OR,如果:RR OR,2013-9-122,今天的内容,2013-9-122,选择偏倚 信息偏倚 混杂偏倚,病例对照研究常见偏倚,2013-9-122,
10、偏倚(bias),定义:在流行病学调查研究或推论过程中,由于某种或某些因素影响,使所研究的结果或推论与真实情况之间产生的系统差别。分3类选择偏倚信息偏倚混杂偏倚,流行病学研究从设计到得出推论的全过程都有可能产生偏倚。许多偏倚在研究中一旦产生就很难去除,需“防患于未然”。,2013-9-122,定义:在研究对象的选取过程中,由于选取方式不当,导致入选对象与未入选对象间的特征有系统差别,即,选择的研究对象不能代表总体人群,导致研究的结果或推论与真实情况之间出现系统差别。,选择偏倚(selection bias),2013-9-122,病例对照研究常见的选择偏倚类型,入院率偏倚(Berksons b
11、ias)现患病例-新发病例偏倚(Neyman bias)检出征候偏倚时间效应偏倚,2013-9-122,入院率偏倚(admission bias),又称就诊机会偏倚。因首先由JBerkson于1946年提出,故又称伯克森偏倚(Berksons bias)。定义:在以医院为基础的病例对照研究中,无明确范围的源人群。因为病人对医院及医院对病人双方都有选择性,病例和对照均不是目标人群中的随机样本。因各种疾病的入院率不同而导致病例或对照某些特征上的系统差异,进而导致疾病与暴露间的真实关联被扭曲。对策:尽量随机选择研究对象,尽可能从多家(类)医院选择研究对象。,2013-9-122,现患-新发病例偏倚p
12、revalence-Incidence bias,又称 Neyman bias定义:病例对照研究中如果选择现患病例,且暴露因素与疾病的预后有关时,现患病例为过去新发病例中的幸存者,其暴露特征可能不同于死亡病例;此外,现患病例在疾病诊断后可能会改变原有的暴露状况。因此现患病例的暴露不能准确代表新发病例的暴露。对策:尽可能选择新发病例。,2013-9-122,检出征候偏倚(detection signal bias),又称 暴露偏倚(unmasking bias)定义:病人常因某些与致病无关的症状而就医,从而提高了早期病例的检出率,致使过高估计暴露程度而产生的系统误差。,2013-9-122,检出
13、征候偏倚(detection signal bias),例:子宫内膜癌与雌激素的病例对照研究。雌激素-积极就诊-查出Cancer,阴道出血(药效),假因果,重做研究:在肿瘤科与妇科找患者服雌激素的病例中79%为早期病例未服雌激素的病例中58%为早期病例,偏倚存在,对策:病例组同时包括早中晚期病人,则检出病例中此类暴露的比例会趋于正常,偏倚得以纠正。,2013-9-122,时间效应偏倚(time effect bias),在病例对照研究中,一些暴露后肯定要发病但在研究时点尚未发病的人,以及在调查时已经发生病变但因缺乏早期检测手段而被错误地认为是非病例的人,都可能被选入对照组,由此产生结论的系统误
14、差。对策:在调查中尽量使用敏感的疾病早期检查技术,或开展观察期充分长的纵向调查。,2013-9-122,信息偏倚(information bias),定义:收集整理信息过程中由于测量暴露和疾病的方法有缺陷造成的研究结果与真实情况间产生的系统差别。病例对照研究常见的信息偏倚类型 回忆偏倚(recall bias)调查偏倚(investigation bias),2013-9-122,回忆偏倚(recall bias),定义:研究对象不能完整准确地回忆既往的暴露信息,尤其是病例和对照回忆既往暴露信息准确性不对等造成的系统误差。病例组记忆可能更准确,但也容易提供自认与疾病有关的暴露但实际不真实的情况
15、。病例对照研究的主要弱点,很难完全避免。,2013-9-122,相关因素:调查时间与暴露事件发生的时间间隔 暴露事件的重要性 被调查者的年龄构成 询问技术对策:使用结局发生之前的客观的记录资料 选择不易为人所忘的重要指标作调查 重视问卷的提问方式和调查技巧,回忆偏倚(recall bias),2013-9-122,调查偏倚(investigation bias),定义:可来自与调查对象与调查者双方。病例与对照的调查环境与条件不同,调查技术、调查质量不高或查错、仪器设备等引起的系统误差。举例:病例在医院调查,对照在家调查;调查者对病例与对照的态度不同;调查者有意无意诱导调查对象以符合研究假设;病
16、例组可能为了解释疾病而过度报告暴露;,2013-9-122,对策尽量采用客观指标;选择合适人选参加调查;认真做好调查技术培训;采取复查做好质控检查条件尽可能一致;尽量在同一时间由同一调查员调查病例和对照;尽可能采用盲法调查检查仪器应精良,用前校准,严格掌握试剂。,调查偏倚(investigation bias),2013-9-122,定义:某个外来因素既是疾病的危险因素,又与暴露因素存在联系,但它不是暴露与疾病之间的中间变量。由于这个外来因素的存在,掩盖或夸大了暴露与疾病的关联,这种现象导致的偏倚叫做混杂偏性。对策限制研究对象的特征病例与对照根据混杂因素进行匹配(避免匹配过度)分层分析多因素分
17、析,混杂偏倚(confounding bias),2013-9-122,假设目的是否清楚?疾病与暴露变量的定义明确?病例与对照的来源,诊断方法?新发病例还是现患病例?排除标准是否明确?,实施研究应注意的问题-1,2013-9-122,抽样的方法与样本大小的估计是否明确?病例与对照是否匹配及匹配变量是哪些?调查表是否完全?是否详尽?调查表是否能够收集到需要的数据?调查表是否经过试用?调查表的真实性与可靠性是否经过评估?,实施研究应注意的问题-2,2013-9-122,调查员、质控员、编码员等工作手册是否编好?调查员是否做了专门培训?组织机构、人员、设备、经费是否已落实?方法试剂是否符合标准?结果
18、的真实性与可靠性是否经过考核?资料整理、统计处理方法及分析内容是否明确?如何控制或调整混杂及其他偏倚?结论的真实性如何?,实施研究应注意的问题-3,2013-9-122,理论要求病例对照研究常要求病例是某一时期的全部病例,对照需为一般人口的无偏样本。实际工作不易达到,尤其以医院为基础的病例对照研究,选择偏倚难以避免;通过回忆获取既往暴露信息,存在回忆偏倚;无法计算发病率,因此不能直接分析RR;暴露与疾病时间先后难判断,不能直接推断因果关系;不适于研究暴露比例很低的因素。,病例对照研究的局限性,2013-9-122,病例对照的优点,特别适用于罕见病、暴露到发病过程长的疾病的病因研究,有时是研究罕
19、见疾病病因的唯一可行方法。需调查的对象较少、研究的时间较短,节省人力物力,可较快得出结论。一个研究可同时探索多种因素与疾病发生的关联。,2013-9-122,衍生的病例对照研究,只介绍其中的2种设计巢式病例对照研究(nested case-control study)病例-队列研究(case-cohort studies),2013-9-122,1973年 Mantel 提出设计。1982年 Miettien 命名“巢式病例对照研究”。又名:“套叠式(嵌入式)病例对照研究”或“队列内病例对照研究”概念:是将传统的病例对照研究和队列研究相结合而形成的一种研究方法,是在对一个事先确定好的队列进行随
20、访观察的基础上,利用队列中所有新发现的病例和队列中的非病例样本所进行的病例对照研究。,巢式病例对照研究(nested case-control study),2013-9-122,1.研究实施之初确定一个合适人群作为研究队列;2.收集队列内每个成员的相关信息和生物标本;3.随访队列,由在预定观察期内发生所研究疾病的全部病例组成病例组;5.选择对照有2种方法:(均可考虑设置匹配或不匹配)(1)从随访终点队列中未发病的研究对象中随机选取;(2)在每个病例发病时立即在该队列截止当时尚未发病的研究对象中选择一定数量作为对照。(此方法被称为:危险集抽样或密度抽样)-对照可在后期发病成为病例。6.抽取两组
21、成员相关信息及生物标本,作检验和统计分析。,巢式病例对照研究步骤,2013-9-122,巢式病例对照研究模式图,2013-9-122,对照的来源,巢式病例对照研究,2013-9-122,按照队列确定的时间分类:前瞻性回顾性按对照的选择方法分类:匹配不匹配,巢式病例对照研究类型,2013-9-122,率的计算:(近似队列研究)累积发病率发病密度标化比效应指标(近似病例对照研究)OR值,巢式病例对照研究的资料分析,2013-9-122,病例对照来自同一队列,可比性好;纳入全部新发病例并随机选择对照,选择偏倚较小;暴露信息和生物标本采集于发病前,回忆偏倚小或可避免,且能明确暴露先于疾病利于因果推断;
22、统计检验效率高于传统病例对照研究;可计算发病率;进行详细调查和实验室检查的样本明显少于队列研究,节约人力物力。可用于罕见病的研究。,巢式病例对照研究的特点,2013-9-122,病例-队列研究(case-cohort study),1986年 Prentice RL 提出。又称:病例参比式研究(case-base reference study)概念:是一种队列研究与病例对照研究相结合的设计形式。其基本设计方法是在队列研究开始时,在队列中按一定比例随机抽样选出一个有代表性的样本作为对照组,观察结束时,队列中出现的所研究疾病的全部病例作为病例组,与上述随机对照组进行比较。,2013-9-122,
23、病例-队列研究,2013-9-122,病例-队列研究(case-cohort studies),适用:大样本队列中,随访一段时间后只能得到少量病人,其他大多数是截尾观察结果,2013-9-122,率的计算:(近似队列)累积发病率发病密度标化比 效应指标:(近似病例对照)OR值:RR估计值:用子队列的准似然危险度估计。(新发展的统计方法,理论比较复杂,不介绍),病例-队列研究的资料分析,2013-9-122,病例-队列研究的特点,优点:节约样本量 设计的效率高 无需获得队列中每个成员的信息,仍可估计RR值;选择对照较简单,不必考虑结局即可进行随机抽样;在整个研究过程中都可对子队列的依从性、生物学
24、前体的变化进行监测。缺点:病例和对照组的可能重叠。分析技术相对复杂。,2013-9-122,最佳适用情况:在作某个发病率很低的巨大队列研究中,要分析发病事件的影响因素时,病例队列设计是最佳选择;需要计算队列的发病率、标化死亡比及进行外部比较时,病例队列研究是首选设计方法。,病例-队列研究,2013-9-122,与巢式病例对照研究的主要区别:对照的选择方法和时间不同:巢式病例对照:常采用危险集抽样,对照可以采用匹配的方式选取病例队列研究:研究开始时随机抽取全队列的一个随机样本作为对照,不能与病例进行匹配对照的适用范围不同:巢式病例对照:研究不同疾病需要分别选取对照病例队列研究:研究不同疾病可以共
25、用一个对照,病例-队列研究,2013-9-122,与巢式病例对照研究的区别:队列成员入选机会不同:巢式病例对照(危险集抽样):队列成员被选为对照组的机会与他在队列中所贡献的人时数成正比病例队列研究:全队列成员无论对队列人时数贡献大小,其入选机会都是一样的分析的指标和方法不同:最佳适用场合不同:,病例-队列研究,2013-9-122,总结,具有队列研究的优点:因果关系清楚,而且没有回忆偏倚,资料可靠,对照组的选择偏倚小,论证强度高。具有病例对照研究的优点:实验检测及资料的处理与分析又按病例对照研究的方式,即选择较小样本,节省费用和人力、物力,但所获结果与全队列研究结果无重要差异。因此,可提高统计检验效率,特别适合于精确性好但所需费用高的分子流行病学研究。,巢式病例对照研究与病例-队列研究,2013-9-122,课堂练习,2013-9-122,世界上没有最好的研究方法,只有最合适的研究方法!,Alain Moren,2013-9-122,Thanks!,
链接地址:https://www.31ppt.com/p-6132630.html