流行病学第五章-病例对照研究.ppt
病例对照研究,Case control study,1、如何确认某暴露(E)和某疾病(D)之间是否存在 病因关系?如何设计?2、如何探索胃癌的病因或危险因素?如何设计?3、如何通过流行病学研究设计探索某基因多态性和 胃癌的关系?4、如何评价暴露(E)和疾病(D)之间的联系强度?,讲课提纲,流行病学病因研究的一般思路,Case control study,Cohort study,分析性研究 Analytic Study,病例对照研究是通过对一组患有某种疾病人群(病例组)和一组或几组未患该病的对照人群(对照组)既往暴露于某个或某些可能危险因素(或保护因素)频率的比较,来考察这些因素是否与该病存在联系及联系的程度。一种常用于广泛探索或初步验证病因假设的分析性流行病学研究方法。,病例对照研究的基本原理,概念,设计原理,目标人群,1、分析性研究,属观察法2、回顾性研究3、时间顺序:从“果”“因”4、通常不能够确证因果关联,特点,历史,In 1843,Guy compared occupations of men with pulmonary consumption to those of men with other diseases(Lilienfeld and Lilienfeld 1979).Case-control studies identified associations between lip cancer and pipe smoking(Broders 1920),breast cancer and reproductive history(Lane-Claypon 1926)and between oral cancer and pipe smoking(Lombard and Doering 1928).All rare diseases.Case-control studies identified an association between smoking and lung cancer in the 1950s.,病例和对照不匹配 病例与对照匹配,病例对照研究的设计类型,病例与对照不匹配,病例组,对照组,样本人群,病例与对照匹配:频数匹配,某些特征,样本人群,病例与对照匹配:1:1匹配,某些特征,配对(pair matching),样本人群,病例与对照匹配:1:R匹配,1:2,1:3 1:R,样本人群,病例与对照匹配的因素,混杂因素(已知、可疑)复合因素:年龄+性别,研究因素与疾病因果链中的中间变量只与可疑暴露有关而与疾病无关的因素,不能匹配的因素,病例与对照匹配的目的,提高研究(统计)效率。研究效率2R/(R+1)控制混杂因素的混杂作用。,匹配带来的问题,增加工作难度(费用、时间)限制样本量匹配因素将无法再进行分析匹配过头(overmatching)损害统计效率损害真实性损害费用效益,巢式病例对照研究(nested case control study)病例-队列研究(case-cohort study)病例交叉设计(case-crossover design)单纯病例研究(case only study or case series study)病例-时间-对照设计(case-time-control design),病例对照研究的衍生类型,研究实例,Herbst AL,et al.NEJM 1971;284(16):787-881.,Adenocarcinoma of the vagina:association of maternal stilbestrol therapy with tumor appearance in young women.,年青女性阴道腺癌与母亲服妊娠期用己烯雌酚的关系,Objectives,To determine the factors responsible for the unusual occurrence of a rare tumor(vaginal adenocarcinoma)among 8 young women born between 1946 and 1951.,Methods,For each of these 8 cases,4 matched controls(those who did not have vaginal adenocarcinoma)were selected by examination of the birth records of the hospitals in which each patient was born.Females born within five days and on the same type of service(ward or private)as the eight cases were identified.The mothers of all these women were interviewed.,阴道腺癌病例与对照的母亲主要暴露因素的比较,Mothers of 7 of 8 cases had been given diethyl stilbestrol(estrogen)during pregnancy while none of the mothers(0 of 32)of controls had taken stilbestrol during pregnancy(P 0.00001).,Results,This was one of the earliest landmark case control studies.,Case control studies are the best design for investigating the etiology of rare diseases.Case control study allows the investigator to simultaneously explore the multiple possible associations with a disease.The sample size required for case control studies is often considerably smaller.Case control studies are remarkably cost-efficient.,Certain important advantages of the case control design are apparent in this study,病例对照研究的实施,复习文献,提出假设 明确研究目的,选择适宜的对照形式 病例和对照的来源和选择 获取研究因素信息 数据整理、分析和结果解释,根据研究目的广泛探索病因,可采用不匹配或频数匹配深入探索或验证病因假说,可应采用匹配形式 根据病例数量 少 匹配;多 匹配 或 成组 匹配可使用较小的样本获得较高的检验效率 Pitman效率递增公式:,选择适宜的对照形式,病例和对照的来源和选择,以医院为基础的病例对照研究 Hospital-based case control study 以社区为基础的病例对照研究 Community-based case control study,病例的选择,病例的要求,新发病例(incidence cases)现患病例(prevalence cases)死亡病例(dead cases),病例的类型,最好是新发病例,From hospitals,From populations or communities,诊断正确、易获得;代表性差,普查或抽样调查资料疾病监测资料疾病登记报告系统等,代表性强;不易获得,病例的来源,对照的选择,病例对照研究设计中最困难、争议最多的方面。设置对照组的目的:假定所研究疾病和暴露之间没有关系,提供病例组暴露比例的估计值。对照的基本要求:被选为对照的个体,不仅要求其不患某病,而且要求其暴露某个研究因素的可能性和病例相似。,原则,2、对照一定是未患所研究的疾病,如有可能,应尽 可能排除亚临床或处于潜伏期的疾病。,3、对照可为不健康者,但所患疾病病因不应与所研 究疾病的病因相同。,4、注意研究因素以外其他因素的均衡性。,5、无应答者事先要有统一合理的更换办法,慎重处理。,1、对照最好是全人群的一个无偏样本;或者是产生病 例的源人群(source population)中全体未患该病者 的一个随机样本。,来源,社区人群中的非病例或健康人群。社会团体人群中的非该病病例或健康人。同一或多个医疗机构中诊断的其他病例。病例邻居或同一社区、住宅区内健康人或非该病病人。病例的配偶、同胞、亲戚、同学或同事等。,1 材料与方法1.1 对象选取“江苏省社区人群糖尿病流行特征的研究”中新确诊的2 型糖尿病247例为病例组;在与病例同地区(同城区、同乡村)、同民族、同性别、年龄相差5 岁以内(95%为同年龄,少数相差25 岁),此次调查血糖水平正常的人群中随机抽取,按12 的要求,共计494 人为对照组。,2 结果与分析2.1 病例组与对照组计量资料的比较病例组和对照组平均年龄分别为53.7612.48、53.8112.57岁,两者差异无显著性意义(t=0.05,P=0.957);病例组收缩压、舒张压、BMI、WHR 和2 小时血糖值均显著高于对照组。,材料和方法一、病例的选择:选择宜兴市人民医院门诊诊断的111例胆石病病人作为病例组,其中男性43 例、女性68 例,全部病例经B 超诊断;其中经手术治疗的31 例均被病理确诊。二、对照的选择:按11 配对原则,在同一医院门诊选择同性别、年龄相差不超过2岁、经B 超检查排除胆石病者作为对照组。,样本含量的估计,1、人群中暴露者的比例。如人群中吸烟的比例 比例 样本量2、假定暴露造成的相对危险度(RR)。可通过既往研 究或查阅文献获得 RR 样本量3、要求的显著性水平,即第一类错误 样本量4、要求的把握度,即1-1-样本量,决定因素,Frequency matching design,0.05,Z1.96 0.10,Z1.28,p0Expected frequency of exposure in control groupq0=1p0,p1Expected frequency of exposure in case group,Ncase Ncontrol,Ncase:Ncontrol=1:c,Ncase Ncontrol,Individual matching design(1:1),获取研究因素信息,研究的因素 其它可疑的因素 可能的混杂因素等,回顾性调查,怎么调查?调查哪些内容?,Ascertainment of Exposure,Personal interviews Existing records Physical measurements and lab tests,Exposure,Yes/No Intensity Length of exposure,Questionnaire,Variables Used in Study of Smoking and Lung Cancer,胆石病的临床流行病学系列研究,一、资料的整理 1、原始资料的重新核查 2、资料的分组、归纳,或者编码、输入计算机 二、数据的统计学分析 1、描述性统计 1)描述研究对象的一般特征 2)均衡性检验 2、关联性的统计推断,病例对照研究的数据整理与分析,关联性的统计推断步骤,(1)将资料整理成表格形式。(2)病例和对照组暴露比例差异的显著性检验。即回答E和D是否有联系?(3)估计暴露因素和疾病之间的联系强度。(4)结果解释 可能存在哪些偏倚?得出什么结论?,资料整理表格,病例组暴露比例:,对照组暴露比例:,显著性检验:2检验,关联强度?,不匹配或成组匹配的资料分析,显著性检验,A case control study on the relationship between smoking and lung cancer,关联强度的概念及计算,相对危险度(relative risk,RR):率比、危险比 比值比(odds ratio,OR):比数比,交叉乘积比,概念:暴露组某病发病率(或死亡率)与非暴露组该病 发病率(或死亡率)之比。是反映暴露因素和疾 病关联强度的一个指标。公式:意义:RR说明暴露组发病(死亡)的危险性是非暴露组 的多少倍。,相对危险度(relative risk,RR),相对危险度判断标准,Odds ratio,OR 比值比、比数比,交叉乘积比,定义,病例组的暴露比值和对照组的暴露比值之比,可用来估计暴露和疾病之间的关联强度。,Probability that an event will happenOdds=Probability that the even will not happen,Probability that an event will happenOdds=1-(Probability that the event will happen),公式推导,Cases ControlsExposedabNot exposedcdTotal a+c b+d,Odds of exposure among cases=Probability to be exposed among casesProbability to be unexposed among cases a/(a+c)Odds Ecases=-=a/c c/(a+c)Odds of exposure among controls=Probability to be exposed among controlsProbability to be unexposed among controls b/(b+d)Odds Econtrols=-=b/d d/(b+d),通过比较病例组和对照组的暴露比值,测量暴露和疾病之间的关联强度。由于病例对照研究无法得知危险人群的大小,也即无法获得发病率资料,故无法计算相对危险度(RR),只能通过OR估计关联强度。对于罕见病(发病率 5%)来说,通过OR可以很好估计RR。,理解,当疾病率小于5%时,OR是RR的极好近似值。,当疾病率小于5%时,OR是RR的极好近似值。,A case control study on the relationship between smoking and lung cancer,95%confidence interval of OR:Miettinen,95%confidence interval of OR:Woolf,解读:OR值及其95%可信区间(CI),OR,OR1,OR2,OR4,OR3,0,江苏省社区人群2型糖尿病危险因素的流行病学研究,糖尿病家族史,不匹配或成组匹配分层数据资料的分析,Exposure,Outcome,Confounding variable,association,association,Confounding,The tabulation of the i th stratum,The relationship between alcohol drinking and esophagus cancer,Smoking(1),Non-smoking(2),=5.55,叉生分析的应用,把饮酒与吸烟情况组成四种状态,如何分析吸烟和饮酒这两个因素在食管癌发生中的单独作用和相互作用大小?,问题:,分级暴露资料的分析,(1)将资料整理成列联表,(2)各分级的2 检验(3)计算各分级的OR值(4)趋势性2检验剂量反应关系,男性每日吸烟的支数与肺癌的关系,1:1配对资料的分析,Dead donkey eating and food poisoning,df=1,P0.01,选择偏倚 selection bias入院率偏倚现患病例-新发病例偏倚检出征候偏倚时间效应偏倚信息偏倚 information bias回忆偏倚调查偏倚混杂偏倚 confounding bias,病例对照研究中的偏倚及其控制,选择偏倚 selection bias,入院率偏倚 admission rate bias,Berksons bias,目标人群,病例组与对照组(其他疾病的患者)入院率不同,解决办法:不同类型的多家医院。,现患病例-新发病例偏倚 prevalence-incidence bias,Neyman bias,目标人群,入选的为现患或存活病例不包括死亡病例、病程短的病例,解决办法:新发病例,检出征候偏倚 detection signal bias,unmasking bias,解决办法:早中晚期病例,暴露者较不暴露者更易因某些症状较早较频就医检查,提高了早期病例检出率如果入选者中早期病例较多的话,则暴露比例必然被虚假的,时间效应偏倚 time effect bias,解决办法:提高检测早期病例的灵敏度,目标人群,某些个体尚处于早期病变阶段、缺乏适当的检测手段,因此易被视为无病个体入选病例组的个体中较多的为已进入临床疾病阶段、能够被检测出来的个体,信息偏倚 information bias,回忆偏倚 recall bias事件发生的时间间隔事件的重要性被调查者的构成询问的技术,解决办法:选择不易为人们忘记的重要指标做调查,并重视问卷的提问方式和调查技术,调查偏倚 investigation bias调查对象调查员仪器,解决办法:尽量采用客观指征,选择合适的人选参加调查,认真做好培训和质量控制,检查条件和时间等尽量一致,使用的检查仪器应精良和要校准。,混杂偏倚 confounding bias,概念:既与疾病有制约关系,又与所研究的暴露因素有联系的外来因素(extraneous factor)的影响,掩盖或夸大了所研究的暴露因素与疾病的联系,叫混杂偏倚(confounding bias),该外来因素叫混杂因素(confounding factor 或 confounder)。措施:限制、匹配、分层分析、多因素分析,残余混杂(residual confounding),指在分析中由尚未被考虑的因素或变量引起的混杂,这些混杂因素可以直接观察到,亦可能无法观察到,后者则称潜伏性残余混杂因子。,1、特别适用于罕见病的研究2、省力、省钱、省时间,易于组织实施3、同时调查多个暴露因素与疾病的关系4、不仅用于病因探讨,而且可广泛用于其他方面,病例对照研究的优点及其局限性,优点,1、不适于研究人群暴露比例很低的因素2、选择研究对象时,难以避免选择性偏倚3、暴露和疾病的时间先后常难以判断4、获取既往信息时,难以避免信息偏倚5、不能计算发病率和相对危险度6、通常不能够确证因果关联,局限性,总 结,病例对照研究就是“病例”、“对照”研究。,试题分析,1.病例对照研究2.匹配3.匹配过度4.Berkson偏倚5.奈曼偏倚6.混杂因子,一、名词解释,二、选择题,1.某研究得出某因素与疾病的关系OR=1.1,95%的可信区间为0.71.5,这意味着 A.总体OR值95%的可能是错误的 B.总体OR值在0.71.5的机会为95%C.总体OR值说明该因素与疾病无关,而95%可信区间说明有联系 D.存在偏倚的可能性为95%E.OR值正负联系均存在2.一项病例对照研究,500名病例中有暴露史者400例,而500名对照中有暴露史者100例,有暴露史者的发病率 A.80%B.40%C.20%D.100%E.无法计算,3.在有500名病例与500名对照的配对病例对照研究中,有400名病例和100名对照有暴露史,OR值应为 A.18 B.16 C.20 D.10 E.无法计算4.在设计配对的病例对照研究时,确定配对条件的主要原则是 A.对所研究疾病有影响的项目均应列为配对条件 B.对所研究疾病有较大直接影响的项目均应列为配对条件 C.对所研究疾病有较大直接影响但并非研究的项目应列为配对条件 D.对所研究疾病有较大影响的项目不应列为配对条件 E.以上均不是,5.以医院为基础的病例对照研究,最常见的偏倚是 A.观察偏倚 B.信息偏倚 C.混杂偏倚 D.选择偏倚 E.错分偏倚6.病例对照研究中,病例的选择最好是 A.新发病例 B.现患病例 C.死亡病例 D.现患病例和死亡病例 E.新病例和死亡病例7.就大多数病例对照研究而言,它们不具备下列哪个特点 A.耗资较少 B.可估计相对危险度 C.可计算发病率 D.可以选择没有疾病的人作对照 E.估计暴露史时可能出现偏倚,三、问答题,1.病例对照研究的优点和局限性。2.某医师探讨精神分裂症与遗传的关系,获得下列资料:精神分裂症患者有家族史、对照无家族史为32对;精神分裂症患者无家族史、对照有家族史为9对;精神分裂症患者和对照皆有家族史为13对;精神分裂症患者和对照皆无家族史为18对。请回答:A.该研究属何种类型的研究。B.列出该项资料的分析模式。C.进行显著性检验。D.计算比值比(OR)。E.对该研究结果加以解释。,3.某医院用病例对照研究探讨近期口服避孕药(OC)与心肌梗塞(MI)的联系,病例为该院25-49岁患心肌梗塞的妇女,对照为该地25-49岁女性的随机样本。两组均访问收集三个月前口服避孕药的资料。结果如下:,口服避孕药,A.对该数据进行分析,确定OC和MI是否存在统计学关联。B.确定OC和MI之间的关联强度。C.该项研究可能存在哪些偏倚?如何控制?,1、巢式病例对照研究(nested case control study)2、病例-队列研究(case-cohort study)3、病例交叉设计(case-crossover design)4、单纯病例研究(case only study or case series study)5、病例-时间-对照设计(case-time-control design),病例对照研究的衍生类型,巢式病例对照研究,Nested case control study,队列内病例对照研究 Case control study nested in a cohort,概念,是一种将队列研究和病例对照研究相结合的研究方法。先建队列,然后收集每个队列成员的详细暴露史,以及有关混杂因素资料,确认随访期间内发生的病例,再应用病例对照研究的设计思路进行研究分析。所研究的病例和对照均来自同一队列。,实施方法,1、确定某一人群作为研究队列2、收集队列内每个成员的相关信息和生物标本3、随访一段预定时间4、确定随访期间内发生的所研究疾病的全部病例组成5、用危险集抽样为每个病例抽取一定数量对照构成对照组6、抽取已收集好的两组成员的相关信息和生物标本做必要 的检验7、做统计分析计算暴露率和OR8、获得研究结果并做出结论,优点,1、病例与对照的暴露资料均来自疾病或死亡未发生之前,故不存 在暴露与疾病的时序问题,也不存在回忆偏倚2、病例与对照的可比性好,相对于内对照3、较省力4、可提高统计效率,因队列成员的暴露率较一般成员高5、如探索研究多种疾病病因,可共用一组对照,缺点,时间依赖性 随访时间的延长 对照可能成为病例,病例交叉设计,Case-Crossover Design is a scientific way to ask and answer the question that“Was the patient doing anything unusual just before the onset of the disease?”,Hazard,Control,Event,Exposure,Case-Crossover Design,Im sosick.,Did I do anythingunusual rightbefore the illness,in comparison tomy usualroutine?,To answer this question,we need to do the comparison within the individual.,Illness,Controlperiod,Hazardperiod,It is a design that compares the exposure to a certain agent during the interval when the event does not occur(control period),to the exposure during the interval when the event occurs(hazard period).,Case Crossover Design,It is related to prospective crossover design.“Crossover”means an experiment in which all subjects pass through both the treatment and placebo phases.Each individual serves as his or her own control.It is a matched case-control study but involves cases only and each individual serves as his/her own control.The data from a case crossover design can also resemble cohort data if the control data are units of person-time.,Hazard,Control,Event,Exposure,Case Crossover Design,HazardPeriod,ControlPeriod,EventOnset,Exposure?,Exposure?,How to Analyze Case Crossover Data?,Since in the case crossover design we are comparing the exposure in the hazard periodto the exposure in the control period,and the individual serves as his or her own control,the analysis will be very similar to that ofa match case-control study.,Hazard,Control,Event,Exposure,Assuming the lengths of hazard period and control period are the same.,Collect the data in the hazard period and control period.Assemble the data into a 22 table as we do in the match case-control study.,Analysis of Case Crossover Design,Control Period,Hazard Period,Exposure,Non-exposure,Exposure,Non-exposure,a,b,c,d,Odds Ratio=b/c,Hazard,Control,Event,Exposure,95%CI=(b/c-1.96SD,b/c+1.96 SD),Example,Association of Cellular Phone Calls andMotor Vehicle Collisions,(Redelmeier DA,et al.NEJM 1993;329:1677-83),Event:Motor vehicle collision Exposure:Cellular phone call Hazard period:10 min before the crash Control period:Same time period on the day before the collision,Example Cellular Phone Calls and Collisions,Comparing the cell phone use during the hazardperiod(10 min before the crash)and during thecontrol period(same time period but the day before the crash),9 pmMay 28,10 min,10 min,9 pmMay 27,Cell phone calls?,Example Cellular Phone Calls and Collisions,Data were collected from 699 drivers who had cellular phones and who were involved in motor vehicle crashes.,Control Period,Hazard Period,Exposure,Non-exposure,Exposure,Non-exposure,13,157,24,479,Example Cellular Phone Calls and Collisions,Control Period,Hazard Period,Exposure,Non-exposure,Exposure,Non-exposure,13,157,24,479,Odds Ratio=157/24=6.5,Conclusion:,Data were collected from 699 drivers who had cellular phones and who were involved in motor vehicle crashes.,课外作业 病例对照研究设计,目的:理解并掌握所学过的理论知识并学会如何应用。内容:撰写一份“疾病危险因素的病例对照研究设计书”,并根据设计和研究内容拟定一份调查表。时间:2009年10月31日形式:文件名为本人姓名,如“喻荣彬.doc”,题目:疾病危险因素的病例对照研究设计书,格式:,一、背景二、目的和意义三、研究内容四、研究方法 1、研究方法类型 2、研究对象 3、研究变量 4、调查根据调查表 5、资料收集(调查、检验)6、统计分析、主要指标五、文献目录,