临床研究的质量控制课件.ppt
第六章 临床研究的质量控制,第一节 研究的真实性 第二节 研究的可靠性,第一节 研究的真实性,一、真实性二、偏倚 三、选择偏倚四、信息偏倚五、混杂偏倚六、交互作用的识别,1,一、真实性,真实性 一系列观察或研究所作推论的正确及可靠程度,即所得结果反映了欲测试对象的真实情况。研究的真实性 在充分考虑了各种影响结论或推断的因素后,将研究结果外推至样本以外人群时的真实程度,包括内部真实性和外部真实性。,内部真实性 internal validity 指一项能正确反映研究人群及目标人群真实状况的研究结果的外延性。内部真实性强调研究结果是否无偏地反映了所研究因素与疾病的真实联系。通常受误差(随机误差和系统误差)影响。,外部真实性 external validity从研究中得出的联系可否被外推至不同时间、不同地区的不同人群。,1,二、随机误差和系统误差,误差可分为随机误差和系统误差。,以测量血压为例说明随机误差与系统误差之间的关系。,某技术熟练医师测量某人舒张压,先由动脉内插管反复测量,各次读数的均值为80mmHg。此法虽然准确但在实际应用中有困难。再用血压计反复测量,各次测量结果均在套管法测量值的右侧,其均值为90mmHg。由血压计测量个体血压所得的数值相对于套管法测量的误差,即为系统误差,这显然是由于检查器械和方法的不同所引起的。但是无论单用插管法测量还是单用血压计法依然有误差,这是随机误差,是由于机体血压本身就有瞬时变化和测量中的偶然因素所引起的,各自的变异结果均服从随机分布。,观察 系统误差次数 随机误差 80 90 舒张压(mmHg)图2 动脉内插管法和血压计法测量舒张压值的分布,动脉内插管法,血压计法,随机误差,第一节 研究的真实性,一、真实性二、偏倚 三、选择偏倚四、信息偏倚五、混杂偏倚六、交互作用的识别,二、偏倚,(一)偏倚的定义 对所得观察资料的推理偏离真实值,或自样本人群所得暴露变量与结果变量的联系不能反映目标人群的暴露变量与结果变量间的真实联系即谓之偏倚。,偏倚是一种系统误差,具有方向性。正方向,使原来的真实值被夸大,负方向,使原来的真实值被缩小。,(二)偏倚的方向,偏向,A.,B.,C.,颠倒偏倚 switchover bias 当 RR()0.5,RR()1.5,或反之,即所产生的偏倚跨过零效应值1.0,由保护效应偏离为危险效应,或由危险效应偏离为保护效应。,颠倒偏倚使偏倚的结论走向原真实情况的反面,歪曲了真相。,(三)偏倚的种类,临床研究从设计、实施、分析至推断过程中均可发生偏倚。偏倚可存在于各种类型的研究中。偏倚发生的环节繁多,形式各异,大致可分为以下三类:1.选择偏倚:主要发生在研究的设计阶段 如入院率偏倚、奈曼偏倚和检出征候偏倚等。2.信息偏倚:主要发生在研究的实施阶段 如报告偏倚、调查者偏倚和回忆偏倚等。3.混杂偏倚:主要发生在研究的设计和分析阶段,第一节 研究的真实性,一、真实性二、偏倚 三、选择偏倚四、信息偏倚五、混杂偏倚六、交互作用的识别,三、选择偏倚 selection bias,(一)定义 医学研究过程中,从按一定的条件纳入的研究对象中获得的有关因素与疾病的联系,不同于目标人群中该因素与疾病之间的真实联系,即认为有选择偏倚存在。,(二)种类 1.检出征候偏倚 detection signal bias 由于某因素的存在而引起某种疾病症候出现,使患者提早就诊,导致该病的检出率增高,形成所研究因素与疾病有关的假象。口服雌激素子宫内膜癌的关系 服雌激素者易发生子宫出血而去医院就诊从而被发现子宫内膜癌而被选入病例组,因而病例组中选择地纳入大量口服雌激素的子宫内膜癌患者。进一步分析可见服用雌激素的病人中79为早期子宫内膜癌病人,未服用病例中早期病例为55。,2.诊断偏倚 diagnostic bias,当临床医生对暴露者与非暴露者采用不同的诊断或报告标准时,例如,疾病没有严格的统一诊断标准时,临床医生可能根据所掌握的有关危险因素与疾病发生的知识诊断病人,从而使病例对照研究中病例的暴露史在研究开始前就部分设定。由此造成的诊断上的偏倚称为诊断偏倚。内用卫生棉条中毒性休克综合征 医生获得上述两者之间的关系后,会有意或无意地将:,有相关症状经期内用卫生棉条使用史+的妇女,大多,经期内用卫生棉条使用史-的妇女,较少,诊断:中毒性休克综合征,因而夸大了内用卫生棉条与中毒性休克综合征间的关系。,3.入院率偏倚 admission rate bias 伯克森偏倚 Berksons bias,指在以医院为基础的病例对照研究中,由于所比较各组入院率不同而导致的偏倚。,表1 以社区为基础的病例对照研究中吸烟与疾病A的关系 吸烟 不吸烟 总人数 吸烟者的比例 病例(A)200 800 1000 20 对照(B)200 800 1000 20 OR=(200800)/(200800)=1,设:某人群中患A病和患B病者各为1000人,患A病和B病的患者中各有20%的人吸烟。如表所示。,1A病又吸烟的200人中,(1)因A病住院率为50,其住院人数为100人(20050%)(2)吸烟者入院率为40%,则余下的100人(200-100)中,40人(10040)住院,合计:A病又吸烟者住院人数140人(100+40)。2.病而不吸烟的800人中,因A病住院率为50%,住院人数为400人(80050%)。,设:患A病的入院率为50%,B病的入院率为20%,吸烟者入院率为40%,这样实际住院人数应为:,3B病又吸烟的200人中,(1)因B病住院率为20,其住院人数为40人(20020%);(2)吸烟者入院率为40%,则余下的160人(200-40)中,64人(16040)住院,合计:B病又吸烟者住院人数104人(40+64)。4B病而不吸烟的800人中,因B病住院率为20%,住院人数为160人(80020%)。表2 以医院为基础的病例对照研究中吸烟与疾病A的关系 疾病 吸烟者 不吸烟者 总人数 吸烟者的比例 病例(A)140 400 540 25.93 对照(B)104 160 264 39.39 OR=(140160)/(400104)=0.54,OR=1,5.现患病例新发病例偏倚 prevalence-incidence bias,奈曼偏倚,Neyman bias 病例对照研究 队列研究 结论不一致,往往只纳入现患病例或存活病例,即同时纳入新、旧病例.,而不包括死亡病例和那些病程短的病例。,新发病例,病情、病型、病程和预后等都不尽相同,既往暴露状况也各有特点。,现患病例:相当部分可能为“生物学上的强者”有时会主动更改对危险因素的暴露,P.98,5-3,6.无应答偏倚 nonresponse bias,现况调查中由于调查对象不合作或不参加调查,降低了研究的应答率,或在病例对照研究和队列研究中各比较组应答率的不同,从应答人群中得出的有关研究因素与疾病的联系不能反映两者间的真实联系。无应答偏倚不仅影响对象的代表性,当使用缺失值处理软件来处理无应答者和失访者资料时,产生的偏倚可同时涉及选择偏倚和信息偏倚。,7.志愿者偏倚 volunteer bias 志愿参加观察研究者同非志愿者在关心健康、注意饮食卫生及营养食疗、禁烟禁酒、坚持锻炼等方面有系统差异,因志愿者常被入选为观察对象,而非志愿者常落选,故这样的观察或研究结果肯定存在选择偏倚,这种偏倚称为志愿者偏倚。,例如,在体育锻炼预防冠心病的观察研究中,志愿参加者作为试验组,而将非志愿者作为对照,以比较该项措施的效果。这当然是得不出正确结论的。,8.失访偏倚 loss to follow-up bias,由于失访而引起的偏倚称为失访偏倚。失访也是一种特殊的无应答形式,只是它主要发生在前瞻性队列研究及临床试验中。失访基本上有两种:失访 被动失访,一般同所观察的暴露因素或结果 无关,统计学处理时将这种失访当作截尾数据 处理,若数量不大,不至于引起偏倚。退出主动退出,一般同所研究的暴露因素或结果有关,统计处理时也当作截尾数据处理。若数量较大,且与研究中的有关变量牵连,则将产生偏倚。,不能因为A组和B组失访人数相同而采纳,而应了解各组失访的可能原因及结局,从而纠正编倚。失访产生的偏倚可同时涉及选择偏倚和信息偏倚。,(50/500)/(20/500)=2.5,(30/450)/(20/450)=1.5,P.99,5-4,5-5,9.健康工人效应 healthy worker bias,在职业流行病学研究时,当选择接触某种职业危险因素的工人作为观察对象时,很可能这些工人都是留下来不易患所研究疾病的人群,而对该危险因素敏感的那些工人可能早已转出而失访,由此可能会发现暴露于该因素者,某些疾病的死亡率或发病率反而比一般人群低,这种偏倚称为健康工人效应。,这并不能表明,木尘暴露可降低呼吸系统疾病的危险性。相反,这可能反映出健康工人效应。因为非暴露组人群中包括未从事家具制造业的人员或由于工种(劳动强度较大)的要求被排除在外的人员(身体条件较差或危险人群),因此所比较结果很可能是一种负偏倚。,有人开展了一项历史性队列研究,来评价接触木尘对呼吸系统疾病死亡率的影响。,家具制造厂的工人 暴露组,全人群,非暴露组,(年龄、性别和种族等可比),呼吸系统疾病的死亡率,10.时间效应偏倚 time effect bias,许多慢性病,自接触有效暴露之日起至出现临床表现止,其间经过一段漫长的潜隐过程,在此期间他们实际上是有暴露史但未出现症状或未能用现有检查手段发现疾病的病人,因此,常被归入健康对照组内。如此产生的偏倚称为时间效应偏倚。,11.领先时间偏倚 lead time bias,有些慢性病,例如肿瘤,自临床表现出现并被诊断后,经治疗,它的平均存活期是2年。若在健康人群中进行筛检这类疾病,使这类病人在其症状出现前3个月被检出,并被诊断和治疗,平均存活期约2年3个月,于是认为,筛检能使该病延长生存期平均约3个月。这实际上为领先时间偏倚。因为延长的 3个月是我们提早发现病人的时间,即领先时间,实际上病人的生存期自出现临床表现算起并未延长。,筛检,症状出现,诊断时间,存活时间,2年,3个月,2年3个月,(三)选择偏倚的控制,1.研究设计阶段(1)建立健全的健康监测系统 控制选择偏倚的关键在于获取有代表性的研究样本,而只有建立健全的健康监测系统(health information system,HIS),掌握全人群有关暴露和疾病的信息,才能最大限度地获取人群中有代表性的样本。,(2)采用严格科学的研究设计,在研究设计过程中应明确定义目标人群和研究人群,根据研究的性质预测样本建立过程中可能产生的各种选择性偏倚,并采取相应的措施以减少或控制选择性偏倚的发生。若选择性偏倚可能与潜在的混杂因素有联系,则可通过对研究对象加以限制或精确地测量该因素,以便在分析过程中加以控制。临床试验:随机分组 病例对照研究:病例类型 两种以上的对照队列研究:多个比较组,所有纳入研究的对象都必须符合事先设立的纳入标准,包括疾病诊断标准和暴露判别标准。应尽可能选取合格的新发病例,避免来自存活者的偏倚。,(3)明确对象纳入标准,统一疾病诊断和监测程序,2.资料收集阶段,(1)加强随访,提高应答率在队列研究和干预试验的实施过程中应动态地掌握整个队列的变迁,定期随访、记录队列中有关暴露与疾病的变化,做好研究的宣传和解释工作,减少中途退出和失访。现况调查中应尽量减少无应答的发生。可通过各种途径增加对象对研究意义的了解,减少研究结对象带来的不便。当无应答率大于10时,应以无应答者的随机样本来比较其与应答者有关敏感信息的可比性,从而估计无应答偏倚对研究结果的影响程度。,(2)尽可能收集有关暴露史的详细信息 暴露程度、时间、暴露改变以及原因(3)确保疾病的诊断不是依据暴露史而得出 3.数据分析阶段 基线特征比较:应答者-无应答者 完成随访者-中途退出者 估计伯克森偏倚:不同对象入院率,第一节 研究的真实性,一、真实性二、偏倚 三、选择偏倚四、信息偏倚五、混杂偏倚六、交互作用的识别,四、信息偏倚 information bias,(一)定义 指研究实施过程中,由于所收集的有关暴露或疾病的信息不准确或不完整,造成对研究对象或结果的归类错误。信息偏倚可来自对各种医疗和监测记录的摘录过程,也可来自调查表询问和疾病报告过程。,又称 观察偏倚 observation bias 错分偏倚 misclassification bias,(二)信息偏倚的种类 1.错分偏倚(1)回忆偏倚 recall bias,所调查的因素发生于过去,由于调查者记忆失真或不完整造成结论的系统误差。多见于病例对照研究和回顾性队列研究。既往经历对病例和非病例的意义往往不同,病例组对既往暴露情况的记忆深度和详细程度通常较对照组为甚,由此造成了回忆偏倚在各比较组中分布不同。如果对象因种种原因如高龄、年幼、重病或死亡不能直接应答而由其配偶、父母、子女或其他亲属代理时,所获得的准确性还受到被询问代理者的记忆和对对象的了解程度的影响,由此导致的偏倚又称代理者偏倚(surrogate bias)。,欲研究类风湿关节炎的家族史,发现类风湿关节炎的病人比对照更有可能提供阳性家族史。然而,再从病例家庭中未患该病的同胞兄弟姐妹中调查发现,阳性家族史和对照组相比,这种联系就不存在了。,(2)报告偏倚 reporting bias,研究对象对某些信息的故意夸大或缩小。当暴露因素涉及到生活方式或隐私如饮酒、收入水平、婚姻生育史和性行为时,被研究对象会因种种原因而隐瞒或编造有关信息,有时代理者也会为了病人或死者的声誉而故意隐瞒某些不良暴露史,从而影响了所提供信息的准确性,导致报告偏倚发生。报告偏倚的影响因其在各比较组的发生程度而异,其作用同样是双向的。,(3)调查者偏倚 interviewer bias,调查者在收集、记录和解释来自研究对象的信息时发生的偏倚称为调查者偏倚。由于研究者渴望建立并验证某些因素的作用,往往会尽其所能地去主动发现和诱导对象提供所需要的信息,最终影响了各比较组中对暴露或疾病状况的认定。病例对照研究 暴露因素 队列研究和干预试验 诊断和发现疾病,(4)测量偏倚 measurement bias,由于研究中所使用的仪器、设备、试剂、方法和条件的不精良、不标准、不统一,或研究指标设定不合理、数据记录不完整,造成研究结果系统地偏离其真值的现象。可发生在各种流行病学研究的设计、实施和资料处理过程中。例如,同一调查过程的不同调查点使用的仪器型号,或使用年限不同,或精确度差异较大;各调查点对同一研究指标采用不同的实验室检测方法,或尽管使用同一检测方法,但其检测试剂的供货商、品牌或批号不同等。,(二)信息偏倚的种类,1.错分偏倚2.均数回归趋势3.生态学偏倚 生态学谬误是研究方法本身的局限性所致,(三)信息偏倚的测量,信息偏倚的主要表现形式为错误分类,无论是暴露状态、疾病结果还是混杂因素都可发生错分。1.错分测量的灵敏度和特异度 对于错分,不管是病例对照研究还是队列研究,都可根据错分的灵敏度和特异度来估计其对危险度的影响,此处以病例对照研究为例来加以阐述。,病例组:暴露对象被分类为暴露的概率=灵敏度(Se)非暴露对象被分类为非暴露的概率=特异度(Sp)Se=54/60=0.9 Sp=28/40=0.7对照组:Se=18/30=0.6 Sp=63/70=0.9,在有已知或估计的Se和Sp的情况下,可计算调整的OR。设:a、b、c、d为调整前的四格表内相应 值,A、B、C、D为调整后四格表内相应值(表69),(四)信息偏倚的控制,信息偏倚主要来自资料收集和解释过程中的不正确信息,而产生这些不正确信息的原因可以是研究对象本身的记忆误差,也可以由研究者的态度或方法不当所致,更重要的是在研究设计过程中对调查表设计、指标设立和检测方法的选择缺乏科学性和合理性。因此,控制信息偏倚就要在研究的不同阶段控制和消除影响信息准确性的各种因素。,1.研究设计阶段,暴露因素 有严格、客观的定义,并力求指标定量化。疾病诊断标准 统一、明确调查表项目 应易于理解和回答获取研究对象配合和支持 知情 同意质量控制程序 严格培训调查员;定期检查资料的质量,2.资料收集阶段,在研究中可对同一内容以不同的形式重复询问,以帮助对象回忆并检验其应答的可信性。可在询问中使用实物等定量,以便于对象理解并准确地定量。为了避免主观诱导对象,应严格培训调查员,尽可能“盲法”研究中的各种测量仪器、试剂和方法都应标准化。,3.资料分析阶段,对错误分类的结果,可进一步在资料分析过程中加以测量、校正,必要时可进行相应的灵敏度分析。,第一节 研究的真实性,一、真实性二、偏倚 三、选择偏倚四、信息偏倚五、混杂偏倚六、交互作用,五、混杂偏倚 confounding bias,(一)定义 在流行病学研究中,由于一个或多个外来因素(又称第三因子)的存在,掩盖或夸大了研究因素与疾病(或事件)的联系,从而部分或全部地歪曲了两者之间的真实联系,称为混杂偏倚或混杂。引起混杂的因素称为混杂因子(confounder)。混杂可在队列研究中发生,也可在病例对照研究中发生。,(二)形成混杂的条件,假设:暴露因素 E 研究的疾病D 如果 混杂因子F 则应满足如下条件:F必须与D的发生有关,是该疾病的危险因素之一;F必须与E有统计学联系;F必须不是E与D病因链上的中间环节或中间步骤。满足这些基本条件的F如果在所比较的各组间分布不均,就可导致混杂偏倚的发生。,在研究体育锻炼心肌梗死的关系时,年龄可能影响两者之间的真实联系。,非锻炼组,锻炼组,年轻者比例较高,年长者比例较高,心肌梗死危险性,高估体育锻炼对心肌梗死保护作用,年龄因素产生混杂作用,心肌梗死发生率,在研究体育锻炼心肌梗死的关系时,每日水摄入量不可能影响两者之间的真实联系。,非锻炼组,锻炼组,每日水摄入量,每日水摄入量并非心肌梗死的一个危险因子每日水摄入量因素不产生混杂作用,心肌梗死发生率,每日水摄入量,心肌梗死危险性,在研究体育锻炼心肌梗死的关系时,体质指数不影响两者之间的真实联系。,非锻炼组,锻炼组,体质指数,锻炼 体质指数 心肌梗死危险,心肌梗死发生率,体质指数,不成为混杂因子,中间环节,(三)混杂的判断和测量,1.判定混杂的依据(1)(2),或,未控制混杂因素前RR(OR)与控制混杂因素后RR(OR)不等,即可疑的混杂因素应在无暴露因素存在的条件下,同疾病间有联系。,或,或,(4)可疑混杂因子F不应是暴露变量同结果变量之间,或因果联系路径之间的一个中间变量。,(3),可疑混杂因子在暴露组及非暴露组中的分布比例不等;或:混杂因素应在无病例存在的条件下(对照组中),同所研究的暴露因素间OR1。,上述内容用箭头图总结如下:,(1)-(3)混杂偏倚的几种情况;其中(3)表示F是F的伴随因子,(4)-(8)无混杂偏倚存在,(4)和(5)为混杂条件不满足;(6)和(7)为因果链;(8)为复合病因。,5-3,2.混杂分析举例,在一次非配对的病例对照研究中,暴露因素为X,疾病为D,潜在混杂因素为年龄,研究结果如表5-6所示。P.105,5-6,5-7,代表一般人群的对照组中,40岁以下年龄组的暴露比例远低于40岁以上者。,5-8,用 Mantel-Haenszel计算的 aOR为 l.0。从上述分析可见,X与 D的调整前cOR为1.9,但按年龄分层后,ORicOR,OR40和OR40相等,且 aORcOR,此时可认为年龄作为一个混杂因素,夸大了X与D间的真实联系。,5-9,cRR(cOR)分层后的RRi(ORi)或cRR(cOR)aRR(aOR),,混杂,效应修饰 effect modification,cRRaRR分层 RR相等以混杂为主,cRRaRR 分层RRi不等以效应修饰为主,理论上,当样本足够大时,,分析的目的,混杂作为一种偏倚,是为了从所得的联系中校正或去除其作用,效应修饰是两种或多种因素共同存在时产生的相互作用,是研究者所要研究、估计和报告的一种真实的存在,3.正混杂和负混杂,正混杂 由于混杂的存在,使暴露-疾病之间的cRR被夸大,其值远离1。负混杂 由于混杂的存在,使暴露-疾病之间的真实存在的联系被掩盖了,cRR被缩小,接近于1。,混杂性质的判定归纳如下表,(四)混杂偏倚的控制,1.在研究设计和资料收集阶段限制 restriction 病例组和对照组或暴露组和非暴露组的条件加以限制。如年龄、性别、病型、并发症。匹配 matching 成组匹配或个体匹配随机化分组 randomization 临床试验中,2.在资料分析阶段,分层分析 straitification 按病情或年龄、性别等分层。标准化 standardization 多因素分析:如多元回归分析、logistic回归分析、Cox回归分析灵敏度分析 对于不确定性,无法测量的混杂,术前危险因素:年龄、心功能、冠脉阻塞程度等对术前危险因素的不同进行分层分析,则两医院各层的病死率相同。,p.108,标准化后,乙医院和甲医院的病死率相等(4.00%),说明两所医院的手术病死率之差异是由于两所医院病人术前高危因素者所占的比例不同而引起的偏倚所致。甲医院病人中,42属高危因素者,而乙医院只有17的病人属高危险因素者。,2.在资料分析阶段,分层分析 straitification 按病情或年龄、性别等分层。标准化 standardization多因素分析:如多元回归分析、logistic回归分析、Cox回归分析灵敏度分析 对于不确定性,无法测量的混杂,第一节 研究的真实性,一、真实性二、偏倚 三、选择偏倚四、信息偏倚五、混杂偏倚六、交互作用的识别,六、交互作用的识别 interaction,(一)交互作用的定义 当两个或两个以上因子共同作用于某一事件时,其效应明显不同于这两个或两个以上因子单独作用时的和或积,称这些因子间存在交互作用。事件:疾病、健康或某种状态。,P.262,(二)交互作用与混杂的区别:,交互作用是研究中需要发现并加以描述和评价的一种客观现象,它的存在取决于因素的内在作用机制,不可任意去除或添加,与研究设计无关。采用统计学方法可以对交互作用进行定量描述和评价。混杂是对研究真实性的一种歪曲,研究者可以在研究的设计阶段采取有效的措施尽量避免,或者在资料分析阶段通过适当的统计学方法分析、排除。,(三)交互作用的类型,协同作用(synergism)(正交互)当两个或两个以上因子共同作用于某一事件时,其效应明显大于这些因子单独作用时的和或积,称之为协同作用。拮抗作用(antagonism)(负交互)当两个或两个以上因子共同作用于某一事件时,其效应明显小于这些因子单独作用时的和或积,称之为拮抗作用。,统计学中,分析因素之间交互作用常用的数学模型:相加模型 additive model 相乘模型 multiplicative model 交互作用的确定依赖于模型的选择。,(四)交互作用数学模型,P.263,R00 _ X-,Z-的危险度 R11 _ X+,Z+的危险度 R10 _ X+,Z-的危险度 R01 _ X-,Z+的危险度,相加模型角度,相乘模型角度,相加模型假定:若交互作用不存在时,两个或两个以上因子共同作用于某一事件时,其效应等于这些因子单独作用时的和,此时称之具有可加性。以两个因素为例,假设两个因素X与Z为二分变量(表13-10),则该模型可以表达为:,1.相加模型 additive model,2.相乘模型 multiplicative model,相乘模型假定:若交互作用不存在时,两个或两个以上因子共同作用于某一事件时,其效应等于这些因子单独作用时的积。仍以两因素为例,假设同前。该模型可以表达为:,以假设的数据为例,来说明这一问题。如果:吸烟:x因素 石棉暴露:z因素 则可得下表的结果:,代入相加模型,得到 R11R00(R10R00)+(R01R00)401=39 8l5l=11 代入相乘模型,得到 R11R00(R10R00)(R01R00)40l=40=(8l)(5l)40,吸烟与石棉暴露之间存在交互作用,吸烟与石棉暴露之间不存在交互作用,R11=40,R108,R015,R001,(五)交互作用的识别,1.交互作用识别的一般过程 所研究因素-事件 无 有 统计学联系 有 无 偏倚或混杂 交互作用?,控制混杂,2.分层分析 分层分析是比较经典的识别交互作用的方法。可以通过可疑交互因素分层后,分析层间的效应测量值RR或OR来判断是否产生交互作用。如果各层之间的效应测量值RR或OR不同,则可能存在交互作用。但是鉴于各层RR和OR变异可能是机遇所致,因此必须进行统计学检验。相应的统计学方法有Mental-Haenszel法、Woolf法、直接分层分析和最大似然比检验等。,3.多因素回归模型 在流行病学病因研究中,可用多因素回归模型(因子乘积项)来识别交互作用。,(1)相加交互作用的回归分析 用x和z分别代表两个研究因素,则一个带有交互作用的线性回归模型为:,当模型中的交互作用项的回归系数(3)有统计学意义时,表示两因素存在交互作用(相加模型),(2)相乘交互作用的回归分析,Logistic回归模型是一种常用的识别相乘交互作用的方法。一个带有交互作用两因素Logistic回归模型为:,当模型中的交互作用项的回归系数(3)有统计学意义时,表示两因素存在交互作用(相乘模型),Rothman提出的三种交互作用指标的计算方法 假设同前:RR00 X-,Z-时的RR RR11 X+,Z+时的RR RR10 X+,Z-时的RR RR01 X-,Z+时的RR 根据交互作用相加模型,可以得到如下指标:,4.交互作用的定量分析,(1)交互作用超额相对危险度 relative excess risk of interaction,RERI,(3)交互作用指数 S the synergy index S,S,(2)交互作用归因比 attributable proportions of interaction,API,交互作用存在时不应为 0,交互作用存在时不应为 0,交互作用存在时不应为 1,这三个指标中,交互作用归因比(API)可以评价两因子同时存在时可归于其交互作用的比例,公共卫生学意义较大。当交互作用存在时,超额相对危险度与归因危险比不应为0,而交互作用指数应不为1。这只是一个点估计,存在着误差,必须估计其可信区间,看其是否包含0或1,这样才能得出有意义的结论。,5.广义相对危险度模型 generalized relative risk model,GRRM GRRM无需事先假定研究资料的模型,能够比较客观地评价因素之间的相互关系。通常可通过GRRM加以拟合,然后采用与研究资料最接近的模型来确定交互作用。交互作用的识别相当繁杂,在下结论时一定要谨慎,因此有必要对此进行更深人的讨论。,第一节 研究的真实性第二节 研究的可靠性,一、研究的可靠性,研究的可靠性指估计人群某个参数时不发生随机误差的能力。概念上类似于把握度。把握度(1-)反映了当差别确实存在时,正确地拒绝无效假设的能力;可靠性反映了不受随机误差影响正确地估计参数的能力。因此,可靠性相对于参数估计,就如同把握度相对于统计学检验一样,理想的流行病学研究对结果参数的估计要求较高的可靠性。,二、研究的可靠性估计,(一)统计学效率 研究的统计学效率可以用于估计研究的可靠性。统计学效率指单位样本所提供的统计信息量,可以用研究参数的可信限范围衡量。通常用95%可信限范围表示。在相同样本量下,可信限范围宽 研究的可靠性低 窄 研究的可靠性高,(二)样本量,样本量也可以用于估计研究的可靠性。流行病学研究没有绝对的样本量标准,不同的研究设计类型、研究要求(、)决定了研究的样本量。一般而言,样本量越大,结果的估计越精确。但是,盲目地追求大样本可能会影响研究的可行性,增加研究成本,且增加的投入与额外获得的可靠性之间并不能达到成本效益合理。,成本增加+2倍+4.5倍(不可取),P.111,三、提高研究可靠性,限制对象纳入条件均衡所比较的各组对象人数,成本增加 0.8倍,谢谢,