医学研究设计基本原则.ppt
第六章 医学研究设计的基本原则,实验设计的原则是从统计学角度要求在实验设计中应该给予特别注意的三个重要问题:对照、重复、随机化。此外还有盲法和均衡的原则。如果不注意这些问题,不按照这些原则进行设计,便可导致出错误的结果,研究结果也难以令人信服。,对照(control)随机(randomization)重复(replication)均衡(equilibrium)盲法(blind trial),第一节 对 照,对照(control)是实验设计的基本原则中的首要原则。对照即“齐同对比”,除了要观察研究的因素外,实验组与对照组一切条件应尽量相同,要有完全的可比性,才能排除其他影响因素,对试验观察的项目做出科学结论。,对照的意义:(1)鉴别处理因素的效应与非处理因素的效应之间的差距:(2)消除或减少实验误差 没有对照无法进行比较,没有比较就不可能得出结论;没有对照也难以认识研究因素的本质。,处理组对照组,处理因素+非处理因素(无)非处理因素,处理效应+非处理效应(无)非处理效应,比较结果 处理因素 处理效应,排除“非处理因素”的影响,从而衬托出“处理因素”的作用。,区分处理因素与非处理因素的效应,是比较的必要基础,消除和减少实验误差,非处理因素,非处理效应,处理组,对照组:,比较结果,处理因素,处理效应,对照的分类,依时间划分:同期对照-在同一时间内平行进行观察。历史对照-以过去资料与本次实验结果进行对照。依对照物划分:空白对照-在临床疗效对比实验中,原则上不用。实验对照 标准对照 参考值对照,依对照方式划分:配对对照-同源配对对照;异体配对对照 组间对照 交叉对照 相互对照-以几个受试因素分别施加于不同的实验组,不另设对照组,而是几个组之间互为对照。潜在对照-以“前无先例”为对照,是一种特殊形式的回顾性对照。凡不能自愈或快速致命的疾病,试用 药可以治愈或存活,虽无对照,亦可肯定其疗效。,阴性对照:不含研究中处理因素的对照,又称无处理对照。对照组应是阴性结果。空白对照:完全不给处理因素的对照,临床上很少使用,多用于动物实验 安慰剂对照:施加与处理因素无关的条件,使用的安慰剂(如药物或器械)不能让对照者知情。但由于心理因素的影响,也可产生意想不到的“药效”,且也有出现副作用者 盲法对照:在安慰剂基础上发展起来。病人和判断疗效者并不知道谁是对照组,谁是试验组。是集对照和随机于一体,结果比较客观。,依对照的方法,对照的方法,阳性对照:采用已知疗效的方法处理做对照,又称有处理对照。其结果应是阳性。标准阳性对照:用已知有效药物为标准对照组,与试验用药治疗组进行对照。选用药典或部颁标准所收载的同类药物 弱阳性对照:是指用非标准条件所进行的阳性对照,严格讲是不规范的。,对照的方法,自身对照:对照与试验在同一病人身上进行。例如,用药前后的对比、先用甲药后用乙药的比较等对照 复合处理对照:用于中西医结合治疗疑难危重病人。试验组除加用试验的药物外,其它与对照组相同 复方取代对照:适用于贵重或稀缺中药代用品的研究,治疗组用代用品,对照组用原标准制剂,对照组设置时必须具备三个条件:,专设 任何一个对照组都是为相应的实验组专门设立的。不得借用文献上的记载或以往研究或其它研究的资料作为本研究的对照组。同步 对照组与实验组设立之后,在整个研究进程中始终处于同一空间和同一时间。对等 除研究因素外,对照组具备与实验组对等的一切因素。,一、空白对照(blank control),不给任何处理或干预措施(intervention)的对照。例如:实验组儿童接种疫苗,对照组儿童不接种疫苗。试剂空白、血样空白、无酶解空白、底物空白等。空白对照简单易行,但容易引起实验组与对照组在心理上的差异,从而影响效应的测定。,二、实验对照(experimental control),在许多情况下,空白对照不能包含影响实验结果的全部因素,采用与实验组操作条件一样的干预措施,称为实验对照。只有确知对照的干预操作对实验结果无影响时,才可以用空白对照。但许多情况下对照操作对实验结果是有影响的,不可省掉。,赖氨酸对儿童发育的影响某复方煎剂的利尿作用,1.毒性实验操作对照 作毒性试验时,对照组应用同样给药途径给予溶媒。因为不论灌胃或注射,在技术不够熟练时,对照本身可能造成损伤甚至动物死亡。2.假手术对照 动物实验如果进行外科手术,对照组应该进行与实验组相似的假手术,以排除手术创伤和感染造成的影响。3.药物溶媒对照 药物的溶媒有些是有药理作用的,静脉注射吐温能降压、溶血、升高血胆固醇;二甲亚砜有止痛、抗炎、退热、扩血管、抗菌等作用。4.PH对照,三、安慰剂对照,安慰剂(placebo)与安慰剂效应(placeboeffect)安慰剂是用无药理活性的物质代替药物用于临床的一种实验对照。可产生与药物相似的药理作用(镇静、镇痛、止咳等)与不良反应(头昏、乏力、嗜睡、头痛、视力模糊、口干、恶心、腹痛、腹泻等),称为安慰剂效应。,安慰作用 安慰剂可以产生安慰效应。语言、文字诊断治疗的环境与操作也可产生类似安慰剂的应效应,称为安慰作用。功能性疾病或受精神因素影响较大的疾病住院的疗效部分与安慰作用有关。安慰作用与安慰剂作用的原理与影响因素 人有强的精神或心理作用,病人的精神因素对机体与疾病有重要影响。通过暗示或第二信号系统的作用,可影响病人的感觉和功能。,影响安慰剂与安慰作用强度的因素病人的精神状态与神经类型病情因素 安慰剂对受精神因素影响大的慢性疾病作用较强,对受精神因素影响小的严重器质性疾病作用较弱。安慰剂对照 新药或老药新用途的临床试验,其目的是评价药物本身的疗效和安全性,必须排除药物以外因素所引起的作用与不良反应。为此,在不损害病人健康的条件下,对受精神因素影响较大的慢性疾病,应尽量采用安慰剂作对照。,安慰剂的适应证如下:新药或老药新用途治疗慢性病临床试验的阴性对照;轻度精神忧郁的治疗,作为心理治疗的一部分;慢性疼痛病人对安慰剂有效者,可间断用安慰剂,减少镇痛药的不良反应;诊断已确定不需要药物治疗的疾病,病人要求药物治疗时。随着医学进步,安慰剂的治疗应用应当逐步减小,只有在尚无肯定有效药物情况下,方可使用安慰剂作治疗用。采用安慰剂对照,意味着对照组不接受任何实质性治疗,因而病情严重是不可取的,对于手术等其它疗效法显然无法应用。,四、有效对照或标准治疗对照,在评价某种药物或疗法(外科手术等)对较重疾病的疗效时,为不延误病人的治疗,不能用安慰剂对照,但可用已知的有效药物、有效的疗法或公认的标准疗法作对照。试验组接受新药、新疗法治疗 对照组接受已公认的“标准”方法治疗 优点:安全、稳妥、容易被医生和病人接受、不存在道德上的困扰。标准治疗对照(standard control)与随机同期对照有机结合起来,应该为临床试验最好的对照形式。,五、配对对照,包括同源配对与异体配对。由于配对对照的抽样误差最小,其统计学效率最高,可节省样本数,故有条件时应优先选用。1.同源配对 是指同一个体前后不同时间比较对照期与试验期结果的差异,或比较同一个体左右两部分(如眼睛;肢体)分别作对照处理与试验处理的差异。对有短期自愈倾向或周期性发作倾向的疾病,不可采用此方法。,2.异体配对 严格的异体配对是选用同卵双胎的人,由于遗传基因完全相同,所以两个人从外表到体内代谢甚至对疾病的易感性都相同,药物的代谢动力学表现也相差无几。因此,可看作同一个体作配对分组;同窝的性别、体重相同的动物或性别、年龄、病情相同的病人也可作异体配对分组。,六、组间对照,是用不同个体随机分组,分别接受对照处理与试验处理,比较两组或几组间的差异。因为各组间同时进行,又称为平行对照,适用于不能应用配对对照的情况。缺点:由于存在个体差异,抽样误差较大,办法:使得到统计学显著性所需要的样本数要多些。同时尽可能按病人相近的性别、年龄、病情、病型等组成对子。,七、交叉对照,为减少组间对照因个体差异大造成的抽样误差,可将先接受对照处理的随后接受试验处理,先接受试验处理的随后接受对照处理,通过交叉减少个体差异。用同一批动物或人作两种甚至两种以上的处理,适合比较短作用的药物,且两药中间必须间隔足够的时间使作用消失。病情等条件必须基本不变,否则就失去可比性。,例如:对某药A进行临床试验,用B 药作安慰剂对照,C药作已知有效药对照。可作拉丁方交叉设计:甲组病人:A药B药C药乙组病人:B药C药A药丙组病人:C药A药B药,优点:每一对象都有接受治疗的机会,容易为病人和医生所接受;用自身对照消除了个体差异的影响,更为精确;样本数可以减少一半,可达统计学要求;属前瞻性研究,条件可以控制,结果准确。缺点:每例患者都要等到类型症状发生才能治疗,难以保证每例均能完成两种治疗;不能保证每次病情发作的程度;对病情缓解后需用药维持以稳定病情的病人很不利。如高血压病的治疗,缓解后又必须维持治疗(不能停药)。,八、历史对照,是用自己过去的或文献上别人的资料作对照,除公认的难治性疾病如恶性肿瘤、狂犬病等以外,最好不用。对确诊的恶性肿瘤,如果能治愈十几例就可以与文献资料比较作出有效的结论。应用历史资料对照时要注意分析现在治疗条件比过去的改进,用齐同对比分析病例构成的差异,才能得出恰当的结论。这方面如不注意易引起错误。历史对照是一种非随机、非周期对照,因不设对照组,不需安慰剂等,可以起到初筛和定向作用。,缺乏对照的案例,原文题目:静脉应用维拉帕米治疗快速型心房颤动的临床观察受试对象:选择快速型房颤38 例。男22 例,女16 例,年龄2478 岁,平均52岁,心室率128179 次/min,房颤持续时间2 d 至11 年。用药方法:常规心电监护。维拉帕米加入葡萄糖10 ml 中,于5 min 内静脉注射完毕。如果15 min 后心室率减慢不显著,再予维拉帕米 静注。观察用药后5、10、15、20、30 min 的心室率及血压变化。疗效判断标准:显效:用药后心室率减慢 30%或心室率低于100 次/min;有效:用药后心室率减慢20%30%,但心室率不低于100 次/min;无效:用药后心室率减慢 20%且心室率不低于100 次/min。实验结果:至30min 显效27 例、有效11 例,总有效率达100%。说明其控制房颤之心室率起效迅速、效果可靠。,辨析与解释:要考查药物的疗效,必须设立对照组,没有对照就无法鉴别优劣。本试验作者未设对照组,且未说明受试对象的选择方式。一般说来,不同心脏病引起的房颤病例,在病情、年龄等方面相差都很大,因而不能认为他们来自同一总体,归入1 个试验组不妥。合理选择对照组,对照组可选择治疗房颤的一般药物如洋地黄制剂,严格地控制重要的非实验因素,使其在各组间达到均衡一致,这样才能较好地反应实验效应的差别。对于不同心脏病引起的房颤,可适当增加各组样本数量,分开进行比较。,对照不当的案例,原文题目:肝炎灵联合丹参注射液治疗慢性乙型肝炎60例实验目的:通过两药合用看是否能增加单用药的疗效。实验设计:慢性乙型肝炎患者随机分为两组,治疗组60例,接受肝炎灵与丹参注射液联合治疗,对照组44例,接受肌苷、维生素C的治疗,两组在性别、年龄、病程、病情等方面均无显著性差异。比较两组肝功能指标恢复正常率。实验结论:两药联合应用治疗慢性乙型肝炎有良好的协同作用。,辨析与解释:从文中可见,作者的目的是想通过两药合用看是否能增加单用药的疗效,但对照组却选择了不相干的肌苷和维生素治疗。即使通过分析治疗组比对照组疗效好,也不能得出两药合用比单用其中一种药疗效好的结论,因为作者所选的对照组与实验设计的目的不符,并没有用单用肝炎灵作为对照。结论仅是原作者的主观臆断,是没有说服力的。可使对照组的患者接受肝炎灵加安慰剂治疗的处理,安慰剂在剂型、外观、用量等方面与丹参注射液相同。采用双盲法进行分组和处理,可以较好地消除偏倚。然后比较2 组的疗效,得出的结论应为加用丹参注射液是否能够提高肝炎灵的疗效。,原文题目:高血压病患者肾脏早期损害指标的探讨 实验设计:探讨高血压患者早期肾脏损害的诊断方法。研究对象为74 例高血压患者,男43例,女31例,平均年龄61岁(4073 岁);对照组为53名体检健康的职工。辨析与解释:年纪越大的人得高血压病的机会越大,即年龄对高血压的影响具有重要作用,而对照组并未说明健康人的年龄段。在实验设计时,应结合专业知识,考虑重要的非实验因素对实验结果可能带来的影响,以免考虑不周。本实验应在实验设计时,考虑年龄这个影响因素,对照组应选取年龄与实验组年龄相近的健康人群。,对照不当的案例,第二节 随机化,一、随机化的意义 科研的任务是从“总体”中抽出一定数量的对 象为“样本”进行研究,得出规律,推及总体。为使样本能代表总体,必须缩小抽样误差。随机抽样的目的是避免人的主观性,让机遇起作用,以反映总体的客观情况,这是科研设计的原则之一。随机对照是一种前瞻性研究,是分析研究中最理想的一种设计方案。,随机原则,尽量使抽取的样本能够代表总体,缩小抽样误差,减少人为因素的干扰 使两组样本尽量一致,消除或缩小组间差异,使处理因素产生的效应符合实际,得出正确的实验结果 只有经过随机处理的结果,数理统计的显著性才有意义,随机原则,随机与随意,随机:random 机会均等,客观性随意:as will 随主观意愿,主观性随机化分组,不仅能控制已知的混杂因素(非研究因素),而且还能控制未知的混杂因素。,随机原则,随机的含义,抽样随机代表性 每一个符合条件的研究对象被收入研究范畴的机会相同,即总体中每个个体有相同的机会被抽到样本中来。分组随机均衡性 每个研究对象被分配到不同处理组的机会相同。实验顺序随机平衡顺序 每个研究对象先后接受处理的机会相同。,二、随机抽样的方法,单纯随机 拈阄(摸球、抽签)计算器法:抽签改用按RAN键 随机数字表法:查随机数字表 均衡随机 首先将易于控制的主要影响因素人为地使实验组、对照组达到均衡一致,而一些次要因素则按随机处理。如,将病情、性别作为主要因素达到均衡处理的方法,违背随机原则的案例分析,原文目的:药物疗效评价,实验设计:根据患者来院就诊的先后顺序对他们进行分组,即将先来的10 例患者分入对照组,将中间来的患者分入A 药组,将最后来的10 例患者分入B 药组。这样分组合适吗?,辨析与解释:,在某一段时间内,患者来医院就诊的先后顺序中,可能暗含着病情轻重不等的因素,按“先后顺序”分组的结果,很可能造成某些组内重症者居多,而另一些组内轻症者居多。在未进行实验研究之前,各组患者在“病情”方面的差别就已存在了,没有通过“随机化”方法尽量降低重要非实验因素对观测结果的影响,同时也就严重地违背了实验设计中的“均衡原则”,其实验结果的可靠性必然要受到影响。,辨析与解释:,旧金山医学中心1975年报道:该医院胸外科收集了80例重度冠心病人,用大隐静脉在升主动脉和冠状动脉间搭桥吻合。对照组:同等严重的冠心病但不经过外科手术只进行保守疗法,随访3年。结果:手术组生存率为98%,对照组为68%。统计学:P0.01结论:手术组疗效优于内科疗法。,三、随机性检查 使用简单随机方法易受阄形、签形与硬币的对称性等因素的影响。在临床上有些医师以入院号码的单或双决定分组,实际上,这只是半随机,对于简单随机与半随机得来的样本分组排列,应当进行随机性检查。样本分配随机性采用游程检验,当值(或值)0.05时,表示这种样本分配是随机的,当 值1.96,即P0.05时,则样本分配不是随机的。只有游程检验证明是随机的,由此得来的资料才能进行统计处理。,第三节 重复原则,一、重复的意义 要使样本代表总体,除用随机抽样方法缩小抽样误差外,重复(replication)实验是保证结果可靠的另一基本方法,是实验设计的另一基本原则。重复的含义:一是实验样本必须够大,在一次试验中有充分的重复。二是如果一批实验结果可靠,应经得起重复实验的考验。重复实验是检查科研结果可靠性的唯一方法,也是消除非处理因素影响的另一重要手段。重复程度表现为样本含量的大小和重复次数的多少。,重复化原则可对在临床设计中样本的大小做出估计,使样本在最低程度可达到满足显著性检验。在临床设计中的重复化可以解决选择病人的“基本例数”,以达到统计的要求 对象的自身变异大小 影响控制因素 允许误差大小 无限地增加样本含量,将加大实验规模,延长实验时间,浪费人力物力,反而增加系统误差出现的可能性。样本含量不足,检验效能(Power,1)偏低,导致总体中本来具有的差异无法检验出来。,二、决定重复数(样本数)的因素,1.处理的效果 处理的效果越明显,得到组间的均值差别越大,所需要的重复数越小;反之,效果不明显。组间的均值差小,则需较大样本才能达到统计学有显著性。2.实验误差 实验方法越准确,误差越小,越容易达到统计学的显著性,所需样本越小:否则,样本要大。3.抽样误差 样本的个体差异越小,反应越一致,所得结果的标准差越小,代表抽样误差的标准误越小,统计学越易有显著性,所需样本越小。反之所需样本较大。,4.资料性质 在一般情况下,计数资料样本要大才能达到统计学的显著性,计量资料则相对需较少样本即可达到统计学的显著性。但如果计数资料结果相差悬殊,对照组全为阴性,实验组全为阳性,则少数样本也可达到统计学的显著性。5.显著性检验要求的水平 实验所需样本数与实验设计规定的显著性检验水平成反比,PO.01所需样本数大于PO.05所需样本数。6.实验结果的可能性 双向结果(存在AB和AB两种可能性)所需样本数多,单向结果(只存在AB或AB一种可能性)所需样本数少。,7.实验设计的类型 从常用实验设计来看,完全随机实验设计所需样本多,配对设计与随机区组实验设计所需样本较少,拉丁方实验设计所需样本更少。与常用实验设计相比,序贯实验设计所需样本数又可少3050。可见:如果处理效果显著,抽样误差和实验误差小,则小样本即可达到统计学的显著性。反之,如果需要很大样本才有显著性,说明处理效果不佳或误差较大。故不是样本越大越好越可靠,与其用工作粗糙的大样本,不如用周密设计方法严密的小样本。但样本又必须够大才有代表性。,三、研究对象的样本量问题,设计中的样本量体现了科研设计中的重复原则,不管是在实验设计、临床实验还是调查性研究中都必须考虑样本量的问题。(一)确定样本量的意义和基本原则 在确定研究对象的观察数量时,应估算一个合适的样本量,即能保证检验效能又能节省物力,财力并缩短研究时间。,样本量的估计根据不同的设计方案有不同的方法,但有几条基本的原则:1动物性实验可作如下预计:大动物(犬、猫)515只;中等动物(兔、豚鼠)1020只;小动物(大鼠、小鼠)1530只。2新药(中药)临床研究,新药的期开放性临床实验,受试者例数为2030例;期采用双盲对照设计,所需例数不低于100对;期临床试验新药组所需例数不低于300例,并遵循随机对照原则;期临床试验仅做开放性实验,所需例数不低于2000例。,3、临床研究样本大小估计,一般慢性疾病计数资料要100300例,如是多指标的计量资料,每组需3050例。血清流行病病学调查需300 600例,一般流行病学调查需1000例以上。公认难治疾病(如恶性肿瘤)的临床研究5-10例。特殊情况下,个案报告也有价值。危重疾病(如休克、心衰等)的临床研究,一般计数资料每组3050例,计量资料每组1030例 避孕药物要求不少于1000例,每例观察时间不少于12个月经周期 肿瘤死亡率调查不能少于100000人,4随机对照设计时,尽量使得各组间的样本量相等,以提高设计的效率。5可以参考文献或根据观察指标的性质、变异度大小、期望的检验效能、和研究设计类型来估算样本含量6必须充分考虑中途动物的死亡、随访对象的失访 等因素,使得在研究结束时,仍能保证足够的样本量。,(二)影响样本量的因素1研究的效应 主要体现为效应的指标,处理的效应越明显,指标越灵敏,所需的样本量越小。通常定量的指标比定性的指标需要更小的样本量。2抽样误差 样本的个体变异越小,即标准误越小,抽样误差就越小,所需样本量越小。3实验设计的类型 越是严密的设计,所需样本量越小。如完全随机设计所需的样本量大,而配对设计和随机区组设计所需样本量较小;拉丁方设计所需样本量就更小。,4实验结果的可能性 双向结果所需样本量较大,而单向结果所需样本量较小。5显著性检验要求的水准 显著性检验水准越小,所需要的样本量越大。可见,处理因素的效应越明显,指标越敏感,抽样误差和实验误差小,则较小的样本量即能达到所期望的统计学显著性效果。相反,处理因素的效应不明显或误差太大,则需要较大的样本量。因此,与其工作粗糙的大样本,不如设计严密方法严谨的小样本。,(三)估算样本量的大小所需要的条件1型错误的概率(type error),即假设检验中的检验水准(significance level),在假设检验中,当拒绝了实际上是成立的H0假设时,就出现了“假阳性”,出现此错误的概率为事先规定的检验水准,检验水准通常取0.05或0.01,取值越小,所需要的样本量越大。2检验效能(power of test)或把握度(power),是指当两总体确有差别,通过本次实验能发现其差别的能力。用1-表示,为型错误的概率,是指当P时,没有拒绝事实上是不成立的H0假设时所犯的错误。值最大规定为0.25,即检验效能不低于0.75,通常规定=0.01,检验效能为0.90。检验效能越大,所需要的样本量也越大。,3容许误差或差值 即两总体均数之差=1-2,或两总体率之差=1-2。容许误差可以通过预备实验得到,或参考别人的实验,也可以采用临床上认为有意义的值代替。4总体标准差或总体率 同样可以通过查阅文献或进行预实验得到。,违背重复原则的案例分析,原文目的:检验两台仪器的测定结果之间的差别没有显著意义,实验设计:选择一个健康人作为受试对象,先用A、B两台仪器分别对该人重复测量4次;一个月后,再用A、B两台仪器分别对该人重复测量4次,测定的定量指标有3个,其中一个指标是“二尖瓣前叶EC幅度”,每一个指标共获得16个数据。统计分析:对这些数据进行方差分析和t检验,得出两台仪器测定结果之间差别无显著意义的结果,其专业结论是可用“自制的廉价仪器A”取代“进口的昂贵仪器B”。,辨析与解释,将“重复取样”、“重复测量”、“独立重复试验”混为一谈;同一个时间点,用同一台仪器重复测定一个人4次,这实际上是“重复取样”,其数据波动反映了测定者技术熟练程度的高低;而在一个月前后对同一个人进行重复测定,这叫做“重复测量”,其作用是考察受试者接受某种处理后,随时间推移,受试者体内某些指标的动态变化趋势,而在本例中第一次测定之后,对受试者没有什么影响,间隔一个月后在对此人进行测量,仅仅反映了指标的生理变化,没有任何实际意义。尽管每个指标有16个原始测定值,但真正的样本大小n还应该等于1,即独立的受试对象个数。严重的违背了实验设计的“重复原则”。其后果是使所观察的随机变量(即带变异性的指标)的规律性无法真实地显露出来,易于得到错误的结论。,第四节 盲 法,为了避免人为主观因素对研究结果的影响,常让受试对象或结果判定者不知道受试对象是处于实验组还是对照组,这种方法称为盲法(blind trial),盲法有单盲、双盲和三盲。一、单盲法 为了避免病人的心理与精神因素对药物疗效的影响,可以用安慰剂作对照,在执行这种安慰剂对照时,必须对病人保密,否则一旦病人知道所服用的是安慰剂,则安慰剂作用会立即消失,这种使病人对治疗药一无所知的方法,简称单盲法。,二、双盲法 单盲法可避免病人的精神因素影响,但不能避免医生的主观因素影响。事实上药物的疗效不仅受病人的精神因素影响,也受医护人员的主观精神因素的影响。因为医护人员的主观因素一方面会影响疗效的判断,另一方面会通过暗示作用影响病人。双盲法可避免病人与医生两方面的精神因素的影响,得到较客观的结果,对正确评价药物的疗效是很重要的,在不影响病情的条件下应该尽力推广。,三、三盲法 指的是医师、病人与资料分析者均不知何为对照药,何为新药。其优点是更客观,但执行中困难多,尤其是发生副作用时,不便及时处理,有损病人利益,故不应强求。,第五节 均 衡(equilibrium),所谓均衡,就是要设法使各实验条件下的受试对象所受的非处理因素的干扰和影响基本相等,这样才能客观地反映处理因素的效应。对照的一个极其重要的前提是对照必须均衡。贯彻均衡的原则就是对照组除了缺少处理因素外,其他条件应与实验组均衡一致。在实验(或试验)设计中,没有对照就没有鉴别,有对照而不遵循均衡原则也同样得不到正确的结论。,一、均衡与分层 研究的目的是通过抽样了解总体的情况,但是样本常常受许多不同因素的影响。例如研究药物对高血压的疗效,因为高血压有轻度、中度、重度之分,如果任意把一些高血压病人分组治疗,即使完全随机也不合理,因为有的组重度多,有的组轻度多。故应该先把轻、中、重度的高血压分层(stratification),再随机分组才能做到均衡(balance),称为分层随机。在分层的基础上,在层内随机抽样进行样本分配。这样可使实验组与对照组之间均衡,从而增大可比性。,二、分层的依据 分层的目的是增强组间可比性,把某种或某些非被试因素的影响分离出来。如何才能达此目的呢?关键是找出可能分离出来的影响因素。三、均衡性检查 先按主要影响因素分层,而后在层内随机抽样,这样组间均衡性较好。但若样本分配并不是采用分层随机,而是使用完全随机的方法,在小样本实验中则可能出现严重不平衡状态。为弥补这一缺陷,应在实验样本数达到预定数的8090时进行均衡性检查。,提高均衡性的策略(1)研究设计者本身应具有较丰富的专业知识和统计学知识,对拟研究的课题的基本情况有较为全面地掌握,对相关的文献资料比较熟悉,对相关的实验技术、难点和可能出现的异常现象比较了解,并有一定的把握。(2)实验设计方案初稿制定出来以后,研究者不仅自己要反复修改,还应请几位同行专家帮助修改,以弥补个别人在某些专业知识方面的不足,从专业角度使实验设计方案进一步完善。(3)经过同行专家审阅后的实验设计方案,从专业角度看是不会有太大问题的。但这并不能保证它在统计学方面是无可置疑的。因此,请一、二位对统计学研究得较深入的统计学工作者严把实验设计方案的质量关是很有必要的。,违背均衡原则的案例分析,原文题目:血清高敏C反应蛋白在心血管病变中的表达特性,实验设计:对照组:健康对照组340 名,男191 名,女149 名,年龄1972 岁(排除明显炎症感染个体);在健康对照组年龄分组中,50 岁以上的人数只有20 人。实验组:冠脉造影患者341 例,男245 名,女96 名,年龄2980 岁;急性心肌梗死患者86 例,男70 例,女16 例,年龄4289 岁。实验效应测量:采用胶乳增强免疫(超敏)比浊法,定量检测心血管病变中的表达情况。,辨析与解释:,根据常识,心血管系统疾病大都发生在年龄较大的人身上,就是说年龄越大心血管病患者就越多,本例中健康人年龄分组在50 岁以上的人数大大少于其他组。应在实验设计时,结合专业知识,各性别组样本例数、各年龄段例数都应分别接近,本资料健康人对照组应多选取年龄较大的人,这样与其他组相比较更有说服力。,第六节 医学科研选题与实验设计举例,例1饮水中钙含量与地方性甲状腺肿的关系 本课题的选题过程:1.研究者在实际工作中发现当地居民地方性甲状腺肿发病率很高,而当地水与食物中碘含量属于正常水平,究竟是什么原因引起当地地方性甲状腺肿发病率高?这个问题引起了研究者的思考。,2.有关专业的理论与实践已经明确:如果人体内不缺碘,不能引起地方性甲状腺肿。而当地的实际情况是,水和食物中碘的来源充足,人体摄人的碘含量正常。那么,人体内缺碘的唯一可能是次发性的,即碘随水和食物进人体后未能被机体充分利用。3.研究者有了这样一个初始意念之后,经过查阅文献,得到三方面有关资料:(1)钙离子和碘离子在小肠中可形成不溶性的沉淀物,不被吸收;(2)摄人高钙时氯的再吸收率增加,导致碘的排出量增大;(3)动物长期饲以高钙食物,促使甲状腺大量分泌降钙素,造成甲状腺滤泡增大。,4.文献资料使研究者的初始意念得到合理的解释:水中含钙量增高,会使碘在肠管中沉淀,减少吸收;而钙的大量吸收又导致碘的损失。少入多出,体内碘必然不足,造成次生性缺碘,形成地方性甲状腺肿。5.假设形成后,验证手段是检验饮水中钙的含量。6.经过调查研究,完全证实饮水中含钙量非常高。高钙饮水的动物实验也出现甲状腺肿大。7.采取改良饮水的措施,地方性甲状腺肿的发病率下降。8.这一科研的结论,再一次证明了只有体内缺碘,才能引起地方性甲状腺肿这一病因学的基本原理。,例2:某内科医生从医疗工作的实践中认识到用某药治疗慢性气管炎的疗效不理想。关于该药的文献报道也不一致。该医生想弄清楚此药的确切疗效。1.有了初始意念,他开始查阅关于此药的性能、作用、疗效等有关文献,思考了以下几方面问题:(1)此药治疗慢性气管炎是否确实有效?(2)慢性气管炎患者是否可以自然好转?(3)文献中对疗效的评价标准是否恰当?(4)如果此药治疗慢性气管炎有效,是否因患者的病情、病程或健康状况不同而疗效有所不同?(5)此药治疗慢性气管炎是否因药物质量、泡制方法、用药剂量及用药方法不同而疗效不同?,2该医生带着上述这些问题又进一步查阅了文献,形成以下概念:(1)从药理上可以推断该药对缓解呼吸道症状有作用。(2)慢性气管炎患者的部分症状可以自然消失,但大部分症状非短期内能改善。(3)文献报道中判断疗效的客观依据不统一。(4)样本的选择与分配无随机化方案,临床疗效判断缺乏严格的对照比较。(5)文献报道的临床试验所用的该药剂量相差较大。大剂量者,呼吸道刺激症状明显,疗效不佳;小剂量者,看不出有何疗效。这表明该药生物学的“剂量反应关系”尚未明确。(6)文献中用药方法不同,剂量不同,辅助用药不同,病情、病程、病人生活环境、年龄及治疗开始日期等皆不同,即与疗效有关的非处理因素不同,样本缺乏可比性。,3于是,该医生建立了下列假说:(1)“该药最低有效剂量与最大有效剂量及最低中毒剂量之间距离较小。”需进一步研究最佳安全剂量。(2)“不同药物的配伍,其治疗作用不同”。需研究不同配伍用药的治疗效果及协同变化作用。(3)“疗效与患者病史长短、病情轻重及生活环境等因素有关。”需分别与综合进行研究其与疗效的关系。(4)“该药治疗作用与疗效的表现有关”。需对治疗后的症状、体征表现及治疗前后的改变进行研究。,假说形成后,就着手进行具体的、周密的实验设计,安排实验观察与临床试验,积累可靠的资料后,进行数据处理与统计分析。该医生所得研究成果在前人研究的基础上又有了新的进展与发现。,