循证医学实践中常用统计学方法.ppt
第五章 循证医学实践中常用统计方法(Statistical methods commonly used in the practice of evidence-based medicine),循证医学 Evidence-Based Medicine,作者单位 中南大学 长沙医学院作者姓名 王乐三 欧阳江,目 录,第一节 概 述,1,第二节 常用统计方法,2,3,第三节 统计方法常见错误及辨析,教学要求:1.掌握医学统计的基本概念;2.熟悉医学统计学的基本内容;3.了解多变量资料统计分析方法及选择思路。,【案 例】某作者比较腹腔镜胰十二指肠切除术与传统开腹手术行胰十二指肠切除术的近期临床疗效和安全性,结局指标有:手术时间;术中出血量;是否再次手术;住院时间;是否围手术期死亡;是否有胰漏发生、切口感染、延迟性胃排空等。有关的结局指标涉及的统计资料类型有哪些?有关的参数估计和假设检验方法有哪些?,5,第一节 概 述,1,2,3,4,医学统计学定义,基本概念,统计资料常见类型,小结思考,6,若想了解上帝在想什么,我们就必须学统计,因为统计学就是在量测他的旨意。Florence Nightingale 1820一1910,What is Statistics?,什么是统计学?,7,无处不在的统计学,8,人类学文学经济学史学地理学物理学社会学,农学生物学医学药学中医学气象学法学,医学统计学 Medical Statistics卫生统计学 Health Statistics,生物统计学 Biostatistics,科研中的统计学,Websters International Dictionary:A science dealing with the collection,analysis,interpretation,and presentation of masses of numerical data”John M.Last,A Dictionary of Epidemiology:The science and art of dealing with variation in data through collection,classification,and analysis in such a way as to obtain reliable results”,10,医学统计学是以医学理论为指导,应用概率论与数理统计的有关原理和方法,研究医学资料的搜集、整理、分析和推断的一门科学。,医学统计学(Medical Statistics),医学统计学的定义,11,医学研究的基本内容,1.医学科研的统计设计,2.资料分析,假设,搜集、整理、分析数据,调查设计实验设计,统计描述:统计指标统计推断:参数估计、假设检验,医学统计学的应用,12,以正确的方式收集资料 描述资料的统计特征 统计推断及得出正确结论,13,一、一些重要概念,同质和异质变异总体和个体参数和统计量随机概率和频率小概率事件和小概率原理抽样误差,14,基本概念之一:同质和异质,同质(homogeneity):性质相同异质(heterogeneity):性质不同同质和异质是相对的概念不同质的个体不能笼统地混在一起分析个体的同质性是构成研究总体的必备条件研究内容(指标/变量)不同,对同质性的要求不同,15,在研究事物的形状时,同质和异质示例,在研究事物的颜色时,16,基本概念之二:变异,同质事物之间的差别称为变异(Variation)变异的两个方面:不同观察单位(个体)间的差别同一个体在不同阶段的差别(重复测量),17,变异示例,18,基本概念之二:变异,同质个体间的差异。结果是随机的,不可预测的。一种或多种不可控因素(已知的或未知的)作用下的综合表现。个体变异是普遍存在的。个体变异是有规律的。没有个体变异,就没有统计学!,19,基本概念之三:总体、个体和样本,总体(population):按研究目的所确定的同质研究对象某项观察指标的全体,即全体观察单位。有限总体(finite)无限总体(infinite)个体(individual):是构成总体的最基本观察单位;样本(random sample):从研究总体中随机抽取具有代表性的部分观察单位。代表性,包含了总体的特性 为什么要抽样?,20,基本概念之四:参数和统计量,总体参数(parameter):刻画总体特征的指标;一般用希腊字母表示,如:、p 统计量(statistic):样本统计指标 一般用拉丁字母表示,如:、s、p在总体被确定之后,总体参数就是一个常数,是不会变化的,不管你是否确切知其大小;而统计量是几乎总是随着样本而变的。,21,基本概念之五:随机,随机(random):是指机会均等,无主观影响,目的是保证样本对总体的代表性、可靠性。机会均等,无主观影响抽样随机(random sampling)有相同的机会被抽到分组随机(random allocation)有相同的机会被分到不同的组中顺序随机(random order)有相同的机会先后接受处理,22,基本概念之六:频率和概率,频率 Relative frequency:在n次随机试验中,事件A发生了m次,则比值称为事件A在这n次试验中出现的频率,23,基本概念之六:频率和概率,抛硬币试验在概率的统计学定义上的诠释,24,基本概念之六:频率和概率,概率的统计学定义:数理统计学中的大数定理表明:当观察次数n越来越大,频率f 的随机波动幅度越来越小,并最终趋向于一个常数p:随机事件A发生的概率(Probability)。概率描述事件发生可能性大小的一个度量。是一种参数。常用P来表示;0P 1,25,基本概念之七:小概率事件,小概率事件(rare event)当某事件发生的概率很小(可能性很小),统计学上称该事件为小概率事件。医学上:小于或等于0.05小概率原理 小概率事件并不表示不可能发生,但在某一次试验中,可认为是不会发生的。,26,误差(error)指实际观察值与观察真值之差、样本指标与总体指标之差。,基本概念之八:抽样误差,27,二、统计资料常见类型,在医学研究中,根据研究目的的要求对一些观察项目或研究指标在一些研究对象中进行观察(或测量),由于这些指标存在着变异,故把这些观察项目或研究指标称为随机变量,简称变量(variable),而观察结果对应的取值称为变量值或观察值。,28,按照取值的特性:数值变量 Numerical Variable 定量变量:既有顺序的意义,又有间隔的意义,可以认为是连续的;往往有单位;取值间的差异是可以度量的分类变量 Categorical Variable:取值是是分散、定性的,表现为互不相容的类别和属性无序分类 Unordered Categorical定性变量:无顺序,无间隔,仅有分类二项分类多项分类有序分类 Ordered Categorical 等级变量:仅有顺序,无单位;取值间的差异是不可度量的,29,资料类型的判断,30,不同分类的互相转化 定量资料(数值变量)定性资料(无序分类变量)定量资料(数值变量)等级资料(有序分类变量)等级资料(有序分类变量)定性资料(无序分类变量)信息量只有减少,不可增加,31,基本概念汇总,总体个体、个体变异,总体参数未知,样本代表性、抽样误差,随机抽样,样本统计量已知,统计推断,风 险,32,总结,基本概念:统计学,统计学研究的步骤统计资料的分类同质、变异总体、个体、样本总体参数、样本统计量、样本含量随机概率、小概率事件、小概率原理抽样误差变量的分类,33,第二节 常用统计方法,1,2,3,4,分类变量资料常用统计方法,数值变量资料常用统计方法,常用统计方法的选择,思考题,34,描述性统计分析:以统计表、统计图统计指标(如均数、标准差等)对资料的数量特征及其分布规律进行测定和描述。推断性统计分析:如何由样本信息推断总体特征的问题。参数估计:区间估计(95%CI)假设检验:t,F,z检验等,基本统计分析方法,35,一、分类变量资料常用统计方法,1.分类变量资料的统计描述,数据形式,绝对数相对数比、比例、率,36,比(ratio),两者的相对水平分子不必包含在分母里可以比较不同属性的事件或状态,37,构成比(proportion),某一事物内部各组成部分所占的比重分子必须包含在分母里比较的必须是同一属性的事件或状态波动范围只能是01,2,-=0.5=50%,4,率(rate),38,描述特定时间里某事件发生的速度分子:特定时间里观察的新发事件数分母:事件发生的人群基数(危险人口),39,防止概念混淆计算相对数时分母应有足够数量 正确地合并估计频率(或强度)型指标 相对数间的比较要具备可比性:观察的对象是否同质,研究的方法(如检测手段、抽样方法)是否相同,观察的时间是否一致等;被比较的总体是否具有可比性 对相对数的统计推断,应用相对数应注意的事项,40,2.分类变量资料的统计推断,参数估计:点估计 区间估计假设检验:检验、u检验 非参数检验,无序分类资料统计方法,41,等级资料统计方法,42,单变量计数资料的统计方法选择思路,43,44,二、数值变量资料常用统计方法,1.数值变量资料的统计描述,集中趋势和离散趋势,45,集中趋势的描述 即大多数数值落在什么位置上。(针对一个变量的若干个数值),1.算术均数(均数)2.几何均数3.中位数,46,算术均数(均数),意义:一组性质相同的观察值在数量上的平均水平。表示(总体)X(样本)特征:(X-X)=0应用:正态分布或近似正态分布注意:合理分组,才能求均数,否则没有意义。,47,几何均数,意义:N个数值的乘积开N次方即为这N个数的几何均数。表示:G应用:原始数据分布不对称,经对数转换后呈对称分布的资料。数值范围跨越多个数量级。例如抗体滴度。,48,中位数、百分位数,意义:将一组观察值从小到大排序后,居于中间位置的那个值或两个中间值的平均值。(身高排队)表示:M、PX百分位数:将N个观察值从小到大依次排列,再分成100等份,对应于X%位的数值即为第X百分位数。中位数是百分位的特殊形式。应用:偏态资料,开口资料,49,离散趋势的描述:反映一组数据的变异大小,极差四分位数间距方差标准差变异系数,常用指标,50,标准差,相关概念:离均差、离均差之和、离均差平方和、方差(2 S2)标准差的符号:S 意义:全面反映了一组观察值的变异程度(大小)应用:描述变异程度、计算标准误、计算变异系数、描述正态分布、估计正常值范围,51,2.数值变量资料的统计推断,参数估计:点估计 区间估计假设检验:t 检验、方差分析 非参数检验,52,t 检验(N30、60)应用条件:来自正态分布的总体;所比较总体的方差相同。用途:样本均数与总体均数的比较配对资料差值均数的比较两样本均数的比较,53,u 检验(N30、60)用途:样本均数与总体均数的比较配对资料差值均数的比较两样本均数的比较,54,方差分析应用条件:来自正态分布的总体;所比较总体的方差相同。用途:完全随机设计方差分析随机区组设计方差分析多个样本均数间的两两比较,55,秩和检验(非参数方法)用途:配对资料差值的符号秩和 检验成组设计两样本比较秩和 检验成组设计多样本比较秩和 检验,56,单变量数值变量资料的统计方法选择思路,57,双变量资料的统计学检验方法选择思路,58,3.双变量资料分析常用统计方法,59,3.多变量资料分析常用统计方法,60,三、常用统计方法的选择,不同类型的资料采用不同的统计分析方法 计量资料的统计分析方法:t检验、u检验、方差分析、相关与回归分析 计数资料的统计分析方法:卡方检验、二项分布和Poission 分布、相关与回归分析 等级资料的统计分析方法:秩和检验,61,不同设计类型采用相应的统计分析方法 完全随机设计:对两组计量资料的比较:t检验、完全随机设计方差分析、Kruskal-Wallis 检验;区组随机设计(或配对设计):配对t检验、区组随机设计的方差分析、Friedman 检验、kappa检验,62,例5-1 某研究所为研究某药物的抑癌作用,使一批小白鼠致癌后,将一批致癌小白鼠40只按完全随机设计的方法分为四组,A、B、C三个试验组和一个对照组,分别接受不同的处理。A、B、C三个试验组,分别注射0.5m1、1.0m1和1.5m1 30的注射液,对照组不用药。经一定时间以后,测定四组小白鼠的肿瘤重量(g),测量结果见表5-7。试进行统计分析。,63,某药物对小白鼠抑癌作用(肿瘤重量,g)的试验结果,64,各组的均数、标准差、标准误及总体均数95%可信区间,本例为单变量计量资料,分组因素只有药物1个,共4个水平,设计类型为完全随机设计,4组资料经方差齐性检验,Levene 统计量为0.178,P=0.910,在 的水准,各组方差差别无统计学意义,可选择单因素方差分析(one-way ANOVA)。方差分析结果,P0.001,可认为4个不同剂量药物注射液的抑癌作用有差别。再用Dunnett-t检验作多个实验组与一个对照组之间的比较,结果。,-,在=0.01水准上均有统计学意义;可认为3个不同剂量药物注射液与对照组的小白鼠肿瘤重量有差别,即3个不同剂量药物注射液都有抑癌作用。,65,66,例5-2 某研究者收集103例冠心病患者和100例正常对照者的多项指标,部分资料见表5-9。其中G为组别,X1为性别,X2为年龄,X3为患高血压史,X4为吸烟史,X5为胆固醇含量,X6为甘油三酯含量,X7为低密度脂蛋白含量,X8为高密度脂蛋白含量,X9为脂蛋白含量,X10为载脂蛋白A1含量,X11为载脂蛋白B含量,X12为基因EcoR型。表5-10简要列出根据研究者部分研究目的而拟采用的统计分析方法。,67,冠心病患者和正常对照者多项指标的部分观测结果,68,研究目的和拟采用的统计分析方法,思考题,69,1某医院用新药与常规药物治疗婴幼儿贫血,将 20 名贫血患儿随机分为两组,分别接受两种药物治疗,测得血红蛋白增加量(g/L)如下表,请回答下列问题:1)新药与常规药的疗效有无差别?2)根据研究问题,请分别给出两个样本所在总体的定义。,两种药物治疗婴幼儿贫血的血红蛋白增加量(g/L),思考题,70,2 24 名甲状腺功能低下的婴儿,按病情严重程度把他们分为 3 个水平:轻度组 9 名,中度组8 名,重度组 7 名。表中列出了他们的血清甲状腺素含量(n mol/l)。试分析不同严重程度的婴儿血清甲状腺素水平是否差异有统计学意义。分别用LSD 法和Bonferroni 法作多重比较,对结果作出统计学和专业领域内的解释。,71,第三节 常用统计方法典型错误及辨析,1,2,3,统计描述典型错误辨析,统计推断错误辨析,思考题,72,一、统计描述典型错误辨析,(一)不考虑资料的分布状态滥用均数和标准差,例5-3 某地发生一起原因不明疾病,共有80人发病,从接触传染源到发病的时间(潜伏期)见表5-11,作者求得其平均潜伏期x=9.1天。该结论对否?,表5-11 某地原因不明疾病的发病时间,73,一、统计描述典型错误辨析,辨析:从表中可以看出,该资料为偏态分布资料,描述其平均潜伏期应该用中位数,而不能用均数表示,计算得出平均潜伏期M=8.3天,而不能用x。,74,一、统计描述典型错误辨析,(一)不考虑资料的分布状态滥用均数和标准差,例5-4 某医生研究某药对糖尿病的治疗效果,结果见表5-12。,表5-12 某药对糖尿病病人血糖的影响(xsx),75,一、统计描述典型错误辨析,辨析:从表5-12可以看出,研究者的目的是要分析实验组和对照组血糖的平均水平,分别用xsx 表示。该结果数据显示,实验组的标准差为19.71,对照组的标准差为59.70,实验组和对照组血糖的标准差都是均数的若干倍,此资料不太可能为正态分布。而用xsx或xs表达结果时,需要资料服从正态或近似正态分布。,76,一、统计描述典型错误辨析,注意:当资料服从正态分布时,用以上两种方法表达,其含意是不一致的。,xsx 反映的是在相同的实验条件下,样本均值与总体均值的接近程度,即68.27的可能性包含总体均数,标准误的大小反映实验的准确度;,xs 反映在相同的实验条件下观测值在样本均数附近的波动大小,即约有68.27的观测值在xs范围之内,标准差的大小反映实验的精密度。,77,一、统计描述典型错误辨析,如果无法判断资料的分布类型,先对资料进行正态性检验,若满足正态性,根据研究目的准确选择xsx或xs。若不满足正态性,可进行数据转换,转换后的数据服从正态分布,可用以上两种方法描述,若数据转换后仍不满足正态分布,用中位数描述血糖平均水平,四分位间距描述血糖值的离散程度。,78,一、统计描述典型错误辨析,(二)相对数应用错误,例5-5 300例糖尿病患者中25岁以下者占25%,2545岁者占35%,45岁及以上者占40%,随着年龄的增高,糖尿病发病率也增高。,辨析:构成比和率均为相对数,都可以用百分率表示,但是两者有本质的区别。构成比表示事物内部各个组成部分所占总体的比重;率是表示某种现象发生数与该现象可能发生的总数之比,即某种现象发生的频率或强度。例3中的三个相对数均是构成比,反映不同年龄组糖尿病的病例数占总病例数的比重,而不是发病率。因此,“随着年龄的增高,糖尿病发病率也增高”的结论是错误的。,1.以“构成比”代“率”,79,一、统计描述典型错误辨析,例5-6 用不同抗癌药物治疗胸腺肿瘤大鼠,观察6周大鼠存活情况,结果见表5-13。,2.计算相对数时分母太小,表5-13 不同抗癌药对胸腺肿瘤大鼠6周存活的影响,80,一、统计描述典型错误辨析,辨析:计算相对数时的分母不能太小。从表5-13中可以看出,计算存活率时分母只有只,显然分母太小,偶然性较大,不能反映真实情况。因此,在这种情况下用绝对数表示即可。,81,二、统计推断错误辨析,(一)定量资料统计推断的错误辨析,例5-7 为了研究不同治疗措施对脑卒中恢复期患者运动功能的影响,作者将研究对象随机分为三组,分别采用不同的药物治疗,经t 检验,治疗前药物组、药物组与药物组运动功能自评量表分数差异无统计学意义;药物组、药物组治疗前与治疗后运动功能自评量表分数差异均有统计学意义,结果见表5-14。,表5-14三种不同治疗措施对脑卒中恢复期病人运动功能的影响(xs),1.忽视t 检验和方差分析的前提条件,注:表示药物组、组与组比较P0.05;*表示同组别治疗前后比较P0.05,82,二、统计推断错误辨析,辨析:上例中,在资料设计类型、统计处理方法的选择等方面都存在错误:从资料设计类型上看,本研究是分析三种不同治疗措施对运动功能自评量表得分的影响,如果仅简单比较治疗前或治疗后各组的差异,不能很好地看出各种药物的效应,应该首先求出每组治疗前后运动功能自评量表得分之差,此时该资料为单因素水平设计的资料,如果符合方差分析的条件,可采用单因素的方差分析,若需要两组组间比较,可以通过方差分析的两两比较实现。如果不符合方差分析的条件,可采用完全随机设计多组独立样本的秩和检验,若需要两组组间比较,可以通过秩和检验的两两比较实现。作者用t检验是错误的,因为t检验只适合分析单组、配对及成组设计资料,并不适合分析单因素k 水平设计资料和多因素设计资料。,83,二、统计推断错误辨析,辨析:从统计方法的选择上看,t检验和方差分析的应用前提条件是只有经过正态性检验和方差齐性检验满足条件后才能应用,而该资料有个格子的标准差超过均数,该资料可能呈偏态分布,不同组间标准差相差悬殊,基本上可以认为组间方差不齐,不符合t检验的条件。,84,二、统计推断错误辨析,同组别治疗前与治疗后运动功能自评量表得分采用成组比较的t检验,组、组差异有统计学意义(P0.05)。,辨析:同一组治疗前后运动功能自评量表得分比较是自身配对设计的资料,如果符合参数检验条件,应该用配对设计t 检验进行分析,若不符合参数检验条件,则采用非参数配对设计的秩和检验方法进行分析。,2.误用成组设计资料的t检验分析配对设计资料,85,二、统计推断错误辨析,例5-8 某作者对28例脑卒中恢复期病人采用药物治疗和循证护理相结合的方法,观察运动功能自评量表得分情况,采用配对t 检验,治疗后个月、个月与治疗前差异有统计学意义(P0.05)。,表5-1528 例脑卒中恢复期病人治疗前后运动功能自评量表得分,3.误用配对设计资料的t 检验处理具有一个重复测量的单因素设计资料,86,二、统计推断错误辨析,辨析:28例脑卒中恢复期病人治疗前、治疗后个月、治疗后个月运动功能自评量表得分,是在不同时间对同一个受试对象同一个因素观察到的3个数据,这种设计类型称为重复测量的单因素设计。配对设计资料t检验只适合配对设计的资料。上例中的资料相当于配伍组设计的资料,若采用配对设计t检验分析此类资料,割裂了整体设计,结论的可靠性差。因此,具有重复测量的单因素设计资料可以采用配伍组设计资料的方差分析方法比较治疗前和治疗后不同时间运动功能自评量表得分差异是否有统计学意义,然后可进一步采用q检验等方法作两两比较。,87,二、统计推断错误辨析,例5-9 一项左旋肉碱对大鼠血糖和体重影响的研究,按照区组随机分组的方法将大鼠分成四组观察,采用t 检验进行分析,结果见表5-16。,表5-16左旋肉碱对大鼠血糖和体重的影响,4.误用t 检验处理析因设计的定量资料,注:*表示与非糖尿病相应组比较,P0.05。,88,二、统计推断错误辨析,辨析:以上实验研究有个实验组,实际涉及个实验因素,一个实验因素是“是否患糖尿病”,另一个实验因素是“是否使用左旋肉碱”;两个实验因素分别都有两个水平,即是、否,互相组合,得到个实验组。而上例采用了成组设计的t 检验进行统计分析,忽视了两个因素之间的交互作用,是错误的。其实这种资料属于析因设计的定量资料,应首先分别求出观察前和周后体重和血糖的差值,采用析因设计的方差分析,才能有效分析各因素及其可能存在的交互作用。,89,二、统计推断错误辨析,例5-10 小鼠烧伤后118天烧伤区与周边区淋巴管数量比较,结果显示,烧伤区和周边区淋巴管数经2检验差异有统计学意义(P0.05),表5-17修复期烧伤小鼠烧伤区与周边区淋巴管数量(单位:个),5.误用2检验分析定量资料,90,二、统计推断错误辨析,辨析:以上资料中,不同观察时期的淋巴管数量是定量资料,其度量衡单位是“个”。因此,采用2检验分析不同时期淋巴管数量的差异是错误的,可采用定量资料统计分析方法进行比较,若符合方差分析的条件,可采用完全随机设计的方差分析,反之,可采用成组设计的多个样本的秩和检验。,91,二、统计推断错误辨析,(二)定性资料统计推断的错误辨析,例5-11 一项关于“固定胃管的医用胶布更换周期对皮肤的影响”的研究,实验组每天更换胶布,对照组天更换胶布,经t检验,实验组效果明显好于对照组(P0.05),结果见表5-18。,表5-18实验组与对照组医用胶布对皮肤的影响,1.误用t 检验分析定性资料,92,二、统计推断错误辨析,辨析:正确判断资料类型是合理选择统计分析方法的重要前提。本资料结果为疗效,皮肤颜色变化、皮肤水疱、痒痛均按照有、无分为两类,属于定性变量,采用定量资料的t 检验是错误的,应该采用两样本率比较的四格表2检验,皮肤颜色变化、皮肤水疱发生情况均可采用四格表专用公式,而痒痛发生率比较需要采用校正公式。,93,二、统计推断错误辨析,例5-12 2002-2003年,某医院用甲、乙两种新药治疗类风湿患者,肾功能损害的发生率经2检验,差异有统计学意义,结果见表5-19。,表5-19甲、乙两种药物治疗类风湿肾功能损害发生情况,2.误用2检验取代确切概率法,94,二、统计推断错误辨析,辨析:当满足n40且每个格子的理论频数T5时,使用四格表2检验进行两个率的比较;或当n40且每个格子的理论频数T5时,使用四格表2检验的校正公式进行两个率的比较。本资料的n40,不符合2检验的条件。因此,该资料应该选用Fisher确切概率法进行比较。,95,二、统计推断错误辨析,例5-13 选择2005年6-12月在某医院住院分娩的产妇310例,均为阴道分娩的足月妊娠单胎头位初产妇,不包括有严重合并症及并发症者,将研究对象随机分为观察组(160例)和对照组(150例)。两组孕产妇在年龄、身高、孕周、胎儿大小等条件上基本相同。观察组实施“一对一”全程导乐陪伴分娩模式,对照组则采用常规产时服务模式。采用VRS-5方法,描述疼痛量分6个等级:0级为无疼痛;1级为轻度疼痛,可忍受,能正常生活睡眠;2级为中度疼痛,适当干扰睡眠,需用止痛药;3级为重度疼痛,干扰睡眠,需用麻醉止痛剂;4级为剧烈疼痛,干扰睡眠较重,伴有其他症状;5级为无法忍受,严重干扰睡眠,伴有其他症状或被动体位。两组产妇疼痛程度比较采用 2检验,P0.0001,结果见表5-20。,3.误用2检验分析单向有序列联表资料,96,二、统计推断错误辨析,辨析:研究者将研究对象随机分为观察组和对照组,分组变量为无序分类;对疼痛的分为级,为有序变量,属于单向有序列联表资料。用RC表2检验分析结果变量为有序分类变量的单向有序列联表资料不合适,得出的结论可能是错误的。而适合该资料的分析有秩和检验、Ridit分析等方法。,表5-20两组产妇疼痛程度,97,二、统计推断错误辨析,例5-14 一项关于“腹腔注射链脲佐菌素、四氧嘧啶和胰岛素对大鼠发生糖尿病的影响”的研究,选择个月200左右大鼠60只,按照区组随机分组的方法,将大鼠分成三组,每组20只,组链脲佐菌素65mg/kg 一次腹腔注射,组四氧嘧啶125mg/kg 一次腹腔注射,组胰岛素10u一次腹腔注射,72h后测血糖,观察糖尿病发生情况。经2检验,组与组比较、组与组比较,糖尿病发生率差异均有统计学意义,而组、组比较差异无统计学意义,结果见表5-21。,4.对RC表资料直接分割进行两两比较,98,二、统计推断错误辨析,辨析:本资料属于3行2列的32表资料,作者在未对整体进行分析的情况下,直接将表分割成三个四格表进行两两比较,这就增大了犯类错误的概率,容易得出假阳性的结论。正确的做法是先对整个RC表资料进行 2检验,得到一个 2值,根据32表的自由度,查 2界值表,确定拒绝无效假设还是不拒绝无效假设。然后再将32表分割成3个四格表,分析每两组糖尿病发生率的差异。但值得注意的是,分割后四格表的检验水准为:/K(K-1)(K为总组数),将四格表计算的2值对应的概率P 与比较,从而决定拒绝还是不拒绝无效假设。,表5-21 大鼠腹腔注射三种药物后糖尿病发病情况,思考题,99,1某医生对小儿毛细血管瘤孕激素受体进行了研究,得到:毛细血管瘤组(50例)的孕激素受体阳性细胞率为74.88%12.12%;正常皮肤组(10例)的孕激素受体阳性细胞率为9.80%6.70%,通过2检验,发现两组的孕激素受体阳性细胞率差异有统计学意义。试分析以上研究所用的统计学方法是否有误,如果有误,应该用什么统计学方法进行分析?,思考题,100,2某医生为了研究果糖二磷酸钠治疗新生儿缺氧缺血性脑病的疗效,随机将患儿分为观察组和对照组,治疗效果分为无效、有效和显效。结果见下表。作者通过一般2检验得到2=4.74,P0.05,认为两组间的疗效差异有统计学意义。,试分析以上研究所用的统计学方法是否有误,如果有误,应该用什么统计学方法进行分析?,谢谢大家,