医学统计学X2检验.ppt
医学统计学,欢迎学习,医学统计学,第六章 X2 检验,学习要点X2检验的基本思想两个样本率比较配对设计两样本率比较多个样本率比较样本构成比的比较两个分类变量间的相关分析,2检验用途,1、推断两个或两个以上的总体率或总体构 成比 之间有无差别;2、推断两种属性或两个变量之间有无关联性(计数资料的相关分析);3、频数分布的拟合优度检验。,2检验类型,1、四格表资料2检验;2、配对计数资料2检验;3、行列(RC)表资料2检验;4、行列(RC)列联表2检验。,第一节 四格表资料2检验,用途:推断两个总体率有无差异。,表6.1 两种药物治疗牙科术后疼痛控制有效率比较 组 别 有 效 无 效 合计 有效率%A 药 68(63.71)22(26.29)90 75.56 B 药 58(62.29)30(25.71)88 65.91 合 计 126 52 178 70.79注:括号内为理论频数,为何称为四格表?指哪四格?,有效 无效,A药,B药,以下资料的a、b、c、d是哪个?,一、检验基本思想 值的计算方法(通用公式):,式中A为实际数,T为理论数,根据H0的假设推算出来。,如本例:H0假设两种药物镇痛的有效率相等,如果H0成立则:总的有效率:126/178=0.7079=70.79%总的无效率:52/178=0.2921=29.21%A药理论有效人数:90126/178(70.79)=63.71 A药理论无效人数:9052/178(29.21)=26.29 B药理论有效人数:88126/178(70.79)=62.29 B药理论无效人数:8852/178(29.21)=25.71 注:算出一个格子的理论数后,其他格子的理论数可以用减法推算出来。,为R行C列的理论数;nR为T所在行合计数;nc为T所在列合计数。,T11=90126/178(70.79)=63.71 T12=90-63.71=26.29 T21=126-63.71=62.29 T22=88-62.29=25.71,从X2值计算公式可以看出,X2检验是检验实际分布(A)和理论分布(T)的吻合程度。若H0假设成立,则实际分布(A 实际值)和理论分布(T理论值)相差不大,X2值应较小;若H0假设不成立,则实际分布(A)和理论分布(T)相差较大,X2值应较大。另外 X2值的大小尚与格子数(自由度)有关,格子数越多,X2值越大。可以根据X2分布原理,由X2值确定P值,从而作出推论。V=(行数-1)(列数-1),X2 检验过程,1、建立假设 0:12 1:12 0.05 2、计算X2值(用基本公式计算)T11(90126)17863.71 T1290-63.7126.29 T2112663.7162.29 T2288-62.2925.71,=2.00,3、查X2 界值表确定P值 按 V 1,查附表5,X2界值表得:X20.05,1=3.84 X20.1,1=2.71 X20.25,1=1.32 X20.1,1 X2 X20.25,1,0.25 P0.1 4、推断结论 0.25 P0.1,按0.05,不拒绝H0,差异无统计学意义,还不能认为两药对控制牙科术后疼痛的疗效不同。,(二)四格表资料X2检验专用公式,式中:a、b、c、d为四个实际数,其中 a、c 为阳性数,b、d 为阴性数,n 为总例数。,为省去计算理论数的麻烦,可用以下公式计算。,四格表资料X2检验专用公式,有效 无效,A药,B药,(2)用专用公式计算 a=68、b=22、c=58、d=30、n=178,3、查X2 界值表确定P值 按 V 1,查附表5,X2界值表得:X20.05,1=3.84 X20.1,1=2.71 X20.25,1=1.32 X20.1,1 X2 X20.25,1,0.25 P0.14、推断结论 0.25 P0.1,按0.05,不拒绝H0,差异无统计学意义,还不能认为两药对控制牙科术后疼痛的疗效不同。,(三)四格表资料X2检验的校正,1、四格表资料 X2检验条件:(1)当n40且所有T5,用普通X2检验,(2)当n40,但1T5时,用校正的X2检验;(3)当n40 或 T1时,用四格表确切概率法。(4)若P,改用四格表确切概率法(直接计算概率法);,注:有实际数为0的四格表,不宜使用一般的四格表X2检验,可以应用确切概率法。,2、校正公式:(1)基本公式:(2)专用公式:,表6.2 两种药物治疗胃溃疡的结果 药 物 阳性数 阴性数 合计 治愈率(%)甲 22 8 30 73.33 乙 37 3 40 92.50 合计 59 11 70 85.71,例6.2,计算最小理论数!,最小行合计与最小列合计最小所对应的实际数,其理论数最小!,表6.2 两种药物治疗胃溃疡的结果 药 物 阳性数 阴性数 合计 治愈率(%)甲 22 8(4.71)30 73.33 乙 37 3(6.29)40 92.50 合计 59 11 70 85.71,例6.2,计算最小理论数!,最小行合计与最小列合计所对应的实际数,其理论数最小!,1、建立假设 0:12 1:12 0.05 2、计算X2值因T12=4.715,故需要使用校正公式 用专用公式:a=22、b=8、c=37、d=3、n=70,3、查2表确定P值 V1,20.05,1=3.84,23.420.05 4、推断结论 P0.05,按0.05水准,接受H0,尚不能认为两种药物的有效率有差别。(如不校正,2=4.75,20.05,1=3.84,P0.05,结论相反。),三、配对四格表资料的X2检验,配对的形式 1、同一个样品,用两种方法处理的结果 或同一个病例用两种方法诊断或检查的结果 2、同一个病例治疗前后疗效比较;3、配对的两个对象分别接受不同处理的结果或者匹配的病例和对照调查某个因素所得结果。(结果用阳性、阴性来表示),甲乙两种结核杆杆菌培养基的培养效果比较 甲培养基 乙培养基 合计+-+23(a)12(b)35-7(c)8(d)15 合计 30 20 50 a:甲、乙均为阳性;b:甲阳性,乙阴性;c:甲阴性,乙阳性;d:甲、乙均为阴性;,乳腺癌与哺乳关系 乳腺癌 合计 有哺乳史 无哺乳史 对 有哺乳史 80(a)40(b)120 照 无哺乳史 20(c)60(d)80合计 100 100 200,这是配对计数资料,将年龄相同或相近的乳腺癌患者和非患者配成一对,然后调查哺乳的情况。,表6.4 两种血清学检验结果比较甲法 乙 法 合计 261(a)110(b)371 8(c)31(d)39合计 269 141 410,这是配对设计计数资料,表中两法的差别是由b和c两格数据来反映。总体中b和c对应的数据可用B和C 表示。,表6.3 配对四格表形式甲法 乙 法 合计(a)(b)a+b(c)(d)c+d合计 a+c b+d a+b+c+d,配对计数资料经整理后,得出四个数据:a:甲乙两者均为阳性;b:甲阳性而乙阴性;c:甲阴性而乙阳性;d:甲乙两者均为阴性。,X2=,v=1 若b+c40:X2=,v=1,H0:两总体阳性检出率相等,即B=C;H1:两总体阳性检出率不等,即BC;=0.05,V=1,查 界值表得:=7.88,,P0.005,按=0.05水准,拒绝H0,接受H1,故可认为甲乙两法的血清学阳性检出率不同,甲法的阳性检出率较高。,注意:当a和d的数字特别大而b和c的数字较小时,即使检验结果有统计学意义,而实际意义也不大。故配对四格表X2检验一般用于检验样本含量不太大的资料。,第二节 行列表资料的2检验,用 途 1、推断两个或以上的总体率(或构成比)有无差异。2、推断两个分类变量间有无关联性(计数 资料相关分析),检验公式:,V=(行-1)(列-1),某格子的实际数的平方,除以该实际数所在行的合计和该实际数所在列的合计。,应用举例 一、多个样本率的比较(例 6.4),表6.5 3种疗法对尿路感染患者的治疗效果 疗法 阴转人数 未阴转人数 合计 阴转率(%)甲 30 14 44 68.2 乙 9 36 45 20.0 丙 32 12 44 72.7合计 71 62 133 53.4,1、建立假设 0:123 1:1、2、3不等或不全相等 0.05 2、计算X2 值,3、查X2表确定P值 自由度V(行数-1)(列数-1)(3-1)(2-1)2 查X2界值表得:X20.005,2=10.60 X230.64 X20.005,2=10.60 P0.005 4、推断结论 P0.005,在0.05水准上,拒绝H0,接受H1,可认为3种疗法对尿路感染患者的疗效不等或不全相等。,二、两个或多个样本构成比的比较,表6.6 239例胃十二指肠疾病患者与187例健康输血员血型分布 组别 A型 B型 O型 AB型 合计胃十二指肠患者 47 66 20 106 239健康输血员 52 54 19 62 187合 计 99 120 39 168 426,H0:胃十二指肠疾病患者与健康输血员血型总体构成比相同H1:胃十二指肠疾病患者与健康输血员血型总体构成比不同=0.05按公式 计算,得 X2=6.76,V=(2-1)(4-1)=3,查X2界值表得:,故 0.10P0.05,按=0.05水准,不拒绝H0,故尚不能认为胃十二指肠疾病患者与健康输血员血型构成比不同,即尚不能认为血型与胃十二指肠疾病发病有关。,X2=6.76,0.10,0.05,?,(三)双向有序分类资料的关联性检验1、22列联表资料的关联性检验,表6.5 两种血清学检验结果比较甲法 乙 法 合计 45(a)22(b)67 6(c)20(d)26合计 51 42 93,H0:甲、乙两种方法无相关H1:甲、乙两种方法有相关=0.05 v=1,P0.005。按=0.05检验水准,拒绝H0,接受H1,可以认为甲、乙两种方法有相关。,2、RC列联表资料的关联性检验 表6.7 不同期次矽肺患者肺门密度级别分布矽肺期次 肺门密度级别 合计 43 188 14 245 1 96 72 169 6 17 55 78 合计 50 301 141 492,1、建立假设 0:矽肺期别与肺门密度级别无关 1:矽肺期别与肺门密度级别有关 0.05 2、计算值 rs0.4989(Pearson 列联系数),3、查X2表确定P值 V(3-1)(3-1)=4 查X2界值表得:X2 0.005,4=14.86,X2 X2 0.005,P0,可认为肺门密度级别有随着矽肺期别增高而增加的趋势。,Pearson列联系数计算公式:,例 6.6 n=492,X2=163.01,rs取值:01;rs=1,完全关联;rs=0 完全不关联;rs越大,关联度越高。,rs0.7,高度相关,四、行列表X2检验注意事项,1、不宜有1/5以上格子理论数小于5,或有一个理论数小于1。理论数太小的处理方法:(1)增加样本的含量(2)删除理论数太小的行和列(3)合理合并理论数太小的行或列 第(2)和第(3)种处理方法损失信息和损害随机性,故不宜作为常规处理方法。,2、对于单向有序行列表,行列表的X2检验只说明各组的效应在构成比上有无差异,如果要比较各组的效应有无差别,需应用秩和检验。例:治愈 显效 无效 死亡 合计 治疗组 a1 b1 c1 d1 N1 对照组 a1 b2 c2 d2 N2 合计 a b c d N X2检验:只说明两组的四种疗效在总治疗人数所占比例有无差别;秩和检验:说明两组疗效有无差别。解决此问题方法:X2分割法。,3、当三个及以上率(或构成比)比较,结论拒绝H0时,只能总的说有差别,但不能说明它们彼此间都有差别,或某两者间有差别。解决此问题方法:X2分割法。X2分割法原理:把原行列表分割为若干个分割表(四格表),各分割表的自由度之和等于原行列表的自由度,其X2值之和约等于原行列表的X2值。,X2分割方法:(1)把率(或构成比)相差最小的样本分割出来(四格表),计算X2值;(2)差异无显著性时,把它合并为一个样本,再把它与另一较相近的样本比较;(3)差异有显著性时,作出结论,再把它与另一较相近的样本比较;(4)如此进行下去直到结束。,表6.5 3种疗法对尿路感染患者的治疗效果 疗法 阴转人数 未阴转人数 合计 阴转率(%)甲 30 14 44 68.2 乙 9 36 45 20.0 丙 32 12 44 72.7合计 71 62 133 53.4,表8.6 X2分割计算 地区 转阴数 未转阴数 合计 污染率(%)X2值 P 值 甲 30 14 44 68.2 0.22 0.05 丙 32 12 44 72.7 合计 62 26 88 70.5 甲+丙 62 26 88 70.5 30.46 0.05 乙 9 36 45 20.7 合计 71 62 133 53.4 30.68,分割的X2值之和与原总表X2值应相等或相近;自由度也应相等。否则,说明分割方法有误。,本例,原总表X2=30.64,分割的X2值之和为30.68(基本相等,系四舍五入造成的)。,多个样本率或两个构成比比较的2检验,表6.8三种方法治疗面神经麻痹有效率的比较,两两比较的另一种方法,H0:1 2 3,即三种疗法治疗周围性 面神经麻痹的有效率相等H1:三种疗法治疗周围性面神经麻痹的有效率 不全相等,查2界值表,得p0.005,按0.05水准,拒绝H0,接受H1,三种疗法治疗周围性面神经麻痹的有效率有差别。,多个样本率两两比较的方法,H0:,任两对比组的总体有效率相等 H1:,任两对比组的总体有效率不等,检验假设:,检验水准调整:,三种疗法治疗周围性面神经麻痹的实例中,检验水准调整为:,对应的临界值:,组数,三种疗法有效率的两两比较,即物理疗法组有效率与药物治疗组、与外用膏药组间差异有统计学意义,药物治疗组与外用膏药组间差异无统计学意义。,第三节 趋势X2检验,用于检验率是否随自然顺序增大或减小。,N 总例数,n各组的人数,T总的阳性人数,Z为各组的评分,如是数量分组的资料,与分组的间隔(组距)相适应,性质分组的资料取1,2,3.,H0:该市中学生吸烟率无随年级增加而增高趋势H1:该市中学生吸烟率有随年级增加而增高趋势=0.05,查X2界值表得:,因为P0.005,所以按=0.05,拒绝H0,接受H1,可以认为该市中学生吸烟率有随年级增加而增高趋势。,第四节 四格表的Fisher确切概率法,一、应用范围 1、当四格表的T1或n40时;2、用四格表X2 检验所得的概率接近检验水准时 二、四格表确切概率法的基本思想(一)四格表中的|AT|值有两个特点 1、各格相等;2、依次增减四格表中某格数据,在周边合计数不变条件下,可列出各种组合的四格表。,(二)四格表确切概率法的基本思想 在周边合计数不变条件下,列出各种组合的四格表,然后计算所有|AT|值等于及大于样本|AT|值的四格表的P值,将其相加,即得到检验概率P。,或 把各种组合四格表的P值都计算,然后把概率P小于或等于原表概率的四格表的P值加起来,即为双侧检验的概率。,双侧检验:对所有|AT|值等于及大于样本|AT|值的四格表P值相加;或把概率P小于或等于原表概率的四格表的P值相加。,单侧检验:按检验目的,取阳性数增大或减小一侧的|AT|值等于及大于样本|AT|值四格表;,即 当PAPB时,H1:AB,则P单=PR,即 当PAPB时,H1:AB,则P单=PL,四格表概率P的计算公式(a+b)!(c+d)!(a+c)!(b+d)!P a!b!c!d!n!,!为阶乘。例如,3!=3216,5!=5 4 3 2 1=120,0!=1,例8.8 表6.7 两型慢性布氏病的PHA皮试反应 分型 阳性数 阴性数 合计 阳性率(%)活动型 1(2.4)14(12.6)15 6.67 稳定型 3(1.6)7(8.4)10 30.00 合计 4 21 25 16.00,各种组合的四格表:0 15 15 1 14 15 2 13 15 3 12 15 4 11 15 4 6 10 3 7 10 2 8 10 1 9 10 0 10 10 4 21 25 4 21 25 4 21 25 4 21 25 4 21 25(1)(2)(3)(4)(5)|A-T|值:2.4 1.4 0.4 0.6 1.6 P(i)0.0166 0.1423 0.1079,样本四格表,计算P值:15!10!4!21!P(1)0.0166 0!15!4!6!25!15!10!4!21!P(2)0.1423 1!14!3!7!25!15!10!4!21!P(5)0.1079 4!11!0!10!25!PP(1)P(2)P(5)0.2668,15!10!4!21!15!10!4!21!P(1)0!15!4!6!25!0!15!4!6!25!,10 9 8 7 6!21!10 9 8 7 6!25 24 23 22 21!25 24 23 22,5040 0.0166 303600,P0.26680.05,在0.05水准上,不拒绝H0,故尚不能认为两型患者的PHA反应阳性率有差别。,如,根据专业知识,稳定型的阳性率不会低于活动型的阳性率,可用单侧检验。,现 PAPB时,H1:AB,则P单=PL,PP(1)P(2)0.0166+0.1423=0.1589,第五节 两样本率的等效检验,用 途 用于检验两种处理方法的效果是否等同;两种药物的疗效是否相同。,一、检验步骤(一)建立等效假设和确立检验水准,为等效界值,是一个有临床意义的值,在等效检验中很重要,根据专业知识来确定。,(二)计算检验统计量(用 X2检验或u检验),(三)确定P值和作出推断结论 与一般假设检验相同。,n1,n2 均大于100,例6.10 检验国产和进口的特布他林注射液的疗效是否等价(=0.1)。,查X2界值表的:0.05P0.025,按=0.05检验水准,拒绝H0,接受H1,故可以认为国产和进口的特布他林注射液的疗效是等价的。,查u界值表得:0.025P0.01,结论同上。,三、等效检验应注意事项 1、在试验设计时就规定检验水准 2、两样本率的差值应小于。不应超过对照组20%。3、是一个有临床意义的值,的选定至关重要,由专家反复论证来确定 4、等效检验和一般的假设检验有所不同,估计样本含量的方法也不同。,1、当T5(所有格子),且 n40时,应用 或,四格表检验小结,2、当140时,用(1)或(2)或改用确切概率计算法,3、当 T1 或 n40时,不能用2检验的所有计算公式,只能应用确切概率计算法。4、当四格表有一个格子的实际数为0时,也不能用2检验法,可以采用确切概率法。,