第十二章秩和检验 卫生统计学课件.ppt
,第十二章 秩和检验,非参数统计的概念Wilcoxon符号秩和检验成组设计两组独立样本的秩和检验成组设计设计多组独立样本的秩和检验随机化区组设计资料的秩和检验,非参数统计的概念,参数统计与非参数统计 从总体中随机抽取一定含量的样本,用样本指标估计(推断)总体指标,大体上有两种方法。一是参数统计,另一种是非参数统计。1、参数统计 指在总体分布类型已知的条件下,对其未知参数进行检验的方法。要求独立、正态(方差齐),如t检验、F检验均属于参数统计。2、非参数统计 主要采用符号或等级排列(秩排列)来代替数据本身的分析方法。它适用于任何分布类型资料的统计分析。秩和检验就是一种非参数检验方法,适用条件参数统计: a.样本所在总体呈正态分布 b.各总体方差要齐 c.各个样本是相互独立的随机样本非参数统计: a.不满足正态和方差齐性条件的小样本资料; b.总体分布类型不明的小样本资料; c.一端或二端是不确定数值(如0.002、65等) 的资料(必选); d.单向有序列联表资料; e. 各种资料的初步分析。,秩次:观察值由小到大排列后得到的秩序号,当几 个数据大小相同时,取平均秩次作为其秩次。秩和:用秩次代替原始数据求和得到。秩和检验:用秩和进行假设检验的方法。,一、Wilcoxon符号秩和检验,当配对设计计量资料不具备参数检验的适用条件,可采用符号秩和检验法。 它是将配对样本差值的中位数与0作比较符号检验: 是根据正、负符号进行假设检验的方法。将差值按绝对值大小顺序定出正、负号,这样就将数据信息转换为“+”、“-”符号的个数分布,据此进行假设推断。,(一)、配对设计资料的符号秩和检验,例12.1 某研究用甲、乙两种方法对某地方性砷中毒地区水源中砷含量(mg/L)进行测定,检测10处,测量值如表12.1的(2)、(3)栏。问两种方法的测定结果有无差别?,检验步骤: 1、建立假设 H0:差值的总体中位数等于0,即Md0 H1:差值的总体中位数不等于0,即Md0 双侧=0.05,2、计算统计量T值(1)求差值:计算各对数据的差值(2)编秩:按差值绝对值由小到大编秩。编秩时差值为0,则舍去 不计;若差值的绝对值相等,称为相持(tie)此时取平均秩 次。(3)求秩和并确定统计量T:将所有的秩次冠以原差值的符号,分 别求出正负差值秩次之和,分别以T+, T表示。 T+及T之和 等于n(n+1)/2(n为差值不为零的对子数),该式可验算T+, T 的计算是否正确。 Tmin(T+, T)在H0成立时,如果当观察例数比较多,正差值的秩和与负差值的秩和理论上应相等。若差别较大,有理由拒绝H0接受H1 。,当单组随机样本来自非正态总体或总体分布无法确定,也可用Wilcoxon符号秩和检验。检验总体中位数是否等于某已知数值。该检验的原理与配对设计资料类似,所不同的是这里的差值为各观察值与已知总体中位数之差。得到T值后同样是查配对设计用的T界值表。,(二)、一组样本资料的符号秩和检验,例12.2 某医生从其接诊的不明原因脱发患者中随机抽取14例,测得其发铜含量(g/g)见表12.2。已知该地健康人群发铜含量的中位数为11.2g/g。问脱发患者发铜含量是否低于健康人群?,二、成组设计两样本比较的秩和检验,当符合参数条件时,采用两样本均数的t检验。基本思想:假设两总体分布相同( H0 ),可认为两样本来自同一总体;将二者混合后编秩,并分别计算两组的平均秩和,两秩和应大致相等;若相差很大,则有理由认为H0不成立。,(一)、两组连续变量资料的秩和检验,例12.3 某地职业病防治欲比较使用二巯基丙磺酸钠与二巯基丁二酸钠的驱汞效果。将22例汞中毒患者随机分配到两组,分别测定并计算出两组驱汞的排汞比值,并将结果列于表12.3。试问两药驱汞效果有无差别? 检验步骤:1、建立检验假设 H0:两种药物排汞比值的总体分布位置相同 H1:两种药物排汞比值的总体分布位置不同 双侧=0.05,2、计算统计量T值(1)编秩:将两组数据混合有小到大统一编秩, 遇到相同数据取平均秩次。样本例数较小者为 n1。(2)求秩和并确定统计量:两组秩次分别相加得 到其对应的秩和。 当两组样本例数相等,任取一组秩和为T值。 当两组样本例数不等,样本例数较小者对应的 秩和为T值。,3、确定P值,作统计推断(1)查表法: 当n110,n2-n110时,查附表10(成组设计用)确定P值。(内大外小原则),(2)正态近似法: 当n1 10, n2-n1 10时,超出了T界值的范围,可用Z 值确定P值。,例12.4 某医生欲比较中西医疗法与西医疗法治疗急性肾盂肾炎的临床疗效,将患者随机分为两组,分别给予中西医疗法或西医疗法治疗,并观察疗效,结果见表8.3,问两种疗法疗效是否有差别?检验步骤:1、建立检验假设 H0:两种疗法治疗急性肾盂肾炎的疗效总体分布位置相同 H1:两种疗法治疗急性肾盂肾炎的疗效总体分布位置不同 =0.05,(二)、两组有序变量资料的秩和检验(等级资料),2、计算统计量(1)编秩:等级资料编秩时,相同等级的个体属于相持;先按组段计算各等级的合计,由此确定各组段秩次的范围;然后计算各组段的平均秩次。同样两组中样本例数较小者为n1 (2)求秩和并确定统计量 以各组段的平均秩次分别与各等级例数相乘,再求和得到各组秩和。 当两组样本例数相等,任取一组秩和为T值。 当两组样本例数不等,样本例数较小者对应的 秩和为T值,(3)计算Z值 由于例数和相持次数都较多,则使用正态近似的校正公式 3、确定P值,作统计推断,三、成组设计多个样本比较的秩和检验,完全随机设计多组样本比较的非参数方法是Kruskal和Wallis在Wilcoxon秩和检验的基础上发展而来的,故又称K-W检验或H检验。适用于连续型变量但不满足方差分析的条件,或有序变量。,(一)多组连续变量资料的秩和检验,其基本步骤和两组连续变量资料秩和检验大致相同,只是确定的统计量不同例12.5 某医师检测3种卵巢功能异常患者血清中促黄体素的含量(IU/L)资料见表12.5第(1)、(3)、(5)栏。问3种患者血清中促黄体素的含量(IU/L)是否有差别?,检验步骤:1、建立假设 H0:三组总体的分布相同 H1:三组总体的分布不同 =0.052、计算统计量H(1)编秩:三组混合编秩(2)求秩和:分别将各组秩次相加得到,记做R1 ,R2 ,R3,(3)计算统计量,3、确定P值,作出统计推断,(二)多组有序变量资料的秩和检验(等级资料),例12.6 某医院用三种复方小叶枇杷治疗老年慢性支气管炎,数据见表12.6第(1)(4)栏,试比较三种方剂的疗效有无差异。,检验步骤:1、建立假设 H0: 三种方法疗效的总体分布位置相同 H1: 三种方法疗效的总体分布位置不全相同=0.052、计算统计量(1)编秩混合编秩(先计算各等级合计,再确定秩次范 围及平均秩次)。(2)求秩和(3)计算统计量H,由于其相持较多,因此使用校正公式,3、确定P值,作出统计推断 近似服从自由度为k-1的卡方分布,查卡方界值表得到P值,并预检验水准做比较得出统计推断。,五、多个样本间的多重比较,无论是完全随机多组独立样本资料还是随机区组设计资料,经秩和检验认为总体分布不同,在实际工作中须进一步做两两比较的秩和检验。,本质是对检验水准进行一定的调整,将得到的P值与调整后的检验水准进行比较。,四、随机区组设计的秩和检验,例12.8 观察某药不同剂量对肝功能的影响,将同种属的28只大白鼠按窝别、性别、体重配为7个配伍组,每个区组的4只大白鼠随机分入不同的4种剂量组,在用药后一周测定各血清中指标DT值的变化,结果见表12.8,问此药不同剂量对血清中指标DT值的影响有无不同?1、建立假设 H0:此药不同剂量时血清中DT值的总体分布位置相同 H1:此药不同剂量时血清中DT值的总体分布位置不全相同 =0.05,2、计算统计量(1)编秩:横向区组内编秩。(2)求秩和:纵向处理组内求秩和。 也即横向编秩,纵向求和。(3)计算统计量M,小结,非参数检验适用于:等级资料;总体分布类型不明的资料;非正态分布的资料;对比组间方差不齐的资料;一端或两端观察值不确切的资料。秩和检验是将原数据转换为秩次,比较各组秩和的一类非参数检验方法。不同设计类型的秩和检验其编秩、求秩和、计算统计量、确定值的方法有所不同。注意编秩时相同数据一般取平均秩次,以及相持现象较多时统计量的校正此外还需注意,有序分类变量资料运用非参数检验可推断各等级强度的差别,而列联表检验是比较频数分布之间的差别,