秩和检验-课件.ppt
秩转换的非参数检验,参数检验:总体分布为已知的数学形式,对其总体参数做假设检验。非参数检验:是针对参数检验而言的,不依赖于总体分布的一种假设检验方法,它直接对总体分布进行假设,不受总体分布的限制,适用范围广,而且简便易学。,参数统计方法的局限性,必须要先对总体分布进行确定,当总体分布未知,或分布不符合要求时无法使用。例:住院时间结果为有序分类变量时无法使用。例:尿糖检测结果样本数据两端有不确定值时无法使用。例:仪器性能限制,超出可测量范围以上情况下强行使用参数统计方法可能会得到错误结论,非参数检验一般不直接用样本观察值作分析,统计量的计算基于原数据在整个样本中按大小所占位次。由于丢弃了观察值的具体数值,而只保留其大小次序的信息,凡适合参数检验的资料,应首选参数检验。但不清楚是否适合参数检验的资料,则应采用非参数检验;尤其对于难以确定分布又出现少量异常值的小样本数据,非参数检验在剔除这些数据前后所得结论显示出其较好的稳健性。,非参数检验的适用范围:,计量资料不满足正态或方差齐性条件 对于分布不知是否正态的小样本资料 对于一端或两端无确定数值的资料 等级资料进行等级强度差别的比较,非参数方法的特点:,适用范围广,几乎可用于任何情况。当资料符合参数检验方法的适用条件时,使用非参数方法的检验效能较低。原因:无法借助总体分布得到许多推论,本身在利用信息上就有丢失,型错误和型错误,(1)即把握度(检验效能)(power of a test):两总体确有差别,在检验水准下,被检出有差别的能力(1)即可信度(confidence level):重复抽样时,样本区间包含总体参数(m)的百分数,参数统计(parametric statistics),非参数统计(nonparametric statistics),缺点:对于符合参数统计分析条件者,采用非参数统计分析,其检验效能较低,预备知识,分析方法心中有数:当手中有了数据,首先要对它进行充分、直观的了解,直方图,茎叶图,箱图等可以帮助我们对数据的分布形状进行探索,避免因对数据的特性缺乏了解而盲目使用一些方法作出错误的或不合理的结论。如果能使用参数方法,当然还是参数方法更好一些,参数法效能高,方法多。,预备知识,秩(Rank):对于样本,按由小到大排成一列,若数据X在这一列中占据第i位,称X的秩为Ri 实际上就像是考试成绩的排名,只不过倒了过来相同秩(Ties,得分相同,不分胜负,平手):在许多情况下,数据中会有相同的值出现,此时如果排秩的话就会出现同秩的现象,这种情况被称为数据中的相同秩。如:考试成绩的并列第三名 在默认情况下,秩和检验中的相同秩为它们按大小顺序排列后所处位置的平均值。,秩转换的非参数检验(秩和检验),首先将观察值从小到大,或者等级从弱到强转换为秩次后,再计算统计量,这种用数据的秩代替原始数据进行假设检验的方法称为秩和检验。秩和检验对总体分布的形状差别不敏感,只对总体分布的位置差别敏感。,非参数检验的方法很多,有符号检验、游程检验、等级相关分析、秩和检验等。秩转换的非参数检验(秩和检验)是在非参数检验中占有重要地位且检验功效高的一种方法。,第一节配对样本比较的Wilcoxon符号秩检验第二节两个独立样本比较的Wilcoxon秩和检验第三节 完全随机设计多个样本比较KruskalWallis H检验第四节 随机区组设计多个样本比较的Friedman M 检验,第一节 配对样本比较的Wilcoxon符号秩检验,Wilcoxon符号秩检验可用于1.配对样本差值的中位数与0的比较2.单个样本中位数和已知的一个总体中位数比较。,一、配对样本差值的中位数与0的比较,比较目的是推断配对样本差值得总体中位数是否为0,也可以说是推断配对的两个相关样本所来自的两个总体中位数是否相等。,例8-1 对12份血清分别用原方法(检测时间20分钟)和新方法(检测时间10分钟)测谷-丙转氨酶,结果见表8-1的(2)、(3)栏。问两法所得结果有无差别?,表8-1 12份血清用原法和新法测血清谷-丙转氨酶的比较,本例为配对实验设计,对其差值进行正态性检验:W=0.875,P=0.076,不满足正态性的条件,使用符号秩检验。,1。建立假设并确定检验水准 H0:差值的总体中位数为0,Md=0 H1:差值的总体中位数不为0,Md0=0.05,2。计算统计量T,省略所有差值为0的对子,令余下的有效对子数为n,本例n=11,对剩余的差值的绝对值从小到大编秩,并根据差值的正负号标上符号。编秩时遇到绝对值相同时取平均秩次。,分别求正负秩次之和,用T+和T-表示,并任选正秩和或负秩和作为统计量值。,本例T=T-=11.5,3.确定P值,作出统计推断,查表法:n50查界值表,若T在上下界值范围内,P大于表中上方对应的概率水平;若T等于上侧界值或下侧界值,P近似等于表中上方对应的概率水平;若T不在上下界值范围内,P小于表中上方对应的概率水平。,本例n=11,T=T-=11.5,查界值表:0.05P0.10,按=0.05的水准,不拒绝H0,还不能认为两法测定血清谷-丙转氨酶结果有差别。,正态近似法:当n50超出界值表的范围时,可以使用正态近似法作u检验。,tj为第j个相同秩次的个数 如:相同秩中有2个1.5,5个8,3个14,则t1=2,t3=5,t3=3,例 配对比较甲、乙两种方法治疗扁平足效果,记录如下,问两种疗法是否有差别?,配对的等级资料,符号秩和检验若用于配对等级资料,则应先将等级从弱到强赋值,然后再进行符号秩检验。但对于等级资料,相同秩次多,小样本的检验结果会存在偏差,最好为大样本。,1。建立假设并确定检验水准 H0:差值的总体中位数为0,Md=0 H1:差值的总体中位数不为0,Md0=0.05,2。计算统计量T,T+=34.5 T-=10.5 T=10.5,3.确定P值,作出统计推断,n=9,T=T-=10.5,查界值表:P0.10,按=0.05的水准,不拒绝H0,还不能认为两法治疗扁平足效果不同。,二、单样本中位数与总体中位数的比较,比较目的是推断样本来自的总体中位数M和某个已知的总体中位数M0是否相等。即推断样本各变量值和M0差值的总体中位数是否为0。,例8-2 已知某地正常人尿氟含量的中位数为45.30mol/L。今在该地某厂随机抽取12名工人,测得尿氟含量见表8-2第(1)栏。问该厂工人的尿氟含量是否高于当地正常人的尿氟含量?,对工人尿氟含量进行正态性检验得W=0.845,P=0.032,不满足正态性的条件,使用符号秩检验。,表8-2 12名工人的尿氟含量(mol/L)与45.30比较,1。建立假设并确定检验水准 H0:该厂工人尿氟含量的总体中位数为45.30 H1:该厂工人尿氟含量的总体中位数大于45.30=0.05,2。计算统计量T,T+=64.5 T-=1.5 T=1.5,3。确定P值,作出统计推断,n=11,T=T-=1.5,查界值表:P0.005,按=0.05的水准,拒绝H0,接受H1,可以认为该厂工人尿氟含量高于当地正常人。,第二节 两个独立样本比较的Wilcoxon秩和检验,两组独立样本比较的秩和检验(Wilcoxon秩和检验),目的是推断计量资料或等级资料的两个独立样本代表的两个总体分布是否有差别。理论上H0为两总体分布相同,即两样本来自同一总体;H1为两总体分布不同。由于秩和检验对两总体分布形状的差别不敏感,对位置相同、形状不同但类似的两总体分布,推断不出两总体分布(形状)有差别,故在实际应用中,H0可写作两总体分布位置相同,也可简化为两总体中位数相等。,例8-3 对10例肺癌病人和12例矽肺0期工人用X光片测量肺门横径右侧距RD值(cm),结果见表8-5。问肺癌病人的RD值是否高于矽肺0期工人的RD值?,表8-5 肺癌病人和矽肺0期工人的RD值(cm)比较,1。建立假设并确定检验水准 H0:肺癌病人和矽肺0期工人RD值的总体分布位置相同 H1:肺癌病人的RD值高于矽肺0期工人的RD值(总体分布位置靠右)=0.05,分析:本例两样本资料经正态性检验,W1=0.959,P1=0.775,W2=0.943,P2=0.533;经方差齐性检验,F=20.455,P=0.000,推断的两总体方差不等,使用Wilcoxon检验,2。计算统计量T,把两样本数据混合小到大编秩,遇到数据相同的取平均秩次,分别求两样本秩次之和,用T1和T2表示(样本含量小的为T1),选择T1作为统计量值T。若样本含量相等,任取一个秩和作为T(T1或T2)。,本例:n1=10,T1=141.5,n2=12,T2=111.5 所以:T=T1=141.5,3.确定P值,作出统计推断,查表法:当n110以及n2-n110时,可以查界值表确定概率值。查界值表,若T在上下界值范围内,P大于表中上方对应的概率水平;若T等于上侧界值或下侧界值,P近似等于表中上方对应的概率水平;若T不在上下界值范围内,P小于表中上方对应的概率水平。,按=0.05的水准,拒绝H0,接受H1,可以认为肺癌病人的RD值高于矽肺工人的RD值。,本例n1=10,n2-n1=2,T=141.5,查界值表:0.025P0.05,当n110或者n2-n110时,可使用正态近似法作u检验。,tj为第j个相同秩次的个数,表8-6 吸烟工人和不吸烟工人的HbCO(%)含量比较,二、频数表资料和等级资料的两样本比较,例8-4 39名吸烟工人和40名不吸烟工人的碳氧血红蛋白HbCO(%)含量见表8-6。问吸烟工人的HbCO(%)含量是否高于不吸烟工人的HbCO(%)含量?,1。建立假设并确定检验水准 H0:吸烟工人和不吸烟工人的HbCO含量总体分布位置相同 H1:吸烟工人的HbCO含量高于不吸烟工人的HbCO含量(总体分布位置靠右)=0.05,2。计算统计量T,先确定各等级的合计人数、秩次范围和平均秩次。,分别求两样本秩次之和,,本例:n1=39,T1=1917,n2=40,T2=1243 所以:T=1917,3.确定P值,作出统计推断,超出界值表的范围,使用正态近似法作u检验。,本例:n1=39,n2=40,N=79,T=1917 t1=3,t2=31,t3=27,t4=14,t5=4,查u界值表u0.0005=3.2905,P0.0005,按=0.05的水准,拒绝H0,接受H1,可以认为吸烟工人的的HbCO含量高于不吸烟工人。,三、Mann-Whitney U 检验,两独立样本比较还常用Mann-Whitney U 检验(Mann-Whitney U test)。检验统计量U值为:把第一个样本的n1(n1n2)个变量值的每个变量值,与第二个样本的n2个变量值逐个比较(小于记1,相等记0.5,大于记0),求其和。,表8-5 肺癌病人和矽肺0期工人的RD值(cm)比较,当n1和n2小时,如n1+n230,有专门的U界值表;当n1和n2大时,用正态近似法作u检验确定概率P值。对同一资料Wilcoxon秩和检验的结果与Mann-Whitney U 检验结果等价,且uU=uT。,第三节 完全随机设计多个样本比较的Kruskal-Wallis H检验,一、多个独立样本比较的Kruskal-Wallis H检验,Kruskal-Wallis H检验用于推断计量资料或等级资料的多个独立的样本所来自的多个总体分布是否有差别。在理论上讲,检验假设H0应为多个总体分布相同,即多个样本来自同一总体。但由于H检验对总体分布的形状差别不敏感,而对总体分布的位置敏感,所以实际应用中H0可以写作多个总体分布的位置相同,例8-5 用三种药物杀灭钉螺,每批用200只活钉螺,用药后清点每批钉螺的死亡数、再计算死亡率(%),结果见表8-9。问三种药物杀灭钉螺的效果有无差别?,(一)原始数据的多个样本比较,表8-9 三种药物杀灭钉螺的死亡率(%)比较,分析:本例资料为百分率资料,不知道是否符合正态分布,而且样本含量很小,保守起见选择Kruskal-Wallis H检验,1。建立假设并确定检验水准 H0:三种药物杀灭钉螺的死亡率的总体分布位置相同 H1:三种药物杀灭钉螺的死亡率的总体分布位置不全相同=0.05,2。计算统计量H,把各个样本数据混合小到大编秩,遇到数据相同的取平均秩次,分别求各样本秩次之和,用Ri表示。,计算统计量H,ni为第i个样本的样本容量;为第i个样本的秩和N=ni,当出现相同秩次时,算得H值偏小,应进行校正,求校正HC值。,本例:n1=n2=n3=5,N=15,R1=63,R2=38,R3=19,tj为第j个相同秩次的个数,3.确定P值,作出统计推断,查表法:当样本个数g=3以及每个样本例数ni5时,可以查界值表确定概率值。,本例:g=3,n1=n2=n3=5查界值表:H0.01=7.98,P0.01,按=0.05的水准,拒绝H0,接受H1,可以认为三种药物杀灭钉螺的效果不全相同。,当g3或g=3但最小样本容量ni5,则H或HC近似服从=g-1的2分布,可以查2界值表确定概率值。,例8-6 比较小白鼠接种三种不同菌型伤寒杆菌9D、11C和DSC1后存活日数,结果见表8-10。问小白鼠接种三种不同菌型伤寒杆菌的存活日数有无差别?,表8-10 小白鼠接种三种不同菌型伤寒杆菌的存活日数比较,分析:本例资料为时间资料,一般生存日数资料为非正态分布,W1=0.871,P1=0.103,W2=0.853,P2=0.080,W3=0.931,P3=0.425,选择Kruskal-Wallis H检验,1。建立假设并确定检验水准 H0:接种三种不同菌型伤寒杆菌的存活日数总体分布位置相同 H1:接种三种不同菌型伤寒杆菌的存活日数总体分布位置不全相同=0.05,2。计算统计量H,把各个样本数据混合小到大编秩,遇到数据相同的取平均秩次,分别求各样本秩次之和,用Ri表示。,计算统计量H,所以:0.005P0.01,按=0.05的水准,拒绝H0,接受H1,可以认为小白鼠接种三种不同菌型的伤寒杆菌的存活日数不全相同。,3.确定P值,作出统计推断,本例全部样本容量均大于5,HC近似服从=g-1=3-1=2的2分布,可以查2界值表确定概率值。,(二)频数表资料和等级资料的多个样本比较,例8-7 四种疾病患者痰液内嗜酸性白细胞的检查结果见表8-11。问四种疾病患者痰液内的嗜酸性白细胞有无差别?,1。建立假设并确定检验水准 H0:四种疾病患者的痰液内嗜酸性粒细胞总体分布位置相同 H1:四种疾病患者的痰液内嗜酸性粒细胞总体分布位置不全相同=0.05,2。计算统计量H,先确定各等级的合计人数、秩次范围和平均秩次。,分别求各样本秩次之和:Ri,计算统计量H,3.确定P值,作出统计推断,所以:P0.005,=g-1=4-1=3,按=0.05的水准,拒绝H0,接受H1,可以认为四种疾病患者的痰液内嗜酸性粒细胞总体分布位置不全相同。,二、多个独立样本两两比较,K-W H检验拒绝H0,接受H1,认为多个总体分布位置不全相同,需要进一步推断那两个总体分布不同。,其中:,(一)、Nemenyi法检验,例8-8 对例8-6资料作三个样本间的两两比较,1 建立假设并确定检验水准 H0:任两对比组的总体分布位置相等 H1:任两对比组的总体分布位置不等=0.05,本例:,0.025P0.05,0.01P0.025,0.99P0.995,2 计算统计量2,3.确定P值,作出统计推断,=g-1=3-1=2,接种9D与11C比较,按=0.05的水准,拒绝H0,接受H1,可以认为两组小白鼠存活日数不同;接种9D与DSC1比较,按=0.05的水准,拒绝H0,接受H1,可以认为两组小白鼠存活日数不同;接种11C与DSC1比较,按=0.05的水准,不拒绝H0,还不能认为两组小白鼠存活日数不同。,(二)、bonfferoni调整法,改变检验水准后,使用Wilcoxon秩和检验,对任意两样本进行两两比较。,要使多次比较后犯型错误的累计概率保持不变或至少不超过原水准,则每次两两比较的检验水准可利用bonfferoni不等式确定。,Bofferoni提出,若每次检验水准为,共进行m次比较,当H0为真时,犯型错误的累计概率不超过m,即有bonfferoni不等式m成立。,4个样本均数比较,得到拒绝H0,接受H1的结论,任意两样本间进行比较需6次,m=6,当=0.05时,犯型错误的累计概率:=1-(1-0.05)3=0.265 m=0.056=0.30,3个样本均数比较,得到拒绝H0,接受H1的结论,任意两样本间进行比较需3次,m=3,当取=0.05时,新的检验水准=0.05/3=0.0167,此时,犯型错误的累计概率:=1-(1-0.0167)3=0.0493小于检验水准,要使多次比较后犯型错误的累计概率保持不变或至少不超过原水准,则每次两两比较的检验水准可利用bonfferoni不等式确定:即=/m。,1。多个处理组间的两两比较,2。实验组与同一个对照组的比较,其中:k样本个数(处理组数)原检验水准,第四节 随机区组设计多个样本比较的Friedman M检验,一、多个相关样本比较的Friedman M检验,Friedman M检验用于推断随机区组设计的多个相关样本所来自的总体分布是否有差别。在理论上讲,检验假设H0应为多个总体分布相同,即多个样本来自同一总体。但由于M检验对总体分布的形状差别不敏感,而对总体分布的位置敏感,所以实际应用中H0可以写作多个总体分布的位置相同,例8-9 8名受试对象在相同实验条件下分别接受4种不同频率声音的刺激,他们的反应率(%)资料见表8-12。问4种频率声音刺激的反应率是否有差别?,表8-12 8名受试对象对4种不同频率声音刺激的反应率(%)比较,分析:本例实验设计为随机区组设计,资料为百分率资料,WB=0.810,PB=0.037,选择Friedman M检验,1。建立假设并确定检验水准 H0:四种频率声音刺激的反应率的总体分布位置相同 H1:四种频率声音刺激的反应率的总体分布位置不全相同=0.05,2。计算统计量M,将每个区组的数据小到大编秩,遇到数据相同的取平均秩次,分别求各样本秩次之和,用Ri表示。,计算样本的平均秩和,计算统计量M,其中:n表示区组个数;g表示处理组个数,3.确定P值,作出统计推断,查表法:当n15以及g15时,可以查M界值表确定概率值。,本例:n=8,g=4,查界值表M0.05/2=105P0.05,按=0.05的水准,拒绝H0,接受H1,可以认为四种频率声音刺激的反应率的总体分布位置不全相同。,2近似法:当n15或g15时,可以用2近似法确定概率值。,其中:tj为按区组而言的第j个相同秩次的个数,查2界值表,P0.005,结论同前,在实际工作中g4或者g=4且n5或者g=3且n9时,就可以使用2近似法。,二、多个相关样本两两比较,当M检验拒绝H0,接受H1,认为多个总体分布位置不全相同,需要进一步推断那两个总体分布不同,即多重比较。,(一)、q检验,其中:,n区组个数g处理组个数Ri(Rj)第i(j)个处理组的秩和tj按区组而言第j个相同秩次的个数,例8-10 对例8-9资料作四个样本间的两两比较,1 建立假设并确定检验水准 H0:任两对比组的总体分布位置相等 H1:任两对比组的总体分布位置不等=0.05,2 计算统计量q,将各样本的秩和从小到大排列,计算统计量q,3.确定P值,作出统计推断,按=0.05的水准,A与D、A与C、B与D、B与C,拒绝H0,接受H1,可以认为他们的的反应率的总体分布位置不同;A与B、C与D,不拒绝H0,还不能认为他们的的反应率的总体分布位置不同。,(二)、Bonfferoni调整法,改变检验水准后,使用Wilcoxon符号秩检验,对任意两样本进行两两比较。检验水准的确定同多样本秩和检验。,1。多个处理组间的两两比较,2。实验组与同一个对照组的比较,其中:k样本个数(处理组数)原检验水准,