统计学第13讲 第13章 非参数检验课件.ppt
第13章 非参数检验,13.1 导言,科研中不是所有的变量都可以采用参数检验,如果变量严重偏离已知分布,可考虑采用非参数检验。即便在小样本情况下,非参数检验仍然和参数检验一样有效。,在选择检验方法时要小心,如果是试探性的,可选择一些样本,使用多种检验方法进行统计分析,借以了解不同检验方法的差异。,但是要避免下列错误做法:先搜集数据,在“货比三家”后选择一个有利于自己科研结果的,并且能带来统计显著性的统计方法,科研中。虚无假设、备择假设、统计检验、抽样分布以及显著性水平都必须在数据搜集之前就要确定下来。如果先搜集数据,再“货比三家”地考虑统计分析方法,我们会为了“差异显著”而夸大偶然造成的差异效应,会增大犯类错误的概率。,13.2 类别变量,分类变量的数据就是计数数据,非参数检验适合小样本的计数数据。但是当大样本时,计数数据也可考虑使用参数检验。,测量、等距、比率量表,当样本小并且分布不明朗,不服从正态分布,可考虑非参数检验。,13.2.1 二项检验,称名量表的测量水平最低,常用二分类,(two-category)或二分总体(dichotomous population),请同学举例说明有那些二分总体?,男女,对错,正反,阴阳,有无文化.,定义:二分总体中, p 为一类所占的比例,q=1p为另一类所占比例。,例题:某大学教导主任说,自从学校禁售香烟以来,吸烟学生比例下降到70%以下。但是对其他学校观察发现,禁售对吸烟影响不大,仍然有70%的人在吸烟。请检验教导主任的说法是否正确。,随机抽取40名同学,询问发现其中有12名吸烟。则不吸烟的同学数量为: X=28,用 P0 表示总体吸烟比例,1. 虚无假设:吸烟学生总体比例P00.7,2. 备择假设:样本所在总体比例P00.7,4. 统计检验: 二分总体 , 采用二项式检验,5. 抽样分布: 统计量为 X , 在附表N中列出N50时,不同p,q的单侧临界值。,3. 显著水平:=0.05,单尾检验,6. 临界区间:参照表N,N=40,p=0.30,q=0.70,发现0.05的临界值为18,单尾检验。,7. 因为X=2818,拒绝H0,认为教导主任是对的,表N 当N=249时, =0.01和0.05时,p和q各种取值下的临界值,13.2.2 当N比较大时,二项分布近似正态曲线,当p=q=0.5,或p、q接近0.5时,二项分布接近正态分布,简便法则:当pq接近0或1时,Npq至少等于9,当p=q=0.5时,N25。,此时,二项变量XN(Np, ) 的正态分布,13-1,z N(0, 1 ) ,X的概率= z 对应的概率,例题 已知 X=5,N=20,p=q=0.5,=0.05,双尾检验。计算P(X5) 或P(X15),当=0.05,双尾检验时,| z |1.96,所以拒绝H0,如果我们从附表M中查找, X=5,N=20,双尾检验,发现:拒绝H0需要NX15,本题NX=15,所以拒绝H0。这和利用正态分布计算是一致的。表M只列出了N=50的临界值,建议N50时才使用正态分布。,13.3 单变量的2 检验,肥胖与健康问题有关,亚特兰大疾控中心定期进行全国青少年危机监督调查,对11631名男女青年(9到12年级)自身体重观的部分调查结果。,这个问题可以使用单变量2 检验或拟合优度检验(goodness-of-fit test),观测值与虚无假设下的期望值之间是否存在差异?,观测值分布是否与理论分布相吻合?,表13-1 女生的自身体重观,H0: f1=f2=f3,如果观察值与期望值比较接近,则2 很小,不拒绝H0 , 否者2 会增大, 2 越大,则越有可能拒绝H0.,在 t 分布中,自由度与样本量有关,而2 分布的自由度与类别 k 有关,单变量,df=k1。此题的k=3, df=3 1=2,判断方法,如果2 2临界值,则拒绝H0。,表13-2 2 部分临界值表,表13-3 女生对自身体重观念,H0下的期望值及2 值计算表,因为2=2297.138 9.210,拒绝H0。,13.4 独立类别变量的2检验,问题1. 不同社会经济背景的儿童,其暴力犯罪的概率是否存在差异?,暴力犯罪与社会经济背景是独立的?还是暴力犯罪部分取决于社会经济背景。,问题2. 男女青年对于自身体重观念存在差异吗?,人们对自身体重的观念与性别有关吗?,上述诸多问题归纳为两点:,1. 对两个或多个称名变量的研究,2. 每个类别的变量绘制成交叉表,交叉表的缺点:没有明显办法计算期望值,表13-4 22列联表,男女青年体重自我感觉,H0:感觉与性别无关 H1:感觉与性别有关,如果H0是真实的,则预期女性自认为体重过轻的比例与行合计认为体重过轻的总比例相同,所以a单元格的期望次数为:,df=(行数-1)(列数-1)=(2-1)(2-1)=1,表13-5 男女青年体重自我感觉的期望次数,表13-6 每个单元格的体重卡方值(fofe)2/fe的计算,因为2=594.44 3.8415,拒绝H0。,注意:使用2检验要求每一个观察值或出现的频次都与其他观察值相独立。你不可能对同一个体进行多次观测,把它看做是不同被试身上得到的,那么造成的误差使得“N增大”,导致犯类错误。,例如:研究两男两女4位朋友看电影的情况,,417,这类数据不能列成交叉表,宜用参数检验,13.5 顺序量表变量非参数检验,1. 曼-惠特尼U检验(Mann Whitney U test),适用于独立样本,因变量可以是定量的,也可以是分类的,定量的不服从正态分布,用U检验代替 t 检验。,2. 符号检验(Wilcoxon sign test),适用于两组相关样本设计,根据某些标准条件对被试进行配对,或者对同一被试进行前后测量,尽管因变量分数是顺序量表,我们并不愿意假设差异具有精确的属性。因此,忽略分数之间的差异,只是关心这些差异的方向(即大于还是小于)。,3. 维尔克松配对符号等级检验(Wilcoxon signed rank test)适用于配对组设计,并且假设数据是量化的,数据之间的差异可以可以按照差异量的大小进行排序。,13.6 独立样本设计:曼-惠特尼U检验,例题 进行一项研究,目的是探明某药物刺激视觉反应时的影响,实验组有8个被试,控制组有7个被试,因变量是反应时,单位为毫秒(ms),反应时往往是右偏态的,可考虑选择U检验而不是 t 检验。,1. 将实验组与控制组放在一个表中从小到大排序,2.将各组的等级分别相加求和:实验组的等级为T1, N1=8,控制组T2 , N2=7。,有两个统计量,U 和 都可用来检验H0,13-3,13-4,曼-惠特尼U检验的虚无假设是H0:U =,换言之,如果两个分布的等级相同,则 ,并且必须假定两组之间无系统误差。假如一组的等级比较多,则 .当我们拒绝虚无假设时,一组的等级分数比预期的少,而另外一组比预期的多。,表13-7 使用公式13-3计算曼-惠特尼U检验(假设数据),=11,=56+36-81,检验步骤如下:,1. H0: 两组等级差异是机遇所致,2. H1: 两组等级差异不是随机的,3. 统计检验:曼-惠特尼 U 检验,4. 显著水平:=0.05,5. 抽样分布:曼-惠特尼U:N1=8 , N2=7,6. 拒绝H0的判别区域:U10 或 U46,如果U在此范围之外,就拒绝H0,否者不拒绝H0。,因为U=1110,所以不拒绝H0 。这种药物对反应时没有影响。,曼-惠特尼U检验的临界值表见统计表I,根据U和 的值大小决定否拒绝H0。对任意的N1和N2,给定的水平,表中的值给出的是判别值的上下限。所以,统计量U下限, 或,上限,才能拒绝H0。,因为U=1110,所以不拒绝H0 。这种药物对反应时没有影响。,13.6.1 具有相同等级的曼-惠特尼U检验,数据中经常会出现几个分数恰好相同的情况,从理论上说,如果测量工具精确到小数点几位以后,那就不应存在相同测量结果。但是数据是连续的,测量数据大多数比较粗略,常常存在相同数据,好比计算Spearman等级相关一样,要计算平均等级.,如果相同等级出现在同一组,倒无所谓。但是,如果相同等级出现在不同的组,那就要采取矫正公式。如不能矫正,其结果是检验比较“保守”,就是说,不该拒绝虚无假设的时候却拒绝了虚无假设,降低了犯类错误的概率。只有相同数值比较多,以及未加矫正的U值接近设定的显著性水平时,才建议矫正。,13.6.2 N1 和(或) N2大于20时的曼-惠特尼U检验,两个样本容量基本相等,并且其中一个大于20 ,U的分布近似正态分布,13-5,13-7,13-6,假如某研究者完成了一项任务,该研究中N1=22,N2=22, 组1的等级之和=630。=0.05,检验虚无假设,两组来自平均等级相同的总体。,基于H0的平均期望之和,检验统计量 z 为:,因为 z 1.96 ,所以拒绝H0,结论:两种实验处理产生了差异。,13.7 相关样本的非参数检验,13.7.1 符号检验,重复前面讨论过的问题:假设智力与领导能力是相关变量,根据26人的智力进行配对,设立实验组和控制组。在完成培训任务后,由独立观察者根据50点量表进行评定。,表13-8 两个配对被试组的领导能力得分评定成绩(假设数据),对等级数据唯一能做的合理假设是:两配对分数之间的任意差异仅仅说明差异的方向,不能说明大小,差值为零的表示不存在差异,去掉后剩余12对,根据虚无假设,有一半是正向变化,另外一半负向变化,若H0: p=q=0.5 ,成立,则出现正向变化和负向变化(二分总体)的概率相等。,其中12对显示出差异,有N+=9,N=3,H0: p=q=0.5 , 有N+=9,N=3,参考下面临界值表,在=0.05,双尾检验时,其临界值=10,而N+=910,不拒绝H0 , 领导培训课程没有高实验组被试的评定等级,符号检验的缺点:忽略数据中可能存在的定量信息,检验把所有的正向差异视为等同的,负向也是如此(例如-8=-7=-6)。如果数据确实允许我们考虑定量性质:如“差异 876,” ,则使用符号检验会降低检验效力。,13.7.2 Wilcoxon 配对符号等级检验,如果在研究中同时考虑差异数量和差异方向,则检验更具有效力。,Wilcoxon mathced-pairs signed-ranks test,表13-9 两个配对被试组的领导能力得分评定成绩(假设数据),H0:带正号的等级和=带负号的等级和,如果H0为真,则带正号等级和与带负号等级和应该差不多,如果差得多,就应该拒绝H0。,统计量 T =13, 根据下表,T13,拒绝H0。,13.7.3 Wilcoxon 配对符号检验的理论假设,第1假设:数据的测量水平至少要达到顺序水平,即对分数按照大小顺序较小排列。,第2假设:分数之间的差异可以组成一个顺序量表,我们尚不清楚这个假设对任意一组数据都是有效的。例如在测验情境中,使用人格量表测量焦虑,我们是否可以说,根据这个量表相差5点的差异一定大于相差4点的数据差异?如果不能够得出这个结论,我们就得使用其他的统计方法,哪怕显著性检验不够灵敏、不够有效。,再强调一次,科学研究的谨慎使我们宁愿犯类错误,也不愿犯类错误。,小结,1. 数据分为两种相互独立的分类变量时,使用二项检验。,适用于分类变量的四种显著性检验方法和涉及顺序变量的五种检验方法,2. 单变量卡方检验,即拟合优度检验。,3. 两变量卡方检验,确定两个变量时独立的还是相关的。重要条件是每个分类的频次必须是独立的,否者会犯“N增大”的错误。,4. 适用于顺序量表的非参数检验:曼-惠特尼独立样本检验,Wilcoxon 相关样本的符号检验,配对样本的符号-等级检验,需要牢记的术语,二分(类)总体 单变量拟合优度检验,N增大 曼-惠特尼U检验,符号检验 Wilcoxon 配对符号等级检验,