spss在财务管理中的应用 第6章 非参数检验ppt课件.pptx
S P S S在会计和财务管理中的应用,苏海洋,第6章 非参数检验,学习目标:理解非参数检验和参数检验的区别;掌握分布拟合检验的SPSS操作及结果解释;掌握独立性检验的SPSS操作及结果解释;掌握二项检验的SPSS操作及结果解释;掌握两独立样本非参数检验的SPSS操作及结果解释;掌握两相关样本非参数检验的SPSS操作及结果解释。,前言,由于参数假设检验需要满足一系列前提条件,因而无法对所有数据类型做出正确的统计推断。于是人们又发展出了非参数检验的方法以解决不适合参数检验条件数据的统计推断。,6.1 非参数检验简介,6.1.1 非参数检验和参数检验的异同参数检验(parametric test),是在总体分布形式已知的前提下,检验同一分布族中的参数异同。非参数检验(non-parametric test),是在总体分布未知,或参数检验的其它必要条件(如方差齐性)不满足时,对总体做统计推断的方法假设检验的一般原理对这两类方法都适用,置信水平1-、p值等的概念也具有相同的涵义。,6.1 非参数检验简介,6.1.1 非参数检验和参数检验的异同,6.1 非参数检验简介,6.1.2 非参数检验的优缺点优点非参分布的限制,对不满足总体分布假设的数据仍可使用。非参数检验往往不需要大样本,小样本情况下结果也较为可靠。非参数检验对计数数据、定类数据和定序数据等非连续变量数据都可使用。,6.1 非参数检验简介,6.1.2 非参数检验的优缺点缺 点未能充分利用数据的全部信息。在将原始数据转换成等级、符号时,丢失了原始数据提供的数量大小的信息。 非参数方法不能像多因素方差分析一样分析交互作用,并对其做假设检验。 非参数方法的统计检验力往往低于相应的参数检验。,6.1 非参数检验简介,6.1.3 非参数检验的SPSS过程,6.2 卡方检验,6.2.1 卡方检验的一般原理 卡尔皮尔逊(Pearson, K.,1900),以频数数据对象的假设检验,它以实际观测次数和理论期望次数之间的差异构造出 统计量,从而利用 分布进行假设检验, 统计量公式为 k 是样本分类数; f oi表示第i 类实际观测到的频数; fei表示第i 类理论分布下的频数。,6.2 卡方检验,6.2.1 卡方检验的一般原理当频数n充分大时, 统计量渐进服从 分布。如果从样本计算出的 统计量很大,则它所对应的p值会很小,说明总体在原假设条件下样本取到实际观测频数的可能性是非常小的,若小于事先确定的显著性水平,则拒绝原假设H0;反之,观测到的频数与理论频数差距越小, 值就越小,假设检验的p值就越大,若该p值大于事先确定的显著性水平,则接受原假设H0。,6.2 卡方检验,6.2.1 卡方检验的一般原理当某个类别的理论频数较小(fei5)时, 统计量与 分布有一定差距,这时应用费雪精确检验法来进行假设检验。费雪精确检验(Fisher, R.A.,1922)是用排列组合的原理算出原假设条件下出现样本频数的精确概率。,6.2 卡方检验,6.2.2 分布拟合检验6.2.3 独立性检验,6.2 卡方检验,6.2.2 分布拟合检验分布拟合检验用于检验总体是否具有某个指定的分布或属于某一个分布族。 拟合优度检验法是分布拟合检验的一种,它针对分组数据。原理:假设样本来自的总体服从某一分布,然后求出随机变量落在每一组中的理论频数。,6.2 卡方检验,6.2.2.2 拟合优度检验的SPSS过程 案例6-1:数据“收入分布1.sav”中,某社区9557名居民的收入按行业惯例被 分成了7个档次,如右图所示。检验该社区居民的人均月收入X(元)是否来自服从N (6000,2000)的总体?,6.2 卡方检验,6.2.2.2 拟合优度检验的SPSS过程案例分析:这是一个典型的分布拟合检验,正态分布参数是已知的,我们可以用 拟合优度检验法来检验样本数据是否和该正态分布有差异。首先我们需要将理论分布计算出来。第一步:计算理论分布步骤1:先将每组收入下限输入一个新的数据集中,如图。,6.2 卡方检验,第一步:计算理论分布步骤2:计算出理论累积概率。选择主菜单【转换(T)】中的【计算变量(C)】命令,打开计算变量对话框。按图中提示输入。,6.2 卡方检验,第一步:计算理论分布步骤2【续】:计算出理论累积概率。结果如图。,6.2 卡方检验,第一步:计算理论分布步骤3:计算累积次数分布。选择主菜单【转换】中的【计算变量】命令,打开计算变量对话框。在【目标变量】框中新建变量“累积人数”,并在【数学表达式】框中填写“累计概率*9557”,即得到理论分布的人数频次。,6.2 卡方检验,第一步:计算理论分布步骤3【续】:计算累积次数分布。结果如图。,6.2 卡方检验,第一步:计算理论分布步骤4:将累积次数分布转换成简单次数分布。用累积人数中的后一组人数减前一组就可以得到每组的简单次数分布情况,即每组的理论人数。,6.2 卡方检验,第一步:计算理论分布步骤4:将累积次数分布转换成简单次数分布。用累积人数中的后一组人数减前一组就可以得到每组的简单次数分布情况,即每组的理论人数。将这个理论人数复制到本章数据“收入分布1.sav”数据中,6.2 卡方检验,第二步:拟合优度检验步骤1:在进行 拟合优度检验之前,还要先对个案进行加权。选择主菜单【数据(D)】中的【加权个案(W)】命令,进入【加权个案】对话框,在对话框中选择【加权个案】选项,并将变量“实际人数”置入右边的【频率变量(F)】框中。,6.2 卡方检验,第二步:拟合优度检验步骤2:分组变量进行个案加权之后就可以开始进行 拟合优度检验了。依次选择【分析(A)】【非参数检验(N)】【旧对话框(L)】【卡方(C)】命令。,6.2 卡方检验,第二步:拟合优度检验步骤3:单击【卡方(C)】进入其主对话框,把变量“组序号”置入右边的【检验变量列表(T)】框中,右边勾选【期望】下的【值(V)】以便输入理论人数。,6.2 卡方检验,第二步:拟合优度检验步骤4:结果解释。表6-2给出的是观察数、期望数和残差,利用这些数据我们做 检验。,6.2 卡方检验,第二步:拟合优度检验步骤4【续】:统计量 的值为(2.034E9)2.034109, 对应的p值(渐进显著性)为0.000,即p0.05,该例题的原假设H0是数据分布服从N(6000,2000)的正态分布,因此应该拒绝原假设。,6.2 卡方检验,思考: 统计量的值为(2.034E9),即2.034109这么大的统计量?理论次数小于5的单元格有1个,因此统计量不服从 分布。此时应采用费雪精确检验,但SPSS不提供该检验的办法。我们可以用合并单元格来解决,6.2 卡方检验,合并单元格后进行拟合优度检验我们将最后两组合并,使得合并后的所有组理论频数大于5。合并后我们可以重复上述的 拟合优度检验操作步骤。,6.2 卡方检验,合并单元格分析后结果解释。此时 统计量的值为27157.805,对应于自由度为5的 分布p值为0.0000.05,因此应该原假设。虽然在这个例子中最后的统计推论和合并组之前无异,但是检验统计量的值却相差甚远,因此我们要特别注意单元格理论频数不得小于5的假设。,6.2 卡方检验,6.2.3 独立性检验独立性检验简介:目的是从样本数据中推断总体两个变量是否彼此独立的检验,相当于独立样本比率差异的显著性检验,所需的数据通常为kj 交叉表。,6.2 卡方检验,6.2.3 独立性检验例如,对200名消费者购买日用品的名牌偏好和性别这两个变量做了调查,汇总结果如表6-6所示,试问名牌偏好和性别两个变量是否相互独立?,观 察 频 数,6.2 卡方检验,6.2.3 独立性检验独立性检验的原假设H0为男女消费者在品牌偏好上的比率没有显著差异,若该原假设成立,则每一格的理论fei次数应为 (fxi和fyi分别为性别变量和偏好变量的边际频数。),理 论 频 数,6.2 卡方检验,6.2.3 独立性检验由此我们可以计算出 统计量并进行假设检验,此时 统计量服从自由度为(k-1)(j-1)=(2-1)(2-1)=1的 分布。,观 察 频 数,理 论 频 数,6.2 卡方检验,6.2.3 独立性检验案例6-2:本章数据“性别与偏好.sav”是男性和女性购买日用品时对品牌的偏好类型(偏好品牌和不偏好品牌),试分析消费者购买日用品时对品牌的偏好是否与性别有关,或者说男性和女性购买日用品时的品牌偏好比率是否存在差异。,6.2 卡方检验,6.2.3 独立性检验步骤1:打开数据,依次选择【分析(A)】【描述统计】【交叉表(C)】命令,6.2 卡方检验,6.2.3 独立性检验步骤2:单击【交叉表(C)】进入其主对话框,并将两个变量分别置入【行(S)】和【列(C)】框中,这里将“性别”放入【行(S)】中,将“名牌偏好”放入【列(C)】框中。,6.2 卡方检验,6.2.3 独立性检验步骤3:单击【统计量(S)】进入其对话框,选择【卡方(H)】选项,如图6-17所示。单击【继续】按钮回到主对话框,最后单击【确定】按钮,提交系统分析,6.2 卡方检验,6.2.3 独立性检验步骤4:结果解释。该例的原假设是性别与名牌偏号是没有关联的(独立的),因为 统计量的检验概率p=0.0130.05,因此拒绝原假设,即认为消费者性别与对名牌的偏好存在关联。,6.2 卡方检验,6.2.3 独立性检验步骤4【续】:交叉表数据分布情况,结合上面分析,我们可以推断出女性消费者更偏爱购买名牌的日用品。,6.3 二项检验,6.3.1 二项检验的原理二项检验仅适用于二分类数据,即取值只有两类的数据。例如,性别男女,考试成绩分为及格和不及格。二分变量一般用0和1加以编码。从这种二分类总体中抽取样本量为n的样本,其频数分布服从二项分布。二项检验(Binomial test)就是一种用来检验样本是否来自参数为(n, p)的二项分布总体的方法。,6.3 二项检验,6.3.1 二项检验的原理进行二项检验所需的数据非常简单,即二分变量中每一个类别的频数。设第一个类别的频数为X,则二项检验的原假设H0为:XB (n,p), p=p0其中,n为样本容量,p为二分变量其中一个类别的比例,p0为原假设H0中该参数的取值。相应的备择假设H1为: XB (n,p), pp0,6.3 二项检验,6.3.2 二项检验的SPSS过程案例6-3:据媒体报道,2015年我国智能手机平均使用率达74%。某社区70岁以上的老年男性总数为1278,其中使用智能手机的有748人,不使用的有530人。那么该社区70岁以上的男性智能手机使用率与全国总人口的平均使用率74%是否有显著差异?,6.3 二项检验,6.3.2 二项检验的SPSS过程步骤1:由于数据为分类汇总数据,因而在进行检验之前要先对分组变量进行个案加权。选择【数据(D)】菜单中的【加权个案(W)】在子菜单, 在出现的对话框中选择【加权个案(W)】命令,把变量“人数”置入【频率变量(F)】框中。,6.3 二项检验,6.3.2 二项检验的SPSS过程步骤2:依次选择【分析(A)】【非参数检验(N)】【旧对话框(L)】【二项式(B)】命令。,6.3 二项检验,6.3.2 二项检验的SPSS过程步骤3:单击【二项式(B)】进入二项式对话框,在其对话框中,将“智能手机使用情况”置入【检验变量列表(T)】框中,因为2015年我国智能手机平均使用率达74%,我们要检验的是样本数据是否符合这个比例,因此在检验比例处输入0.74,其他选项默认系统设置,得到如图6-23所示的对话框。,6.3 二项检验,步骤4:结果解释。 从表中的“渐进显著性(单侧)”一栏的p值可以看出,该社区70岁以上的老年男性智能手机使用率与74%有显著差异,该被试群体使用手机的观测比例是0.59,所以可以认为该群体收集使用率小于我国的基本水平。,6.4 两独立样本非参数检验,6.4.1 两独立样本非参数检验的一般原理两独立样本来自于非正态总体时,不能用t 检验。通过对两个独立样本的均值、中数、离散趋势、偏度等进行差异性检验,分析它们是否来自相同分布的总体。,6.4 两独立样本非参数检验,6.4.2 Mann-Whitney U检验Mann-Whitney U检验又名Mann-Whitney-Wilcoxon 秩和检验,适用于比例数据和顺序数据,它检验两样本的总体在位置上是否有差异。检验的基本原理是利用秩统计量,即将两样本合并、排列后每个观测值所处的顺序位置做为“秩”,通过比较两个样本的秩推断两样本所来自总体的位置信息(即总体的均值)。检验统计量U 在大样本(n110, n210)和小样本两种情形下计算方法不同,但都是以两样本的秩为出发点进行计算的。原假设下的U统计量的分布为已知,小样本时为精确概率,样本量大时趋于正态分布。,6.4 两独立样本非参数检验,6.4.2 Mann-Whitney U检验2.Mann-Whitney U检验的SPSS过程案例6-4:数据“电暖气月销量.sav”(见表6-11)为某企业某款电暖气2014和2015年度的月销售量数据,请分析这两年的月销量分布是否相同。,表6-11 某企业某款电暖气月销量(台),6.4 两独立样本非参数检验,6.4.2 Mann-Whitney U检验2.Mann-Whitney U检验的SPSS过程案例分析:数据的组织方式和进行两独立样本t检验时一样,只是月销量的数据并不服从正态分布,也不需要这样的假设。,6.4 两独立样本非参数检验,6.4.2 Mann-Whitney U检验2.Mann-Whitney U检验的SPSS过程步骤1:打开数据,依次选择【分析(A)】【非参数检验(N)】【旧对话框(L)】【2个独立样本(2)】命令。,6.4 两独立样本非参数检验,6.4.2 Mann-Whitney U检验2.Mann-Whitney U检验的SPSS过程步骤2:单击【2个独立样本(2)】进入其主对话框。将“电暖气月销量”置入【检验变量列表(T)】框中,将“年份”置入【分组变量(G)】框中,定义组的方式与两独立样本t检验过程相同,这里通过单击【定义组(D)】进入对话框定义比较的组别,即2014和2015年,6.4 两独立样本非参数检验,6.4.2 Mann-Whitney U检验2.Mann-Whitney U检验的SPSS过程步骤3:这里选择系统默认的Mann-Whitney U检验法,由于此例中两个样本量都大于10,因此不需要使用精确检验法。,6.4 两独立样本非参数检验,6.4.2 Mann-Whitney U检验2.Mann-Whitney U检验的SPSS过程步骤4:结果解释。表6-11分别输出了电暖气月销量在2014年和2015年的样本量、秩平均值和秩和。表6-12中的Z统计量值为-0.231,渐进显著性p值为0.817 0.05,因此我们接受电暖气在2014和2015年度的销量分布来自同一总体的原假设。,6.5 两相关样本非参数检验,6.5.1 两相关样本非参数检验的一般原理两相关样本非参数检验对应于参数检验中的配对样本t检验,只是配对样本假设两样本来自正态分布的总体,而两相关样本非参数检验则用于总体非正态的数据。两相关样本非参数检验同样也是检验两个成对数据的差值的中位数是否与0存在显著性差异。两相关样本非参数检验中,SPSS提供了4种检验方法:Wilcoxon检验、符号检验、McNemar检验和边际同质性检验。,6.5 两相关样本非参数检验,6.5.2 符号检验1.符号检验的原理符号检验是把正负符号作为数据的一种非参数检验程序,适用于检验两个来自不对称分布的配对样本的差异。符号检验以中位数作为集中趋势的量度,其原假设是配对资料差值来自中位数为零的总体。与配对样本t检验的思路类似,符号检验先求出两样本每对数据之差(xi-yi),若原假设成立,则正差值的个数n+和负差值的个数n-应各占一半左右。检验统计量为N= n+ n-, 当样本量较小时(N25),可以精确计算出原假设成立时N的各个取值的精确概率,而样本量较大时,N渐进服从正态分布。这样我们可以根据N 统计量进行假设检验。,6.5 两相关样本非参数检验,6.5.2 符号检验2.符号检验的SPSS过程案例6-5:本章数据“台式电脑销量.sav”是各个企业在各电商平台开设旗舰店前后的同期月销量对比数据。试研究电商平台的使用是否显著增加了这些企业的台式电脑月销量。,6.5 两相关样本非参数检验,6.5.2 符号检验1.符号检验的原理2.符号检验的SPSS过程案例分析:各企业的台式电脑月销量数据不服从正态分布的状态下,样本量少于30,达不到配对样本t检验的条件,为了保证检验的准确性,这时采用非参数检验该类型数据是比较合适的。,6.5 两相关样本非参数检验,2.符号检验的SPSS过程案例分析:各企业的台式电脑月销量数据不服从正态分布的状态下,样本量少于30,达不到配对样本t检验的条件,为了保证检验的准确性,这时采用非参数检验该类型数据是比较合适的。步骤1:打开数据,依次选择【分析(A)】【非参数检验(N)】【旧对话框(L)】【2个相关样本(L)】命令。,6.5 两相关样本非参数检验,2.符号检验的SPSS过程步骤2:单击【2个相关样本(L)】进入其对话框,将变量“电脑月销量_前”和“电脑月销量_后”依次选中置入【检验对】框中,系统默认的是【Wilcoxon】检验法,但是这里重新勾选【符号检验(S)】检验法。如果检验的对数超过1对,也可以一次性进行检验。,6.5 两相关样本非参数检验,2.符号检验的SPSS过程步骤3:由于样本量较小,应精确计算概率。单击对话框右上角的【精确(X)】按钮,在弹出的对话框中勾选【精确(X)】,如图6-30,其余保持SPSS默认值。单击【继续】按钮回到主对话框 。,6.5 两相关样本非参数检验,2.符号检验的SPSS过程步骤4:结果解释。表6-14给出的是“电脑月销量_后”小于“电脑月销量_前”(负差分)的次数(5),“电脑月销量_后”大于“电脑月销量_前”(正差分)的次数(6)。,6.5 两相关样本非参数检验,2.符号检验的SPSS过程步骤4【续】:经检验,表6-15的精确显著性的单双侧p值都是大于0.05,所以接受原假设,即说明电商这种平台的使用并没有显著增加这些企业的台式电脑同期月销量。,小结,本章学习了非参数检验的适用条件以及它和参数检验的区别与联系;非参数检验的具体方法有很多,本章着重讨论了卡方检验、二项检验、Mann-Withney U检验和符号检验的原理,操作步骤和结果解释。,THANK YOU!,