SPSS的非参数检验讲解课件.ppt
《SPSS的非参数检验讲解课件.ppt》由会员分享,可在线阅读,更多相关《SPSS的非参数检验讲解课件.ppt(94页珍藏版)》请在三一办公上搜索。
1、SPSS的非参数检验,在实践中我们常常会遇到一些问题的总体分布并不明确,或者总体参数的假设条件不成立,不能使用参数检验。这一类问题的检验应该采用统计学中的另一类方法,即非参数检验。,SPSS 中进行非参数检验由【Analyze(分析)】菜单中的【Nonparametric Tests(非参数检验)】菜单项导出。其中包括以下命令。 Chi-square test: 卡方检验。 Binomial test: 二项分布检验。 Runs test: 游程检验。 1-Simple K-S test: 单样本K-S检验。 2 Independent Sample test: 两个独立样本非参数检验。 K
2、Independent Samples test: 多个独立样本非参数检验。 2 Related Sample test: 两个相关样本非参数检验。 K Related Sample test: 多个相关样本非参数检验。,1 非参数检验概述,1.1 非参数检验的提出 非参数检验是不依赖总体分布的统计推断方法。它是指在总体不服从正态分布且分布情况不明时,用来检验数据资料是否来自同一个总体假设的一类检验方法。由于这些方法一般不涉及总体参数而得名。这类方法的假定前提比参数假设检验方法少得多,也容易满足,适用于计量信息较弱的资料且计算方法也简便易行,所以在实际中有广泛的应用。,1.2 非参数检验的特点
3、,和参数方法相比,非参数检验方法的优势如下: (1)稳健性。因为对总体分布的约束条件大大放宽,不至于因为对统计中的假设过分理想化而无法切合实际情况,从而对个别偏离较大的数据不至于太敏感。 (2)对数据的测量尺度无约束,对数据的要求也不严格,什么数据类型都可以做。 (3)适用于小样本、无分布样本、数据污染样本、混杂样本等。,表6-1 参数检验和非参数检验的效率比较,2 SPSS在卡方检验中的应用,1.使用目的 卡方检验(Chi-Squar Test)也称为卡方拟合优度检验,是K.Pearson给出的一种最常用的非参数检验方法。它用于检验观测数据是否与某种概率分布的理论数值相符合,进而推断观测数据
4、是否是来自于该分布的样本的问题。 2.基本原理 进行卡方检验时,首先提出零假设 :样本X来自的总体分布服从期望分布或某一理论分布。接着,利用实际观测值的频数与理论的期望频数之间的差异来构造检验统计量,它描述了观察值和理论值之间的偏离程度。 3.软件使用方法 SPSS会自动计算出2统计量及对应的相伴概率P值。,2.2 卡方检验的SPSS操作详解,Step01:打开主菜单 选择菜单栏中的【Analyze(分析)】 【Nonparametric Tests(非参数检验)】【Legacy Dialogs(旧对话框)】【Chi-Square(卡方)】命令,弹出【Chi-Square Test(卡方检验)
5、】对话框。,Step02:选择检验变量 在【Chi-Square Test(卡方检验)】对话框左侧的候选变量列表框中选择一个或几个变量,将其添加至【Test Variable List(检验变量列表)】列表框中,表示需要进行进行卡方检验的变量。Step03:确定检验范围 在【Expected Range(期望全距)】选项组中可以确定检验值的范围,对应有两个单选项。Step04:选择期望值 在【Expected Values(期望值)】选项组中可以指定期望值 ,对应有两个单选项。,Step05:选择计算精确概率 单击【Exact】按钮,弹出【Exact Tests(精确检验)】对话框,该对话框用
6、于选择计算概率P值的方法 。,Step06:其他选项选择 单击【Options】按钮,弹出【Options(选项)】对话框,该对话框用于指定输出内容和关于缺失值的处理方法.,Step07单击【OK】按钮,结束操作,SPSS软件自动输出结果。,3 SPSS在二项分布检验中的应用,3.1 二项分布检验的基本原理1.方法概述事件要服从二项分布,则应该具备下列基本的条件。(1)各观察单位只能具有相互对立的一种结果。(2)已知发生某一结果(阳性)的概率为,其对立结果的概率为1-。(3)n次试验在相同条件下进行,且各个观察单位的观察结果相互独立,即每个观察单位的观察结果不会影响到其他观察单位的结果。,应用
7、如:生与死、患病有无、是否吸烟等,都是进行n次试验,出现两类(0或1)的情况。,2.软件使用方法 SPSS二项分布检验过程是推断总体的分布是否等于指定的某个二项分布。其假设检验过程如下。 H0:样本来自的总体与某个指定的二项分布无显著性差异。 H1:样本来自的总体与某个指定的二项分布有显著性差异。 SPSS会自动计算出二项分布检验相应的检验统计量及对应的概率P值。如果概率P值小于或等于用户设定的显著性水平,则拒绝零假设,认为总体与某个指定的二项分布有显著性差异;相反的,如果概率P值大于显著性水平,则接受零假设。 需要注意的是,二项分布检验过程要求变量必须是数值型的二元变量(只取两个可能值的变量
8、)。假如变量是字符型的,可以使用重编码功能将其转化为数值型变量;假如变量不是二元变量,需要设置断点将数据分为两个部分,将大于断点值的归为一组,其余归为另一组。,3.2 二项分布检验的SPSS操作详解,Step01:打开主菜单 选择菜单栏中的【Analyze(分析)】 【Nonparametric Tests(非参数检验)】【Legacy Dialogs(旧对话框)】【Binomial(二项式)】命令 ,弹出【Binomial Test(二项式检验)】对话框。,Step02:选择检验变量 在【Binomial Test(二项式检验)】对话框左侧的候选变量列表框中选择一个或几个变量,将其添加至【T
9、est Variable List(检验变量列表)】列表框中,表示需要进行进行二项分布检验的变量。Step03:定义二元变量 在【Define Dichotomy(定义二分法)】选项组中可以定义二元变量。 Step04:指定检验概率值 在【Test Proportion(检验比例)】选项组中可以指定二项分布的检验概率值。系统默认的检验概率值是0.5,这意味着要检验的二项是服从均匀分布的。如果所要检验的二项分布不是同概率分布,参数框中要键入第一组变量所对应的检验概率值。,Step05:选择计算精确概率 【Exact】按钮用于选择计算概率P值的方法。Step06:其他选项选择 【Options】按
10、钮用于指定输出内容和关于缺失值的处理方法。Step07:单击【OK】按钮,结束操作,SPSS软件自动输出结果。,3.3 实例图文分析:灯泡是否合格,练习: 某灯泡厂生产的一种特制灯泡按照工艺技术标准的要求,其合格灯泡的寿命必须大于960小时。通常在生产稳定的时候,该厂的这种产品合格品率为95,为检验产品质量,今从新生产的一大批产品中随机抽查了30只灯泡,测得它们的寿命的数据资料,试根据这些样品数据检验该批产品的合格率是否等于95。,2. 实例操作,Step01:打开对话框 打开数据文件6-2.sav,选择菜单栏中的【Analyze(分析)】 【Nonparametric Tests(非参数检验
11、)】【Legacy Dialogs(旧对话框)】【Binomial(二项式)】命令,弹出【Binomial Test(二项式检验)】对话框。,Step02:选择检验变量 在左侧的候选变量列表框中选择“time”变量作为检验变量,将其添加至【Test Variable List(检验变量列表)】列表框中。,Step03:定义二元变量 在【Define Dichotomy(定义二分法)】选项组中点选 【Cut point(割点)】,以指定断点。接着在其文本框中输入“960”,表示以它作为分界点将原始样本分为两组。Step04:指定检验概率值 在【Test Proportion(检验比例)】文本框中
12、输入指定概率值“0.05”。,Step05:描述性统计量输出 单击【Options】按钮,弹出【Options(选项)】对话框。在【Statistics(统计量)】选项组中勾选【Descriptive(描述性)】和【Quartiles(四分位数)】复选框,表示输出基本统计量。再单击【Continue】按钮,返回【Binomial Test(二项式检验)】对话框。,Step06:完成操作 最后,单击【OK(确定)】按钮,操作完成。,3. 实例结果及分析,(1)基本统计量 SPSS首先输出了样本的描述性统计量表。这里共选择了30个灯泡寿命样本作二项分布检验,灯泡的平均寿命等于989.13小时,标准
13、差等于40.968小时,灯泡寿命最小值等于947小时,寿命最大值等于1084小时。同时其25、50和75分位点等于 962.75、969.50和9975小时。,(2)二项分布检验表 首先根据断点“960”将原始数据划分为两部分:“Group 1” 和“Group 2”,它们各自的样本容量等于6和24,所占总体的比例为20和80。由于这里要检验合格率是否等于95,也就是要检验“Group 1”组所占比例是否等于0.05。但根据单尾概率P值(0.003)小于显著性水平 (0.05),可以判断这批样本的合格率不等于95,即这批产品没有合格。,4 SPSS在游程检验中的应用,4.1 游程检验的基本原理
14、1.方法概述 游程检验是一种利用游程数所作的单样本随机性的检验方法,它可以用来判断观察值的顺序是否为随机。许多统计模型的假设中都要求观察值都是独立的,也就是说,收集到的数据样本的顺序是不相关的。如果样本顺序影响到统计结果,那么样本就可能不是随机的,这将使研究者不能得出关于抽样总体的准确结论。因此,研究者可以使用游程检验来检验数据的随机性。,2.基本原理 游程检验可用来检验任何序列的随机性,而不管这个序列是怎样产生的;此外还可用来判断两个总体的分布是否相同,从而检验出它们的位置中心有无显著差异。3.软件使用方法 SPSS中利用游程数构造Z统计量,利用Z统计量的分布来检验序列是否具有随机性。软件将
15、自动计算出Z统计量的取值及对应的概率P值。如果概率P值小于或等于用户设定的显著性水平,则拒绝零假设,认为变量不具有随机性;相反的,如果概率P值大于显著性水平,则认为变量出现是随机的。,4.2 游程检验的SPSS操作详解,Step01:打开对话框 选择菜单栏中的【Analyze(分析)】 【Nonparametric Tests(非参数检验)】【Legacy Dialogs(旧对话框)】【Runs(游程)】命令,弹出【Runs Test(游程检验)】对话框。,Step02:选择检验变量 在【Runs Test(游程检验)】对话框左侧的候选变量列表框中选择一个或几个变量,将其添加至【Test Va
16、riable List(检验变量列表)】列表框中,表示需要进行游程检验的变量。 Step03:确定断点 在【Cut point(割点)】选项组中指定计算游程数的分界值。小于分界值的观察值归为一组,其余的归为另一组,然后计算游程数。,Step04:选择计算精确概率 【Exact】按钮用于选择计算概率P值的方法,它的功能和卡方检验中的相应按钮相同的。Step05:其他选项选择 【Options】按钮用于指定输出内容和关于缺失值的处理方法。Step06:单击【OK】按钮,结束操作,SPSS软件自动输出结果。,4.3 实例图文分析:企业盈亏预测,练习:已知某企业在过去20年的盈亏情况为“0 0 0 0
17、 1 1 1 1 1 1 1 0 0 0 1 1 1 1 1 1”。其中“0”表示亏损,“1”表示盈利。现根据财务统计预测今年该企业盈利,请问这个结果对企业明年的经营状况有无影响?2. 实例操作 根据过去20年的经营情况看到该企业的盈亏情况经常逐年发生变化。已知今年企业盈利,要判断明年企业的盈亏状态,其实就是要分析今年企业的盈利是否会对明年它的盈亏带来一定的影响。也就是说,要判断不同年份之间的盈亏情况有无影响性,即盈亏情况是否是随机的。这样就可以通过游程检验来分析历史数据。如果历史数据是随机的,说明今年的盈利不会对明年企业的生产产生影响;反之,表明今年的盈利会对明年生产有影响。所以采用SPSS
18、具体操作步骤如下。,Step01:打开对话框,打开数据文件6-3.sav,选择菜单栏中的【Analyze(分析)】 【Nonparametric Tests(非参数检验)】【Legacy Dialogs(旧对话框)】【Runs Test(游程检验)】命令,弹出【Runs Test(游程检验)】对话框。其中“x”变量表示企业盈亏状态,“0”表示亏损,“1”表示盈利。,Step02:选择检验变量 在候选变量列表框中选择“x”变量作为检验变量,将其添加至【Test Variable List(检验变量列表)】列表框中。Step03:确定断点 在【Cut point(割点)】选项组中取消勾选【Medi
19、an(中位数)】复选框,勾选【Mean(均值)】复选框。,Step04:完成操作,最后,单击【OK(确定)】按钮,操作完成。,3 .实例结果及分析,首先“Test Value0.65”表示游程检验以0.65作为断点将原始数据分为两组。在过去20年中,企业亏损的年份数共有7年,而在剩下的13年里该企业都是盈利的。整个历史数据的游程数等于4。接着计算游程检验的Z统计量等于-2.843,相伴概率P值0.004显然小于显著性水平0.05。所以,认为企业盈亏历史数据并不是随机的,其中有一定的规律性。因此,今年企业的盈利会对明年企业的经营状况产生显著影响。,5 SPSS在单样本K-S检验中的应用,5.1
20、单样本K-S检验的基本原理1.方法概述 K-S检验是以两位前苏联数学家柯尔莫哥(Kolmogorov)和斯米诺夫(Smirnov)命名的,是一种拟和优度的非参数检验方法。单样本K-S检验是利用样本数据推断总体是否服从某一理论分布,一般来说它是比卡方检验更精确的非参数检验法。,2.基本原理 K-S检验的理论分布可以为正态分布、均匀分布、指数分布和泊松分布等。其零假设是:样本来自的总体与指定的理论分布无显著差异。它的基本思想是:根据样本数据和用户的指定构造出理论分布,查分布表得到相应的理论累计概率分布函数F0(x);利用样本数据计算各样本数据点的累计概率,得到经验累计概率分布函数S0(x);计算S
21、0(x)和F0(x)在相同变量值点x上的差D(x),得到差值序列D。单样本K-S检验主要对差值D序列进行研究。3.软件使用方法 SPSS将自动计算K-S检验中的Z统计量,依据K-S分布表(小样本)或正态分布表(大样本)给出相应的相伴概率P值。如果P值小于或等于用户指定的显著性水平,则拒绝原假设H0;反之,不能拒绝H0,可以认为样本来自的总体与指定的分布无显著差异。,5.2 单样本K-S检验的SPSS操作详解,Step01:打开对话框 选择菜单栏中的【Analyze(分析)】【Nonparametric Tests(非参数检验)】【Legacy Dialogs(旧对话框)】【1-samples
22、K-S(1样本K-S(1)】命令,弹出 【One-Sample K-S Test(单样本K-S检验)】对话框,这是K-S检验的主操作窗口。,Step02:选择检验变量 在【One-Sample Kolmogorov-Smirnov Test(单样本K-S检验)】对话框左侧的候选变量列表框中选择一个或几个变量,将其添加至【Test Variable List(检验变量列表)】列表框中,表示需要进行K-S检验的变量。Step03:选择待检验理论分布 在【Test Distribution(检验分布)】选项组中,用户需要选择待检验的理论分布。系统提供了四种统计中常见的分布。,Step04:选择计算精
23、确概率 【Exact】按钮用于选择计算概率P值的方法,它的功能和卡方检验中相关按钮是相同的。Step05:其他选项选择 【Options】按钮用于指定输出内容和关于缺失值的处理方法。Step06:单击【OK】按钮,结束操作,SPSS软件自动输出结果。,6 SPSS在两独立样本非参数检验中的应用,1 两独立样本非参数检验的方法原理1.方法概述 两独立样本的非参数检验是在对总体分布不甚了解的情况下,通过分析样本数据,推断样本来自的两个独立总体的分布是否存在显著差异。这种检验方法一般通过独立总体的均值或中位数是否存在显著差异来推断。关于样本之间是否独立,主要看在一个总体中抽取样本对在另一个总体中抽取
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 参数 检验 讲解 课件

链接地址:https://www.31ppt.com/p-1481523.html