《第4章假设检验非参数假设检验ppt课件.pptx》由会员分享,可在线阅读,更多相关《第4章假设检验非参数假设检验ppt课件.pptx(41页珍藏版)》请在三一办公上搜索。
1、,4.2 参数假设检验,假设检验,一个正态总体均值的假设检验,s未知,1、s已知,2、大样本,3、小样本,两个正态总体均值差的假设检验,总体方差的假设检验,假设检验,5、配对样本,独立样本,两个正态总体均值差的假设检验,1、已知,2、未知 ,大样本,未知s,小样本,3、,4、,假设检验的内容,假设检验,总体均值的假设检验,总体方差的假设检验,两个总体方差比,单一总体,两个总体均值差的假设检验,4.3 非参数假设检验,*4.3.1 符号检验法:通过两个相关样本的每对数据之差的符号进行检验,比较两个样本的显著性配对资料的符号检验样本中位数与总体中位数比较的符号检验*4.3.2 秩和检验法:一种用样
2、本秩来代替样本值的检验法,可用于检验两个总体的分布函数是否相等的问题配对试验资料符号秩和检验非配对试验资料符号秩和检验4.3.3 非参数假设检验。卡方检验柯尔莫哥洛夫-斯米诺夫检验,配对资料的符号检验,提出原假设与备择假设H0:/计算差值并赋予符号d0,记为“”, “”个数记为nd0,记为“”, “”个数记为nd0,记为“0”, “0”个数记为n0统计量K min n , n ,统计推断令n nnKK0.05(n),P0.05,不能否定H0,两个处理差异不显著K0.01(n)KK0.05(n),0.01P0.05,否定H0,接受H1,两个处理差异显著 KK0.01(n),P0.01,否定H0,
3、接受H1,两个处理差异极显著,某数据分析公司研究加薪对数据分析员工作准确度的影响。结果如下表所示,问加薪对工作精确度有没有影响K0.05(15)=3,K0.05(10)=1?,提出原假设与备择假设H0:样本所在的中位数 已知总体的中位数H1:样本所在的中位数已知总体的中位数进行单尾检验,把“”换成“”或者“”计算差值,确定符号及其个数样本各观测值中大于已知总体中位数的,记为“”, “”个数记为n样本各观测值中小于已知总体中位数的,记为“”, “”个数记为n样本各观测值中等于已知总体中位数的,记为“0”, “0”个数记为n0统计量K min n ,n ,样本与总体中位数比较的符号检验,统计推断令
4、n nnKK0.05(n),P0.05,不能否定H0,样本中位数与已知总体中位数差异不显著K0.01(n)KK0.05(n),0.01P0.05,否定H0,接受H1,样本中位数与已知总体中位数差异差异显著 KK0.01(n),P0.01,否定H0,接受H1,样本中位数与已知总体中位数差异差异极显著,配对试验资料符号秩和检验,提出原假设与备择假设H0:差值d总体中位数 0H1:差值d总体中位数0进行单尾检验,把“”换成“”或者“”编秩次,定符号求配对数据的差值d按d的绝对值从小到大编秩次根据原差值正负,在各秩次前标正负号d=0,舍去不记d的绝对值相等,取其平均秩次,确定统计量TT为正秩次及负秩次
5、和中绝对值较小者统计推断令正负差值的总个数为nTT0.05(n),P0.05,不能否定H0,两个处理差异不显著T0.01(n)TT0.05(n),0.01P0.05,否定H0,接受H1,两个处理差异显著 TT0.01(n),P0.01,否定H0,接受H1,两个处理差异极显著,非配对试验资料符号秩和检验,提出原假设与备择假设H0:甲样本所在的总体中位数乙样本所在的总体中位数H1:甲样本所在的总体中位数乙样本所在的总体中位数进行单尾检验,把“”换成“”或者“”求两个样本合并数据的秩次两个样本的含量为n1和n2,合并后为n1 n2合并后的数据按从小到大的顺序排列,序号即为数据的秩次不同样本的观测值相
6、同,取原秩次的平均秩次同一样本的观测值相同,不必改动,确定统计量T秩和较小的样本含量记为n1,秩和为T统计量统计推断T在T0.05(n1) - T0.05(n2n1)之内 ,P0.05,不能否定H0,两个处理差异不显著T在T0.05(n1) - T0.05(n2n1)之内外,在T0.01(n1) - T0.01(n2n1) 之内,0.01P0.05,否定H0,接受H1,两个处理差异差异显著 T在T0.01(n1) - T0.01(n2n1) 之外,P0.01,否定H0,接受H1,两个处理差异差异极显著,卡方分布拟合检验,2检验的原理与方法,2检验的基本原理,2检验统计量的基本形式,2检验的基本
7、步骤,2检验的注意事项,2检验就是统计样本的实际观测值与理论推算值之间的偏离程度。实际观测值与理论推算值之间的偏离程度就决定其2值的大小。理论值与实际值之间偏差越大, 2值就越大,越不符合;偏差越小,2值就越小,越趋于符合;若两值完全相等时,2值就为0,表明理论值完全符合。,876只羔羊性别调察,要回答这个问题,首先需要确定一个统计量,将其用来表示实际观测值与理论值偏离的程度。,判断实际观测值与理论值偏离的程度,最简单的办法是求出实际观测值与理论值的差数。,羔羊性别观察值与理论值,由于差数之和正负相消,并不能反映实际观测值与理论值相差的大小。,0,为了弥补这一不足,可先将实际观测值与理论值的差
8、数平方,即(OE)2,再用差数的平方除以相应的理论值,将之化为相对数,从而来反映(OE)2 的比重,最后将各组求和,这个总和就是2 。,羔羊性别观测值与理论值,2 ,(OiEi)2,Ei,2值就等于各组观测值和理论值差的平方与理论值之比,再求其和。皮尔逊证明了这个样本统计量服从自由度为k-1的卡方分布。,在用 卡方时,若分布类型已知,但其参数未知,这时需要先用极大似然估计法估计参数,然后作检验. (注意,估计了几个参数,就要在相应的卡方估计量的自由度上减去相应的个数),在使用卡方检验时要注意两点:n要足够大,以及npi 不太小这两个条件.,根据计算实践,要求n不小于50,以及npi 都不小于
9、5. 否则应适当合并区间,使npi满足这个要求 .,例题1:自1965年1月1日至1971年2月9日共2231天中,全世界记录到里氏震级4级和4级以上地震共162次, 统计如下:,(X 表示相继两次地震间隔天数, Y 表示出现的频数),试检验相继两次地震间隔天数 X 服从指数分布.,解,所求问题为: 在水平0.05下检验假设,由最大似然估计法得,X 为连续型随机变量,(见下页表),拟合检验计算表,在 H0 为真的前提下,X 的分布函数的估计为,故在水平0.05下接受H0,认为样本服从指数分布.,例2:医学家研究心脏病人猝死人数与日期的关系时发现,一周之中星期一心脏病人猝死者较多,其他日子基本相
10、同。每天的比例近似为2.8:1:1:1:1:1:1. 现在收集到168个观察数据,其中星期一至星期日的死亡人数分别为:55,23,18,11,26,20,15。 现在利用这批数据,推断心脏病人猝死人数与日期的关系是否成立?,解:该问题可以转化为检验心脏病猝死人数在一周时间内的分布是否同预期分布相同,可以使用卡方检验进行处理,过程如下:(1)建立零假设和备择假设 零假设:每天心脏病猝死人数分布同预期分布相同 备择假设:每天心脏病猝死人数分布同预期分布不同,(2)构造和计算统计量,怎么计算得到的呢?,3.2 卡方检验的例题,(3)设定显著性水平和确定否定域,给定显著性水平0.05,在原假设成立时,
11、统计量,服从自由度为7-1=6的卡方分布,否定域为:,3.2 卡方检验的例题,(4)做出统计决策,统计量 =7.752,没有落在否定域,中,接受零假设,零假设:每天心脏病猝死人数分布同预期分布相同,因此,医学家的研究结论是正确的。,K-S检验与KS统计量,一、适用范围Kolmogorov-Smirnov检验常译为柯尔莫哥洛夫-斯米尔诺夫检验,简写为K-S检验,亦称D检验法,也是一种拟合优度检验法。主要用来检验一组样本数据的实际分布是否与某一指定的理论分布相符合。二、基本原理和方法1、基本原理:这种检验主要是将理论分布下的累计频数分布与观察到的累计频数分布相比较,找出它们间最大的差异点,并参照抽
12、样分布,定出这样大的差异是否处于偶然。,K-S检验的步骤,用 Fn(x)表示样本量为n的随机样本观察值的累计分布函数,且Fn(x) =i/n(i是等于或小于x的所有观察结果的数目,i=1,2,n)。F(x)表示理论分布的累计概率分布函数。K-S单样本检验通过样本的累计分布函数Fn(x)和理论分布函数F(x)的比较来做拟合优度检验。检验统计量是F(x)与Fn(x)间的最大偏差Dn: 若对每一个x值来说,Fn(x)与F(x)都十分接近,则表明实际样本的分布函数与理论分布函数的拟合程度很高。,1.建立假设组:H0:Fn(x)=F(x)H1:Fn(x)F(x)2.计算样本累计频率与理论分布累计概率的绝
13、对差,令最大的绝对差为Dn;3.用样本容量n和显著水平a查出临界值Dna;4.通过Dn与Dna的比较做出判断,若DnDna,则认为拟合是满意的。,例:正态拟合。某织布厂的工人产值情况如下表所示,试检验这些样本数据能否作正态拟合?,解:首先,由于做正态拟合的均值、标准差未知,因此,先计算样本均值和标准差,再做正态拟合。通过对样本资料的计算得: =4.85;s=0.352,分别作为均值和的估计值,建立假设:H0:样本数据服从均值为4.85,标准差为0.352的正态分布H1:样本数据不服从均值为4.85,标准差为0.352的正态分布计算资料列如表8-2:,表8-2 正态拟合计算表,根据表8-2中第(5)列数据,取最大绝对差数1000 =0.025作为检验统计量。若取a=0.05,n=1000,从临界值表中查(检验表K-S)得: Dna =0.043。因为1ooo0.043,故认为样本数据所提供的信息无法拒绝H0,即接受H0,认为可做正态分布的拟合。检验法是一种精确分布的方法,不受观察次数多少的限制。这个方法可应用于分组或不分组的情形。,
链接地址:https://www.31ppt.com/p-1360024.html