大学数学概率统计非参数假设检验.ppt
7.4 非参数假设检验,分布拟合优度检验,概率图纸法,2-拟合优度检验,柯尔莫洛夫-斯米尔诺夫检验,7-4-1 概率图纸法,1.正态概率图纸的构造原理,设总体有分布函数 F(x),N(,2)表示正态颁布族,需要检验假设,(7-4-1),在原假设 H0 为真时,通过中心化变换,即,而函数 u(x)是 x 的线性函数,,在(x,u(x)直角坐标平面上是一条直线,这条直线过点(,0),且斜率为 1/,图 7-1,2.检验步骤,由格里汶科定理知道子样的经验分布函数Fn(x)依概率收敛于总体分布函数 F(x)。因此若,为真,则点(xi,Fn(xi),i=1,2,n 在正态概率图纸上也应该近似地在一条直线附近。根据上述想法,用正态概率图纸检验假设 H0的具体步骤如下:,1)整理数据:把样本观察值按大小排列。假如 n 次观察值中有 m 个不同的值,则按大小次序列入下表。,由于(x(m),1)在正态概率图纸上无法标出,不少统计学家建议对 Fn 的值作如下两种修正:,这种修正对小样本是必要的;,2)描点:把点(x(k),Fn(x(k)描在正态概率图纸上;,(7-4-2),3)目测这些点的位置,若这一列点挖地在一条直线附近,我们就可以接受原假设,否则就拒绝原假设。,3.未知参数与2的估计,若通过概率图纸检验已经知道总体服从正态分布,我们就凭目测在概率图纸上画出最靠近各点(x(i),Fn(x(i),i=1,n 的一条直线 l。在概率图纸上画一条 F=0.5 的水平直线,这条直线与直线 l 的交点的横坐标 x 0.5 就可作为参数的估计。,其次,我们还可用 x 0.8413 x 0.5 来估计,例7-4-1 参见P336。,7-4-2 2 拟合检验法,设总体的分布函数为具有明确表达式的 F(x),我们把随机变量的值域 R 分成 k 个互不相容的区间 A1=a0,a1),A2=a1,a2),Ak=a k-1,ak,这些区间不一定有相同的长度,设 是容量为 n 的样本观测值,ni 为样本观测值 中落入 Ai 的频数。则在 n 次试验中事件 Ai 出现的频率为,我们现在检验原假设 H0:F(x)=F0(x).,设在原假设 H0 成立下,总体落入 Ai 的概率为 pi,即,此时,n 个观测值中,恰有 n1 个观测值落入 A1 由,n2 个观测值落入 A2 内,,nk 个观测值落入 Ak 内的概率应为,这是一个多项分布。,由大数定律,在 H0 为真时,频率 ni/n 与概率 pi 的差异不应太大。根据这个思想,Person 构造了一个统计量,(7-4-3),(7-4-4),定理 7-4-1:当 H0 为真时,即,为总体的真实概率时,由(8-3-4)式所定义的统计量的渐近分布是自由度为 k-1 的2-分布,即其密度函数为,(7-4-5),如果原假设 H0 只确定总体分布的类型,而分布中还含有未知参数,,m,则下面的 Fisher 定理解决了含未知参数情形的分布检验问题。,(7-4-6),则有下面的统计量,(7-4-7),例7-4-2 参见P343。,Person 2拟合优度检验的步骤:,1)把总体的值域划分为 k 个互不相交的区间 ai,a i+1),i=1,k,其中 a1,ak+1 可以分别取-,+;(每个划分的区间必须包含不少于5个个体,若个体数少于5个时,则可指导这种区间并入其相邻的区间,或者把几个频数都小于5,但不一定相邻的区间并成一个区间)。,2)在H0成立下,用极大似然估计法估计分布所含的未知参数;,3)在H0成立下,计算理论概率,并且算出理论频数 npi;,4)按照样本观察值 落在区间 ai,ai+1)中的个数,即实际频数 ni,i=1,k,计算,5)按照所给出的显著性水平,查自由度为k-m-1 的2-分布表得,6)若,则拒绝原假设H0,否则认为原假设成立。,这里 m 是未知参数的个数;,