《非参数假设检验》PPT课件.ppt
1 非正态总体参数的假设检验,设总体 X 服从参数为 p 的(01)分布,即,1(01)分布参数的假设检验,由于,因此由中心极限定理可知,当,成立且样本容量,n充分大时,统计量,服从标准正态分布N(0,1).,=该假设检验问题的拒绝域为,近似地,例1 某种产品在通常情况下次品率为5%.现在从生产出的一批产品中随机地抽取50件进行检验,发现有4件次品.问能否认为这批产品的次品率为5%?(=0.05),解 设这批产品的次品率为 p.,在这批产品中任,任意取一件产品,定义随机变量 X 如下,检验假设,该假设检验问题的拒绝域为,现在,统计量U的值为,=接受假设,=可以认为这批产品的次品率为5%,2.总体均值的假设检验,假设总体X 的均值为,方差为,为 X 的样本,检验假设,由中心极限定理知,当样本容量n充分大时,,近似地服从标准正态分布N(0,1),由于样本方差,为,的无偏估计量,,且样本容量n充分大时,统计量,仍近似地服从标准正态分布N(0,1),=该假设检验问题的拒绝域为,例2 某电器元件的平均电阻一直保持在2.64.改变加工工艺后,测得100个元件的电阻,计算得平均电阻为 2.58,样本标准差为0.04.在显著性水平=0.05下,判断新工艺对此元件的平均电阻有无显著影响.,解 设该电器元件的电阻为X,其均值为,检验假设,拒绝域为,现在,统计量U的值为,=拒绝假设,接受假设,=新工艺对电子元件的平均电阻有显著影响.,3.两个总体均值的假设检验,设总体,和,相互独立,,的样本,是,是 Y 的样本.记,设总体 X的均值为,,方差为,总体 Y的均值为,,方差为,的拒绝域.,由中心极限定理知,当样本容量,和,都充分大时,,近似地服从标准正态分布,由于样本方差,和,分别为,和,的无偏估计量,因此,可以,分别用,和,近似代替,和,,并且当,求假设检验问题,和,近似地服从标准正态分布,,从而当原假设,成立时,,统计量,仍近似地服从标准正态分布.,都充分大时,,统计量U的值应该在零附近摆动,,当,过大时就认为,不成立.,=该假设检验问题的拒绝域为,例3 两台机床加工同一中轴承,现在从他们加工的轴承中分别随机地抽取200根和100根,测量其椭圆度(单位:mm),经计算得,能否认为这两台机床加工的轴承的平均椭圆度是相同的(=0.05),解设这两台机床加工的轴承的椭圆度分别为X,Y,且,检验假设,由于题目给出的两个样本都是大样本,因此该假设检验问题的拒绝域为,现在,=拒绝原假设,即认为这两台机床加工的,轴承的平均椭圆度是不相同的.,2 分布拟合检验,设总体X的实际分布函数为F(x),它是未知的.,为来自总体 X的样本.,根据这个样本来检验总体X的分布函数F(x),是否等于某个给定的分布函数 F0(x),即检验假设,:,注意:若总体 X 为离散型的,则,相当于,总体 X 的分布律为,若总体 X 为连续型的,则,相当于总体 X 的,概率密度为 f(x).,(1)若,中,的分布函数,不含未知参数.,两两互不相交的子集,=在n次试验中,事件 Ai发生的频率为 fi/n,另一方面,当H0为真时,可以根据H0所假设的 X 的分,布函数来计算,选取统计量,来度量样本与H0中所假设的分布的吻合程度,hi是给定的常数。,如果选取,则上述统计量变成,定理1(皮尔逊)当H0为真且n充分大时,统计量,近似服从,分布.,由定理1,若给定显著性水平,则前述假设检验问题的拒绝域为,(2)若H0中X 的的分布函数含有未知参数.,此时,首先在假设下利用样本求出未知参数的最大似然估计,以估计值作为参数值,然后再根据 H0中所假设的 X 的分布函数 F(x)求出 pi的估计值,并在,为真且,充分大时,统计量,定理2(皮尔逊)当,近似服从,分布,其中r是 X的分布函数,F(x)包含的未知参数的个数.,若给定显著性水平,则前述假设检验问题的拒绝域为,注意:运用,检验法检验总体分布,把样本数据进,(1)大样本,通常取,(2)要求各组的理论频数,或,(3)一般数据分成7到14组.有时为了保证各组,行分类时,组数可以少于7组,例1 孟德尔在著名的豌豆杂交实验中,用结黄色圆形种子与结绿色皱形种子的纯种豌豆作为亲本进行杂交,将子一代进行自交得到子二代共556株豌豆,发现其中有四种类型植株,(黄圆)(黄皱)(绿圆)(绿皱),总计,315株,101株 108株,32株 556株,试问这些植株是否符合孟德尔所提出的,的理论比例,解 检验假设,由,由n=556,得,而,计算得,由=0.05,自由度,查,分布表得,=在=0.05下接受,=这些植株是符合孟德尔所提出的,的理论比例,例2 某农科站为了考察某种大麦穗长的分布情况,在一块实验地里随机抽取了100个麦穗测量其长度,得到数据如下(单位:cm),6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.6 5.8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.8 6.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.56.8 6.0 6.3 5.5 5.0 6.3 5.2 6.0 7.0 6.4 6.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.7 7.46.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.65.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.05.5 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.7 5.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.0 5.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3,试检验大麦穗长是否服从正态分布?(=0.05),解 检验假设,X的概率密度为,是未知的,所以应首先估计,的最大似然估计为,把X可能取值的全体,划分为,k=12个互不重叠的小区间:,=大麦穗长的频数、频率分布表,频率,频数,累计频率,0.09,1115281311,0.110.150.280.130.11,0.200.350.630.760.87,1.00,100,1.00,由,由此可计算,若,则,的值见下表,的计算表,由 k=7,r=2,得自由度 k-r-1=4,查表得,而,=接受原假设,即在检验水平=0.05下,下可认为大麦的穗长服从正态分布,Thank you,