第四节分布函数的拟合优度检验.ppt
第四节 分布函数的拟合优度检验,前面几节中讨论了总体分布形式已知时关于总体参数的假设检验。但在许多实际问题中并不能预先知道总体分布的形式。这时,就需要根据样本提供的信息,对总体的分布作出假设,并对此假设进行检验。本节我们将介绍由英国统计学家卡尔皮尔逊提出的 拟合优度检验法。,拟合优度检验法的基本原理和步骤:,1.提出原假设,H0:总体 X 的分布函数为F(x),备择假设H1:,总体 X 的分布函不是F(x),(1)备择假设可以不必写出.,(2)若X是离散型总体,原假设相当于:,H0:总体 X 的分布律为:PX=xi=pi,i=1,2,若X是连续型总体,原假设相当于:,H0:总体 X 的概率密度为f(x).,说明:,(3)若在原假设 H0下,总体分布的形式已知,但有r 个参数未知,这时需要用极大似然估计法先估计这 r 个参数.,2.将 x 轴分成K个互不重迭的小区间:,3.计算样本的n个观察值落入以上每个区间的个数,记为fi(i=1,2,K),称其为实际频数.所有实际频数之和 f1+f2+fk 等于样本容量n.,4.在原假设H0为真时,计算总体落入每个区间的概率Pi=F(bi)-F(bi-1)(i=1,2,K),于是npi就是落入第i个区间的样本值的理论频数.,反映了实际频数与理论频数的差异.,当原假设H0为真,样本容量又充分大时,两者,并证明了如下定理:,的差异应不会太大,皮尔逊由此引进统计量:,定理(皮尔逊)若 n 充分大,H0为真时,不论 H0中的分布属于什么类型,统计量,总是近似服从自由度为K-r-1的 分布,即,其中r是分布中被估计的参数的个数.,由此得,5.检验统计量:,拒绝域:,要适当合并区间以满足这个要求。,拟合优度检验法是在n充分大的条件下得到,的,所以在使用时必须注意 n要足够大及 npi不能太小,,根据实际经验,要求 n 50,理论频数npi 4,否则,注:,例1.某个城市在某一时期内共发生交通事故600次,按不同颜色小汽车分类如下,如果交通事故的发生与汽车的颜色无关,则每种颜色的小汽车发生交通事故的可能性是一样的.,问:交通事故是否与汽车的颜色有关?,分析:,解:,原假设,检验统计量:,拒绝域:,列表计算,红棕黄白灰蓝,n=600,-25,25,30,-20,35,15,751257080135115,1/61/6 1/61/61/61/6,100100100100100100,6.25,6.25,9,4,12.25,2.25,40,所以拒绝H0,认为交通事故与汽车的颜色有关.,因为,例2.某电话交换台,在100分钟内记录了每分钟被呼唤的次数X,设f i为出现该 X值的频数,结果如下:,问总体X(电话交换台每分钟呼唤次数)服从泊松分布吗?,解:,按题意,原假设,由于未知,首先须用极大似然估计法,求得的估计值(看七章二节例5):,检验统计量:,拒绝域:,列表计算:,12345678,n=100,7121817201367,1.3099,-0.02-0.340.18-2.293.300.95-1.46-0.32,0.00006 0.0094 0.0018 0.27190.65210.0749 0.2857 0.0140,7.0212.3417.82 19.2916.7012.05 7.467.32,0.07020.12340.1782 0.19290.16700.1205 0.07460.0732,因为,所以接受H0,,认为电话交换台每分钟呼唤次数X 服从泊松分布.,说明:,将n=0和n=1合并,n=8与n9合并是为了,保证理论频数npi 4.,例3.为了研究患某种疾病的2159岁男子的血压(收缩压,单位:mm-Hg)这一总体X,抽查了100个男子,得,样本值分组如下:,取=0.10,检验2159岁男子的血压(收缩压)总体X是否服从正态分布。,解:,按题意,原假设,由于,2未知,首先须用极大似然估计法,求得其估计值(看教科书七章二节例2):,检验统计量:,拒绝域:,列表计算:,H0为真时,,列表计算:,12345678,n=100,58222717957,(,99.5)99.5,109.5)109.5,119.5)119.5,129.5)129.5,139.5)139.5,149.5)149.5,159.5)159.5,),0.06550.10560.17720.22310.19890.13290.06610.0307,6.5510.5617.7222.3119.8913.296.613.07,-1.55-2.564.284.69-2.89-4.292.32,0.36680.62061.03380.98590.41991.38480.5560,5.3678,因为,所以接受H0,,即2159岁男子的血压(收缩压)总体X服从正态分布。,