概率论与数理统计PPT课件第七章正态总体的区间总计.ppt
1,前面,我们讨论了参数的点估计.它是用样本算的一个值去估计未知参数.但是,点估计仅仅给出了未知参数的一个近似值,它没有反映出这种估计的精度.区间估计正好弥补了点估计的这个不足之处.,7.4 正态总体的区间估计,2,可信度:越大越好,估计你的年龄 八成在2128岁之间,被估参数,可信度,范围、区间,区间:越小越好,3,引例 在估计湖中鱼数的问题中,若我们根据一个实际样本,得到鱼数N的最大似然估计为1000条.,实际上,N的真值可能大于1000条,也可能小于1000条.,为此,我们希望确定一个区间来估计参数真值,4,a 使我们能以比较高的可靠程度相信它包含真参数值.,这里所说的“可靠程度”是用概率来度量的,b 区间估计的精度要高.,5,设X1,X2,,Xn为来自总体XF(x;)的一个样本,是未知参数.若对于给定的(0 1),存在两个统计量,使得对任意的 满足,一 置信区间的定义,6,则称随机区间 为参数 的置信水平(confidence level)为1-的置信区间(confidence interval).,置信水平又称为置信度,置信区间的左端点 又称为置信下界,置信区间的右端点 又称为置信上界.,7,8,1.要求 以很大的可能被包含在区间,内,就是说,概率 要尽可能大.,即要求估计尽量可靠.,可靠度与精度是一对矛盾,一般是在保证可靠度的条件下尽可能提高精度.,9,二 构造置信区间的方法,1.枢轴量法,10,(3)利用不等式运算,将不等式,(2)适当选取两个常数a,b,使对给定的,有,等价变形为,11,即,此时参数 的置信水平为1-的置信区间为,12,2.如何确定a,b,我们总是希望置信区间尽可能短.,任意两个数a和b,只要它们的纵标包含f(u)下95%的面积,就确定一个95%的置信区间.,13,在 概率密度为单峰且对称的情形,当a=-b时求得的置信区间的长度为最短.,14,即使 的概率密度不对称的情形,如 分布,F分布,习惯上仍取对称的百分位点来计算未知参数的置信区间.,15,三 正态总体均值与方差的区间估计,16,N(0,1),选 的点估计为,求参数 的置信水平为 的置信区间.,例1 设X1,Xn是取自 的样本,,解:,寻找一个待估参数和估计量的函数,要求其分布为已知.,有了分布,就可以求出Z取值于任意区间的概率.,17,对给定的置信水平,对于给定的置信水平,根据Z的分布,确定一个区间,使得Z取值于该区间的概率为置信水平.,使,18,对给定的置信水平,使,从中解得,19,的一个置信水平为 的置信区间,置信区间的长度为,20,说明:,(2)置信区间的中心是样本均值,(3)置信水平 越大,越大,因此 置信区间越长,(4)样本容量n越大,置信区间越短,置信区间的长度为,(1)L越小,置信区间提供的信息越精确,21,22,因方差未知,则,不是统计量.,想法:用样本均方差 S 代替.,23,于是取,对给定的置信水平,确定分位数,使,即,24,从中解得,25,例2 有一大批糖果.现从中随机的取16袋,称得重量(以克记)如下:,设每袋糖果的重量近似服从正态分布,试求总体均值 的置信水平为0.95的置信区间,506 508 499 503 504 510 497 512,514 505 493 496 506 502 509 496,26,解:这是单总体方差未知,总体均值 的区间估计问题.,根据给出的数据,算得,这里,均值 的置信水平为 的置信区间为,27,均值 的置信水平为0.95 的置信区间为,28,取枢轴量,从中解得,(2)方差 的置信水平为 的置信区间.,29,方差 的置信水平为 的置信区间为,标准差 的置信水平为 的置信区间.,30,例3 求例2中总体标准差 的置信水平 为0.95的置信区间,解:,根据给出的数据,算得,这里,31,标准差 的置信水平为 的置信区间.,代入具体数值算得,32,正态总体参数的置信区间,33,34,35,36,37,38,39,40,因此所求置信区间为,41,由于所得置信区间包含0,实际中,认为采用这两种催化剂所得的得率的均值没有显著差别.,42,43,44,45,46,47,因此所求置信区间为,48,49,50,作业 7.13;7.18;7.19;7.25;,