统计学区间估计详细讲解.ppt
《统计学区间估计详细讲解.ppt》由会员分享,可在线阅读,更多相关《统计学区间估计详细讲解.ppt(64页珍藏版)》请在三一办公上搜索。
1、第八章 区间估计,STAT,一家食品生产企业以生产袋装食品为主,每天的产量约为8000袋左右。按规定每袋的重量应不低于100克,否则即为不合格。为对产量质量进行检测,企业设有质量检查科专门负责质量检验,并经常向企业高层领导提交质检报告。质检的内容之一就是每袋重量是否符合要求。由于产品的数量大,进行全面的检验是不可能的,可行的办法是抽样,然后用样本数据估计平均每袋的重量。质检科从某天生产的一批食品中随机抽取了25袋,下表1是对每袋食品重量的检验结果。,实践中的统计,STAT,根据表1的数据,质检科估计出该天生产的食品每袋的平均重量在101.38109.34克之间,其中,估计的可信程度为95%,估
2、计误差不超过4克。产品的合格率在96.07%73.93%之间,其中,估计的可信程度为95%,估计误差不超过16%。,STAT,质检报告提交后,企业高层领导人提出几点意见:一是抽取的样本大小是否合适?能不能用一个更大的样本进行估计?二是能否将估计的误差在缩小一点?比如,估计平均重量时估计误差不超过3克,估计合格率时误差不超过10%。三是总体平均重量的方差是多少?因为方差的大小说明了生产过程的稳定性,过大或过小的方差都意味着应对生产过程进行调整。,STAT,本章重点1、抽样误差的概率表述;2、区间估计的基本原理;3、小样本下的总体参数估计方法;4、样本容量的确定方法;本章难点1、一般正态分布标准正
3、态分布;2、t分布;3、区间估计的原理;4、分层抽样、整群抽样中总方差的分解。,STAT,点估计的缺点:不能反映估计的误差和精确程度区间估计:利用样本统计量和抽样分布估计总体参数的可能区间【例1】CJW公司是一家专营体育设备和附件的公司,为了监控公司的服务质量,CJW公司每月都要随即的抽取一个顾客样本进行调查以了解顾客的满意分数。根据以往的调查,满意分数的标准差稳定在20分左右。最近一次对100名顾客的抽样显示,满意分数的样本均值为82分,试建立总体满意分数的区间。抽样误差抽样误差:一个无偏估计与其对应的总体参数之差的绝对值。抽样误差=(实际未知),8.1总体均值的区间估计(大样本n30),S
4、TAT,要进行区间估计,关键是将抽样误差 求解。若 已知,则区间可表示为:此时,可以利用样本均值的抽样分布对抽样误差的大小进行描述。上例中,已知,样本容量n=100,总体标准差,根据中心极限定理可知,此时样本均值服从均值为,标准差为 的正态分布。即:,STAT,抽样误差的概率表述 由概率论可知,服从标准正态分布,即,有以下关系式成立:一般称,为置信度,可靠程度等,反映估计结果的可信程度。若事先给定一个置信度,则可根据标准正态分布找到其对应的临界值。进而计算抽样误差,STAT,若,则查标准正态分布表可得,抽样误差 此时抽样误差的意义可表述为:以样本均值为中心的3.92的区间包含总体均值的概率是9
5、5%,或者说,样本均值产生的抽样误差是3.92或更小的概率是0.95。常用的置信度还有90%,95.45%,99.73%,他们对应的临界值分别为1.645,2和3,可以分别反映各自的估计区间所对应的精确程度和把握程度。,STAT,计算区间估计:在CJW公司的例子中,样本均值产生的抽样误差是3.92或更小的概率是0.95。因此,可以构建总体均值的区间为,由于,从一个总体中抽取到的样本具有随机性,在一次偶然的抽样中,根据样本均值计算所的区间并不总是可以包含总体均值,它是与一定的概率相联系的。如下图所示:,STAT,3.92,3.92,图1 根据选择的在、位置的样本均值建立的区间,STAT,上图中,
6、有95%的样本均值落在阴影部分,这个区域的样本均值3.92的区间能够包含总体均值。因此,总体均值的区间的含义为,我们有95%的把握认为,以样本均值为中心的3.92的区间能够包含总体均值。通常,称该区间为置信区间,其对应的置信水平为 置信区间的估计包含两个部分:点估计和描述估计精确度的正负值。也将正负值称为误差边际或极限误差,反映样本估计量与总体参数之间的最大误差范围。总结:,STAT,计算区间估计:在大多数的情况下,总体的标准差都是未知的。根据抽样分布定理,在大样本的情况下,可用样本的标准差s作为总体标准差的点估计值,仍然采用上述区间估计的方法进行总体参数的估计。,STAT,【例2】斯泰特怀特
7、保险公司每年都需对人寿保险单进行审查,现公司抽取36个寿保人作为一个简单随即样本,得到关于、投保人年龄、保费数量、保险单的现金值、残废补偿选择等项目的资料。为了便于研究,某位经理要求了解寿险投保人总体平均年龄的90%的区间估计。,STAT,上表是一个由36个投保人组成的简单随机样本的年龄数据。现求总体的平均年龄的区间估计。分析:区间估计包括两个部分点估计和误差边际,只需分别求出即可到的总体的区间估计。解:已知(1)样本的平均年龄(2)误差边际,STAT,样本标准差误差边际(3)90%的置信区间为39.5 2.13 即(37.37,41.63)岁。注意(1)置信系数一般在抽样之前确定,根据样本所
8、建立的区间能包含总体参数的概率为(2)置信区间的长度(准确度)在置信度一定的情况下,与样本容量的大小呈反方向变动,若要提高估计准确度,可以扩大样本容量来达到。,STAT,8.2总体均值的区间估计:小样本的情况在小样本的情况下,样本均值的抽样分布依赖于总体的抽样分布。我们讨论总体服从正态分布的情况。t分布的图形和标准正态分布的图形类似,如下图示:,STAT,0,标准正态分布,t分布(自由度为20),t分布(自由度为10),图2标准正态分布与t分布的比较,STAT,在分布中,对于给定的置信度,同样可以通过查表找到其对应的临界值,利用临界值也可计算区间估计的误差边际因此,总体均值的区间估计在总体标准
9、差未知的小样本情况下可采用下式进行:假定总体服从正态分布;,STAT,【例3】谢尔工业公司拟采用一项计算机辅助程序来培训公司的维修支援掌握及其维修的操作,以减少培训工人所需要的时间。为了评价这种培训方法,生产经理需要对这种程序所需要的平均时间进行估计。以下是利用新方对名职员进行培训的培训天数资料。根据上述资料建立置信度为的总体均值的区间估计。(假定培训时间总体服从正态分布)。,STAT,解:依题意,总体服从正态分布,(小样本),此时总体方差未知。可用自由度为(n-1)=14的t分布进行总体均值的区间估计。样本平均数样本标准差误差边际95%的置信区间为,53.87 3.78 即(50.09,57
10、.65)天。,STAT,8.3确定样本容量误差边际其计算需要已知若我们选择了置信度由此,得到计算必要样本容量的计算公式:,STAT,【例4】在以前的一项研究美国租赁汽车花费的研究中发现,租赁一辆中等大小的汽车,其花费范围为,从加利福尼亚州的奥克兰市的每天36美元到康涅狄格州的哈特福德市的每天73.50美元不等,并且租金的标准差为9.65美元。假定进行该项研究的组织想进行一项新的研究,以估计美国当前总体平均日租赁中等大小汽车的支出。在设计该项新的研究时,项目主管指定对总体平均日租赁支出的估计误差边际为2美元,置信水平为95%。解:依题意,可得将以上结果取下一个整数(90)即为必要的样本容量。,S
11、TAT,说明:由于总体标准差 在大多数情况下 是未知的,可以有以下方法取得 的值。(1)使用有同样或者类似单元的以前样本的样本标准差;(2)抽取一个预备样本进行试验性研究。用实验性样本的标准差作为 的估计值。(3)运用对 值的判断或者“最好的猜测”,例如,通常可用全距的作为 的近似值。,STAT,8.4总体比例的区间估计区间估计 对总体比例 的区间估计在原理上与总体均值的区间估计相同。同样要利用样本比例 的抽样分布来进行估计。若,则样本比例近似服从正态分布。同样,抽样误差类似的,利用抽样分布(正态分布)来计算抽样误差,STAT,上式中,是正待估计的总体参数,其值一般是未知,通常简单的用 替代。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 区间 估计 详细 讲解
链接地址:https://www.31ppt.com/p-6332782.html