7第七讲++区间估计.ppt
《7第七讲++区间估计.ppt》由会员分享,可在线阅读,更多相关《7第七讲++区间估计.ppt(94页珍藏版)》请在三一办公上搜索。
1、第七章 总体参数估计,Population Parameter Estimation,第一节 参数估计的理解,推断统计,超越实际数据。是一个过程,它能在一定概率水平上,从样本数据得出与总体参数值有关的结论。由两部分构成:估计和假设检验。估计包括参数估计和非参数估计。,参数估计,当在研究中从样本获得一组数据后,如何通过这组信息,对总体特征进行估计,也就是如何从局部结果推论总体的情况,称为总体参数估计。,思 考,假设你正在研究平均一个人一生中要得到多少交通罚单。报告研究结果的方法有以下两种:“10”或者“8到12之间”,请考虑它们各自的优缺点。,参数估计,通俗地说,就是根据抽样结果来合理地、科学地
2、估计总体的参数很可能是什么?或者在什么范围。点估计:根据样本数据算出一个单一的估计值,用来估计总体的参数值。区间估计:计算抽样平均误差,指出估计的可信程度,进而在点估计的基础上,确定总体参数的所在范围或区间。,第二节 总体均值与方差的点估计,概括地说:经常需要对总体进行估计的两个数字特征是:总体的均值和方差。如果将总体的均值和方差视为数轴上的两个点,这种估计称为点估计。如果要求估计总体的均值或方差将落在某一段数值区间,这种估计称为区间估计。,一、点估计和区间估计(point estimation and interval estimation)1.点估计 点估计:当总体参数不清楚时,用一个特定
3、值(一般用样本统计量)对其进行估计,称为点估计。2区间估计 区间估计:是指用数轴上的一段距离表示未知参数可能落入的范围。,二、用样本平均数、方差和标准差估计总体平均数、方差和标准差,1.用样本平均数估计总体平均数 样本平均数是总体均值的良好估计。公式:,2.用样本方差估计总体方差,同理,用样本标准差估计总体标准差,3.一个好的样本统计量估计总体参数的要求,无偏性 是指如果用多个样本的统计量作为总体参数的估计值时,有的偏大,有的偏小,而偏差的平均数为0,这时,这个统计量就是无偏估计量。一致性 是指当样本容量无限增大时,估计值应能越来越接近它所估计的总体参数。即:当N时,X,S2n-12。,有效性
4、 是指当总体参数的无偏估计不止一个统计量时,无偏估计变异性小者有效性高,变异大者有效性低。充分性 是指一个容量为n的样本统计量,是否充分地反映了全部n个数据所反映总体的信息,这就是充分性。,例研究者要调查某社区居民家庭收入分布的差异情况,现随机抽查了10户,得到样本方差为200(元2)。试以此资料估计总体家庭收入分布的差异情况。解 因为样本容量较小,宜用修正样本方差作为总体方差点估计量。即 222.2,第三节 总体均数的区间估计,Gudmund R.Iversen说:,区间估计:给结论留一些余地。,一、区间估计的理解,(一)有关区间估计的几个概念1.置信区间:区间估计是求所谓置信区间的方法。置
5、信区间就是我们为了增加参数被估计到的信心而在点估计两边设置的估计区间。2.显著性水平:用置信区间来估计的不可靠程度。,区间估计的任务是,在点估计值的两侧设置一个区间,使得总体参数被估计到的概率大大增加。可靠性和精确性(即信度和效度)在区间估计中是相互矛盾的两个方面。,3.置信度(水平):用置信区间估计的可靠性(把握度)4.抽样平均误差 与概率度 Z 抽样平均误差:样本均值抽样分布的标准差。反映在参数周围抽样平均值的平均变异程度。越大,样本均值越分散。概率度:Z在参数估计中被称为概率度,其大小由 决定.,显著性水平、置信水平、概率度之间的关系:=0.10时,=0.90,Z/2=1.65=0.05
6、时,=0.95,Z/2=1.96=0.01时,=0.99,Z/2=2.58,二、区间估计的做法 从点估计值开始,向两侧展开一定倍数的抽样平均误差,并估计总体参数很可能就包含在这个区间之内。,设 为待估参数,是一给定的数,(01).若能找到统计量,使,置信区间或区间估计.,置信下限,置信上限,置信区间的定义,定义,反映了估计的可靠度,越小,越可靠.,置信区间的长度 反映了估计精度,越小,1-越大,估计的可靠度越高,但,确定后,置信区间 的选取方法不唯一,常选最小的一个.,几点说明,越小,估计精度越高.,这时,往往增大,因而估计精度降低.,处理“可靠性与精度关系”的原则,关于置信区间长度的小结,样
7、本中的观察值个数影响置信区间长度。大样本产生较短的置信区间。置信水平影响置信区间。短的置信区间能比长的置信区间提供更多的有关总体参数的信息。,区间估计,区间估计:给结论留一些余地。又称为置信区间,是用来估计参数的取值范围的。置信区间与显著性水平0.95置信区间0.05显著性水平的置信区间=0.01表示反复抽样1000次,则得到的1000个区间中不包含真值的仅为10个左右。区间估计的原理:样本分布理论置信区间(统计量标准误),(统计量标准误),要对总体参数值进行区间估计,既要在一定可靠度上求出总体参数的置信区间的上下限,需要以下条件:,1.要知道与所要估计的参数相对应的样本统计量的值,以及样本统
8、计量的理论分布;2.要求出该种统计量的标准误;3.要确定在多大的可靠度上对总体参数作估计,再通过查某种理论概率分布表,找出与某种可靠度相对应的该分布横轴上记分的临界值,才能计算出总体参数的置信区间上下限。,二、总体平均值的区间估计,(一)基本概念总体均值的区间估计,置信度,置信区间:日常用语表达:就是估计总体均值可能在什么范围之内。精确的数学语言表达:总体均值的区间估计就是确定总体均值将以特定概率落入其间的数值界限。这个特定概率称为置信度(或称显著性水平),用表示,这个数值界限称为置信界限,置信界限上下限之间的区间,称为置信区间。,(二)求解步骤,(1)根据实际样本的数据,计算样本的平均数和标
9、准差(2)计算标准误 a总体方差已知(查正态分布表)b总体方差未知(查t分布表)(3)确定置信区间(或显著性水平)(4)根据样本平均数的分布,确定查何种统计表(5)确定并计算置信区间(6)解释总体均数的置信区间。,不同情况总体均值的区间估计,(三)已知条件下,总体平均数的区间估计,(1)当总体已知,总体呈正态分布,大样本(n30)或小样本(n30)时(2)当总体已知,总体虽不呈正态分布,大样本(n30)时,样本平均数可以转换成标准记分。,1、两种类型,如果一个随机变量Z服从标准正态分布(=0,2=1的正态分布),那么 P-1.96Z1.96=0.95 P-2.58Z2.58=0.99,一个正态
10、总体 X N(2)的情形,方差 2已知,的置信区间,公式(一)(1),2、计算公式,解,得 的置信度为 的置信区间为,3、对总体参数进行区间估计的方法:,4、解释,在置信区间X-1.96SEx,X+1.96SEx内,正确估计总体均值所在区间的概率为0.95。但是,做这种区间估计不可能保证完全无误,估计错误的概率大约为0.05。,5、例题,已知某年某地区高考数学成绩的方差为100,从该地区随机抽得20名考生的数学成绩为:65、68、38、56、72、75、47、58、70、63、67、64、60、69、61、66、55、76、68、62,试求该地区这一年高考数学平均分95%和99%的置信区间。,
11、同理,总体平均数99%置信区间为:,答:该地区这一年高考数学平均分95%和99%的置信区间分别为58.62至67.38分之间和57.23至68.77分之间。由这些计算结果可以看到,置信区间与可靠度有关,可靠度要求越高,置信区间就越大,反过来,置信区间越大,则可靠度就越高,正确估计的把握就越大。,例 设某工厂妇女从事家务劳动服从正态分布,0.662,根据36人的随机抽样调查,样本每天平均从事家务劳动的时间为2.65小时,求 的置信区间(置信度=0.95)。解 按题意,此为大样本,且总体方差已知,又 36,2.65,0.66,0.95。查表得 1.96,代入公式有 2.65 1.96 2.65 0
12、.22 因此,有95的把握,该厂妇女的平均从事家务劳动的时间在2.87 2.43小时之间。,6、课堂练习,例,某弱智儿童学校的学生智力水平低于正常儿童,假设该校学生的智商分数遵从正态分布,抽查10名学生的智力水平,测得智商如下:85 70 90 81 72 75 80 82 76 79(1)试估计该校学生智商分数的平均值(2)如果知道该校学生智商分数的方差为25,试找出该校学生平均智商的置信区间。,课堂练习,已知总体为正态分布,=7.07,从总体中随机抽取n1=10和n2=36的两个样本,分别计算出样本1的平均数为78,样本2的平均数为79,试问总体参数的0.95和0.99置信区间。思考:两个
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第七 区间 估计

链接地址:https://www.31ppt.com/p-2731960.html