统计学7刘ppt课件.ppt
《统计学7刘ppt课件.ppt》由会员分享,可在线阅读,更多相关《统计学7刘ppt课件.ppt(80页珍藏版)》请在三一办公上搜索。
1、第七章 参数估计,7.1 参数估计的一般问题7.2 一个总体参数的区间估计7.3 两个总体参数的区间估计7.4 样本容量的确定注意:本章内容:在抽样分布的基础上,依据 统计量的分布推断所关心的参数。本章估计都是在简单随机重复抽样的条 件下来讨论的。,7.1 参数估计的一般问题,7.1.1.估计量与估计值7.1.2.点估计与区间估计7.1.3.评价估计量的标准,7.1.1.估计量与估计值,1)估计量:用来估计总体参数的统计量的名称。如样本均值,样本比例、样本方差等例如:样本均值就是总体均值 的一个估计量2)参数用 表示,估计量用 表示3)估计值:估计参数时计算出来的统计量的具体值如果样本均值 x
2、=80,则80就是的估计值,统计估计的基本过程:1).通过样本获取一些基本的统计量,然后利用这些基本统计量与总体参数之间的联系,(获得统计量的分布)利用有关统计方法,估计总体参数。2).由此可以看出,统计量与总体参数、估计量的不同:总体参数通常是未知的定数,是待估计量;统计量是根据样本计算的函数,通常是随机变量(对于总体而言);估计量用来对总体参数进行估计的统计量。,参数估计的方法,7.1.2.点估计与区间估计,点估计与区间估计是统计估计的两种具体的方法。二者的基本出发点是不同的。点估计主要是想利用统计量来估计总体参数的一个定值。区间估计则是利用统计量的相应分布,估计包含总体参数的随机区间。共
3、同的是二者都是对总体参数的一种估计。,点估计(point estimate)具体方法,1.用样本的估计量直接作为总体参数的估计值例如:用样本均值直接作为总体均值的估计例如:用两个样本均值之差直接作为总体均值之差的估计2.没有给出估计值接近总体参数程度的信息3.点估计的方法有矩估计法、最大似然法、最小二乘法等,7.1.2评价估计量的标准(一般含义)1、无偏性:,称是 的无偏估计量。2、有效性。一个具有较小变异的统计量的意义在于将有更多的机会产生一个更接近于总体参数的量。3、一致性。随着样本容量的增大,点估计量的值越来越接近被估计总体参数。,无偏性(unbiasedness),无偏性:估计量抽样分
4、布的数学期望等于被 估计的总体参数,有效性(efficiency),有效性:对同一总体参数的两个无偏点估计 量,有更小标准差的估计量更有效,一致性(consistency),一致性:随着样本容量的增大,估计量的 值越来越接近被估计的总体参数,为的无偏、有效、一致估计量;为的无偏、有效、一致估计量 为的无偏、有效、一致估计量。,7.1.3区间估计(interval estimate),在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到的根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量比如,某班级平均分数在7585之间,置信水平是95
5、%,置信水平=1-,当总体服从正态分布N(,2)时,(2已知)来自该总体的所有容量为n的样本的均值x也服从正态分布,x 的数学期望为,方差为2/n即xN(,2/n),区间估计的数学表达方式:,区间估计基本表达,(以估计 为例):,STAT,区间估计的图示,将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平 表示为(1-为是总体参数未在区间内的比例常用的置信水平值有 99%,95%,90%相应的 为:0.01,0.05,0.10 的值:2.58,1.96,1.645(记住),置信水平,置信区间与置信水平,影响区间宽度的因素 p207,1.总体数据的离散程度,用
6、来测度2.样本容量,3.置信水平(1-),影响 z 的大小,1.置信水平为95%的置信区间,意思是在构造的所有置信区间当中,包含总体参数真值的区间占95%。2.总体参数的真值是固定的、未知的,而用样本构造的置信区间是不固定的。一个样本构造一个区间,不同样本构造不同的区间,因此置信区间是随机区间。置信水平是针对随机区间而言,不是所有区间都包含总体参数的真值。3.在实际问题中,进行估计时,往往只抽取一个样本。由该样本所构造的区间是一个特定的区间,而不再是随机区间,因此该区间是否包含总体参数的真值,我们是不知道的。,对置信区间的理解须注意:,7.2 一个总体参数的区间估计p211,7.2.1.总体均
7、值的区间估计7.2.2.总体比例的区间估计7.2.3.总体方差的区间估计,1.一个总体参数的区间估计,7.2.1总体均值的区间估计(大样本),1.假定条件总体服从正态分布,且方差()已知或者未知如果不是正态分布,可由正态分布来近似(n 30)2.使用正态分布统计量 z(标准化),总体均值 在1-置信水平下的置信区间为,边际误差,总体均值的区间估计(例题分析),【例】一家食品生产企业以生产袋装食品为主,为对产量质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布,且总体标准差为10g
8、。试估计该批产品平均重量的置信区间,置信水平为95%,总体均值的区间估计(例题分析),解:已知N(,102),n=25,1-=95%,z/2=1.96。根据样本数据计算得:总体均值在1-置信水平下的置信区间为,该食品平均重量的置信区间为101.44g109.28g,总体均值的区间估计(例题分析),【例】一家保险公司收集到由36投保个人组成的随机样本,得到每个投保人的年龄(周岁)数据如下表。试建立投保人年龄90%的置信区间(总体分布不知,大样本),总体均值的区间估计(例题分析),解:已知n=36,1-=90%,z/2=1.645。根据样本数据计算得:,总体均值在1-置信水平下的置信区间为,投保人
9、平均年龄的置信区间为37.37岁41.63岁,计算样本统计量,确定样本统计量分布,确定临界值保证概率,确定置信区间,区间估计步骤,(以估计 为例):,STAT,其中:,STAT,例:由532名商业周刊订阅者组成的样本表明,其每周使用因特网的平均时间为6.7小时。如果总体标准差为5.8小时,求该周刊订阅者总体每周平均花费在因特网上时间的95置信区间。,均值的区间估计,则:该置信区间为:,正态总体或非正态总体但大样本,总体方差未知,均值的区间估计,STAT,总体均值的区间估计(小样本),1.假定条件总体服从正态分布,且方差()未知小样本(n 30)2.使用 t 分布统计量,总体均值 在1-置信水平
10、下的置信区间为,正态总体小样本,总体方差未知 p214,均值的区间估计,t 统计量,总体均值的区间估计(例题分析)P175,【例】已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命(小时)如下。建立该批灯泡平均使用寿命95%的置信区间,总体均值的区间估计(例题分析),解:已知N(,2),n=16,1-=95%,t/2=2.131 根据样本数据计算得:,总体均值在1-置信水平下的置信区间为,该种灯泡平均使用寿命的置信区间为1476.8小时1503.2小时,均值推断方法的选择 p217,n是否为大样本,是否已知,是否正态总体,是否已知,用S 估计,用S 估计,增大样本容量
11、到30以上,7.2.2.总体比例的区间估计,1.假定条件总体服从二项分布可以由正态分布来近似使用正态分布统计量 z 查教材P155,3.总体比例在1-置信水平下的置信区间为,总体比例的区间估计(例题分析)P218,【例】某城市想要估计下岗职工中女性所占的比例,随机地抽取了100名下岗职工,其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间,该城市下岗职工中女性比例的置信区间为55.65%74.35%,7.2.3总体方差的区间估计,1.估计一个总体的方差或标准差2.假设总体服从正态分布3.总体方差 2 的点估计量为S2,且,4.总体方差在1-置信水平下的置信区间为,
12、总体方差的区间估计(图示),总体方差的区间估计(例题分析),【例】一家食品生产企业以生产袋装食品为主,现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布。以95%的置信水平建立该种食品重量方差的置信区间,总体方差的区间估计(例题分析),解:已知n25,1-95%,根据样本数据计算得 s2=93.21 2置信度为95%的置信区间为,该企业生产的食品总体重量标准差的的置信区间为7.54g13.43g,7.2.4正态总体未来观察值的预测区间估计p220,预测随机变量未来的观察值,并希望求出各某个未来观察值的取值范围,这个范围就是对某个未来观察值的预测区间
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 ppt 课件
链接地址:https://www.31ppt.com/p-5434048.html