统计学参数估计与假设检验ppt课件.ppt
《统计学参数估计与假设检验ppt课件.ppt》由会员分享,可在线阅读,更多相关《统计学参数估计与假设检验ppt课件.ppt(41页珍藏版)》请在三一办公上搜索。
1、二战中的点估计 德军有多少辆坦克?,二战期间,盟军非常想知道德军总共制造了多少辆坦克。德国人在制造坦克时是墨守成规的,他们把坦克从1开始进行了连续编号。在战争过程中,盟军缴获了一些敌军坦克,并记录了它们的生产编号。那么怎样利用这些号码来估计坦克总数呢?在这个问题中,总体参数是未知的坦克总数N,而缴获坦克的编号则是样本。假设我们是盟军手下负责解决这个问题的统计人员。制造出来的坦克总数肯定大于等于记录的最大编号。为了找到它比最大编号大多少,我们先找到被缴获坦克编号的平均值,并认为这个值是全部编号的中点。因此样本均值乘以2就是总数的一个估计;当然要特别假设缴获的坦克代表了所有坦克的一个随机样本。这种
2、估计N的公式的缺点是:不能保证均值的2倍一定大于记录中的最大编号。,二战中的点估计 德军有多少辆坦克?,N的另一个点估计公式是:用观测到的最大编号乘以因子1+1/n,其中 n 是被俘虏坦克个数。假如你俘虏了10 辆坦克,其中最大编号是50,那么坦克总数的一个估计是(1+1/10)50=55。此处我们认为坦克的实际数略大于最大编号。从战后发现的德军记录来看,盟军的估计值非常接近所生产的坦克的真实值。记录仍然表明统计估计比通常通过其他情报方式作出估计要大大接近于真实数目。统计学家们做得比间谍们更漂亮!,资料来源:GUDMUND R.IVERSEN和MARY GERGRN著,吴喜之等译:统计学基本概
3、念和方法,高等教育出版社,施普林格出版社,2000。,参数估计,参数估计的基本概念,用来推断总体参数的统计量称为估计量(estimator), 其取值称为估计值(estimate) 。 同一个参数可以有多个不同的估计量。参数是唯一的,但估计量(统计量)是随机变量,取值是不确定的。,本章的学习目的,抽样与抽样分布是推断统计的基础。统计推断就是根据样本的信息,对总体的特征作出推断,包括参数估计和假设检验。参数估计是在抽样及抽样分布的基础上,根据样本的统计量来推断总体参数。一个总体参数的估计,两个总体参数的估计,样本容量的确定。,统计方法,统计描述,统计推断,参数估计,假设检验,点估计,区间估计,基
4、本概念,常用的估计量,样本平均数、样本方差、样本比率。点估计:用一个点(数)估计未知参数。 例如:用样本均值作为总体未知均值的估计值。 点估计没有给出估计值接近总体未知参数程度的信息 优点:简单,能够明确的估计总体参数。 缺点:其误差与可靠性不得而知。点估计的方法:特征数法、矩估计法、顺序统计量法、最大似然法、最小二乘法。区间估计:用一个区间估计未知数,把未知参数估计在某两界限之间。样本统计量加减抽样误差。,譬如,在估计湖中鱼数的问题中,若我们根据一个实际样本,得到鱼数 N 的极大似然估计为1000条.,若我们能给出一个区间,在此区间内我们合理地相信 N 的真值位于其中. 这样对鱼数的估计就有
5、把握了.,实际上,N的真值可能大于1000条,也可能小于1000条.,参数的区间估计,也就是说,我们希望确定一个区间,使我们能以比较高的可靠程度相信它包含真参数值.,湖中鱼数的真值, ,这里所说的“可靠程度”是用概率来度量的 ,称为置信度或置信水平.,区间估计,根据事先确定的置信度1 - 给出总体参数的一个估计范围。置信度1 - 的含义是:在同样的方法得到的所有置信区间中,有 (1- )% 的区间包含总体参数。 抽样分布是区间估计的理论基础。,区间估计: 根据样本统计量以一定的可靠程度去估计总体参数值所在的范围或区间,是抽样估计的主要方法。,区间估计,抽样估计的置信度与精确度1.置信度:表示区
6、间估计的可靠程度或把握程度,也 即所估计的区间包含总体参数真实值的可能性大小,一般以1- 表示。其中 表示显著性水平,即参数不落在区间内的概率。 置信度通常采用三个标准: (1)显著性水平=0.05, 即1- =0.95 (2)显著性水平=0.01, 即1- =0.99 (3)显著性水平=0.001,即1- =0.999,12,2.抽样估计的精确度: 用置信区间的大小即抽样极限/允许误差来表示。 3.抽样估计的置信度与区间大小关系: 在样本容量和其他条件一定的情况下,,区间估计,若希望抽样估计有较高的可靠度,则必须扩大置信区间;,即:抽样估计要求的把握度越高,则抽样允许误差越大,精确度越低;反
7、之则相反。,68.27%,95.45%,99.73%,区间与置信水平,假定条件总体服从正态分布,且方差() 已知如果不是正态分布,可由正态分布来近似 (n 30),总体均值 在1-置信水平下的置信区间为,使用正态分布统计量,1,2,3,总体均值的区间估计(大样本),得到,从而,影响因素标准差 样本容量 n 置信水平 (1a),已知n=40, =15;计算得到样本均值 由1-=0.95,查标准正态分布概率表得:于是在95%的置信水平下的置信区间为:即(40.83,50.13)。结果表明:在95%的置信水平下,二手房交易价格的置信区间为40.83万元50.13万元。,沿用前例,假定房地产中介公司从
8、上季度的二手房交易记录中得到以下信息:交易价格的标准差为15万元,于是我们假定总体标准差 =15。试在95%的置信水平下估计二手房平均价格的置信区间。,解答,假定条件总体服从正态分布,且方差() 未知小样本 n 30,总体均值 在1-置信水平下的置信区间为,使用正态分布统计量,1,2,3,总体均值的区间估计(小样本),t 分布,分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散。一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布,沿用前例,假定该房地产公司在某日随机抽取16位二手房购买者,得到二手房交易价格如下表所示(万元)。,根据以往交易情况得知:二
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 参数估计 假设检验 ppt 课件
链接地址:https://www.31ppt.com/p-1467668.html