统计学抽样推断.ppt
《统计学抽样推断.ppt》由会员分享,可在线阅读,更多相关《统计学抽样推断.ppt(71页珍藏版)》请在三一办公上搜索。
1、,第八章 抽样推断,第八章 抽样推断,本章主要内容第一节 抽样推断的基本问题第二节 抽样误差第三节 抽样估计第三节 抽样组织实施 返回,第一节 抽样推断的基本问题,一、抽样推断的概念二、抽样推断的特点三、抽样推断的适用范围四、抽样推断的有关概念五、抽样方法 返回,第一节 抽样推断的基本问题,一、抽样推断的概念抽样推断是指从被研究现象的总体中按照随机原则抽取一部分单位进行调查,并依据调查结果对全部研究对象的数量特征作出具有一定可靠程度的估计,以达到对全部研究对象认识的一种统计方法。抽样包括抽样调查和抽样推断两部分。抽样推断包括两个有联系但又具有一定差别的方面,即估计和检验 二、抽样推断的特点(一
2、)按照随机原则从总体中抽取样本单位。(二)用样本单位的指标数值推断总体的指标数值。(三)抽样误差可以事先计算并加以控制。,第一节 抽样推断的基本问题三、抽样推断的适用范围(需要掌握总体的具体数据)(一)不能进行全面调查(二)理论上可以进行全面调查实际上办不到(三)没有必要进行全面调查(四)可以验证和补充全面调查资料四、抽样调查的理论基础(一)大数定律 大数定理是关于大量的随机先行的均值具有稳定性的定理。1、贝奴里大数定理 2、契比雪夫大数定理(二)中心极限定理 证明某一分布的极限分布为正态分布的定理为中心极限定理。,第一节 抽样推断的基本问题,大数定理只论述了抽样平均效趋近于总体平均数的趋势。
3、但是抽样平均致与总体平均数的离差有多少?离差不超过一定范围的概率有多大?这个离差的分布如何?这些问题则要应用中心极限定理来答。俄国数学家李亚普诺夫(Liapounov)给出了这个中心极限定理:如果总体存在有限的平均数和方差,那么不管总体是否属于正态分布,只要当抽样单位数不断增加,抽样平均数的分布也就趋近于正态分布。这个定理就为抽样误差的估计提供了理论依据,使抽样估计有了科学基础。后面阐述的抽样误差范围估计的可靠程度就是根据这个原理出发的。,第一节 抽样推断的基本问题,五、抽样推断的有关概念(一)全及总体和抽样总体1、全及总体(总体 N):所要认识对象的全体。(1)有限总体(2)无限总体 2、抽
4、样总体(样本 n):所抽取的一部分单位。(1)大样本(n30)(2)小样本(n30)(二)全及指标和抽样指标1、全及指标:用来描述全及总体的指标2、抽样指标:根据样本单位计算的指标,X,(三)反映总体特征的主要指标 对于变量总体,反映总体集中分布趋势的算术平均数,反映总体离中分布趋势的方差或标准差,X,X,第一节 抽样推断的基本问题,五、抽样方法(一)按抽取样本单位的方法不同1、重复抽样 2、不重复抽样(二)根据对样本的要求不同1、考虑顺序的抽样 ABBA2、不考虑顺序的抽样 AB=BA,第一节 抽样推断的基本问题,(三)两种分类交叉1、考虑顺序的不重复抽样2、考虑顺序的重复抽样3、不考虑顺序
5、的不重复抽样4、不考虑顺序的重复抽样,第二节 抽样误差,一、抽样平均误差(一)概念(二)计算 1、简单随机抽样 2、类型抽样 3、等距抽样 4、整群抽样 5、阶段抽样(三)影响抽样平均误差的因素 二、抽样极限误差 三、抽样极限误差与抽样平均误差的关系 返回,一、抽样平均误差,(一)抽样平均误差的概念1、登记汇总性误差2、代表性误差(1)偏差,(二)抽样平均误差的计算,1、简单随机抽样(1)概念:是对总体单位不作任何分类或排队,完全按随机原则逐个地抽取样本单位。(2)抽样平均误差的计算公式平均数的抽样平均误差成数的抽样平均误差,假设某村种植的甜菜按不同的收获量分成五个地块,资料如下表:,在重复抽
6、样下,样本变量是独立的。则,(3)例题,某冷库冻鸡平均每只重1200克,标准差70克,如果重复随机抽取100只和200只,分别计算抽样平均误差。该冷库冻鸡合格率为97%,如果重复随机抽取100只和200只,分别计算抽样平均误差。,2、类型抽样,(1)概念:类型抽样是将总体全部单位按某个标志分成若干个类型组,然后从各类型组中采用简单随机抽样方式或其它方式抽取样本单位。(2)样本单位数在各类型组中的分配方式等额分配:在各类型组中分配同等单位数。等比例分配:按各类型组在总体中所占比例分配样本单位数。即:最优分配:按各类型组的规模大小和差异程度,确定各类型组的样本单位数。,(3)抽样平均误差的计算公式
7、,平均数的抽样平均误差重复不重复且等比例成数的抽样平均误差重复不重复且等比例,(4)例题,有12块小麦地,每块1亩。6块处于丘陵地带,亩产量(斤)分别为:300 330 330 340 370 370。6块处于平原地带,亩产量(斤)分别为:420 420 450 460 490 520。抽查4块,测定12块地的平均亩产量,计算其抽样误差。设亩产在350以上的为高产田,抽查4块,测定12块地高产田的比重,计算其抽样误差。用类型抽样,每类抽2块计算各组方差 平均组内方差 抽样误差,丘陵,平原,3、等距抽样,(1)概念:将总体各单位标志值按某一标志顺序排队,然后按一定的间隔抽取样本单位。(2)排对的
8、方法 无关标志排队 有关标志排队(3)抽取样本单位的方法按相等的距离取样对称等距取样(4)抽取第一个样本单位的方法随机抽取 居中抽取,(5)抽样平均误差的计算公式,按无关标志排队:同不重复简单随机抽样 按有关标志排队,亩产量():300 330 330,亩产量():340 370 370,亩产量():420 420 450,亩产量():460 490 520,上例,抽选间隔为,(6)例题,4、整群抽样,(1)概念:把总体分为若干群,从总体群中抽取若干样本群,对抽中的群进行全数登记调查。(2)抽样平均误差的计算公式 某水泥厂一昼夜的产量为14400袋,现每隔144分钟抽取1分钟的水泥(10袋)检
9、查平均每袋重量和一级品率,样本资料如下:计算抽样平均误差,(3)例题,一昼夜有1440分钟,即把总体分为1440群,R=1440每隔144分钟抽取1分钟的水泥(10袋),r=10,5、阶段抽样,(1)概念:抽样时,先抽总体中较大范围的单位,再从中选的较大范围的单位中抽取较小范围的单位,依此类推,最后得到样本的基本单位。(2)抽样平均误差的计算公式(以两阶段为例)同理可以得出成数抽样平均误差的计算公式(3)例题:某地区有300户居民,分成10群,现从10群中抽6群,再从抽中的群中每群抽2户调查其平均收入,计算抽样平均误差。资料如下:群1:300 330(户收入),n=rm,群2:户收入330 3
10、40,群3:户收入370 390,群4:户收入418 434,群5:户收入462 484,群6;户收入507 525,(三)影响抽样平均误差的因素,1、总体标准差的大小2、样本单位数的多少3、抽样方法的不同4、抽样组织方式的差别,二、抽样极限误差,1、在做抽样估计时,应根据所研究现象的变异程度和分析任务的要求确定可允许的误差范围,在这个范围内的数字都算有效,这种可允许的误差范围称为抽样极限误差。2、抽样极限误差等于样本指标可允许变动的上限或下限与总体指标之差的绝对值。,4、,三、抽样误差的概率度用抽样误差概率度 t表示误差范围为抽样平均误差的 t倍。,当t=1时,F(t)=68.27%当t=2
11、时,F(t)=95.45%当t=3时,F(t)=99.73%,三、抽样极限误差与抽样平均误差的关系(一)抽样分布据中心极限定理,当总体为正态或总体非正态但n30时,样本均值的分布趋近于正态分布;当n足够大时,样本成数的分布近似为正态分布。(二)关系 令,返回,第三节抽样估计的方法,一、总体参数的点估计1、参数点估计的特点:根据总体指标的结构形式设计样本指标(称统计量)作为总体参数的估计量,并以样本指标的实际值直接作为相应总体参数的估计值。2、公式:以样本的平均数 作为总体平均数 的估计值。以样本的成数p作为总体成数P的估计值。,3、成为优良估计的标准,无偏性:即以抽样指标估计总体指标要求抽样指
12、标值的平均数等于被估计的总体指标值本身。抽样平均数的平均数等于总体平均数。抽样成数的平均数等于总体成数。一致性:要求当样本的单位数充分大时,抽样指标也充分地靠近总体指标。有效性:以抽样指标估计总体指标要求作为优良估计量的方差比其他估计量的方差小。,4、总体参数点估计的特点:,优点:简便、易行、原理直观缺点:这中估计没有表明抽样估计的误差,更没有指出误差在一定范围内的概率保证程度有多大。,二、抽样估计的置信度:,1、抽样估计置信度就是表明抽样指标和总体指标的误差,不超过一定范围的概率保证程度。2、概率是指在随机事件进行大量实验中,某种时间出现的可能性大小,它可以用某种事件出现的频率表示。,3、抽
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 抽样 推断
链接地址:https://www.31ppt.com/p-6373784.html