第四章整群抽样课件.ppt
《第四章整群抽样课件.ppt》由会员分享,可在线阅读,更多相关《第四章整群抽样课件.ppt(93页珍藏版)》请在三一办公上搜索。
1、2022/12/4,1,第四章 整群抽样,4.1 引言4.2 群规模相等时的估计4.3 总体比例的估计,2022/12/4,2,第一节 引言,一.整群抽样的定义与特点(一)定义 整群抽样(cluster sampling)或集团抽样,是将总体划分为若干群,然后以群为抽样单元,从总体中随机抽取一部分群,对中选群中的所有基本单元进行调查的一种抽样技术。,2022/12/4,3,【例1】对某校的学生思想或身体情况进行调查: 某校学生 学生宿舍 宿舍学生 估计某居民区现有的电话拥有率 全体居民 若干幢楼 居民,【例2】,某地小学生的视力状况进行调查,【例3】 某地小学生,某所小学,小学生,2022/1
2、2/4,4,整群抽样是由一阶抽样向多阶段抽样过渡的桥梁。此章介绍的是单阶段整群抽样。 注: 多阶段抽样与多阶段整群抽样的不同。 (二)特点 1. 抽样框编制得以简化。 在大规模抽样调查中,常常没有或很难编制出包括总体所有次级单元在内的抽样框,而整群抽样则不需要编制庞大的抽样框。 因此,在缺少基本单元名单,但群有现成的名单或明显的空间界限时使用此方法很方便。,2022/12/4,5,【例】某市有100所小学共50,000名学生,要从中抽2000名学生显然是困难的,而若以小学为单位抽取若干小学,再对抽中的学校的全体学生进行调查就简化了.【例】调查农村居民住户,不必列出农村所有居民住户的抽样框,可以
3、利用现成的行政区域,如县、乡、村,将农村划分为若干群,这给抽样设计方案带来很大方便。 即使具备总体基本单元的名单,能直接抽取,但总体基本单元在空间上的分布面很广,那么选定调查单位后的调查工作却可能相当大。如果是实地观测调查费用则很高,并需要较长的时间。,2. 实施调查便利,节省费用。,2022/12/4,6,对于整群抽样,由于样本单元的分布相对较集中,在样本单元数相同的条件下,整群抽样与简单随机抽样相比,虽然样本的代表性较差,但调查组织实施过程更加便利,同时还可以大大地节省调查费用。因此,实际工作中,在权衡费用和精度之后,有时宁可适当增加一些样本单元数,也采用整群抽样方法。,2022/12/4
4、,7,例如,在进行农村居民户收入情况调查时,在一个县抽千分之五的村庄,对其所有居民户进行调查,明显地比从全县直接抽千分之五的农户进行调查,更便于组织,节省人力、旅途往返时间及费用。,2022/12/4,8,整群抽样的随机性体现在群与群间不重叠,也无遗漏,总体任何一个基本单元都必须且只能归于某一群,群的抽选按概率确定。 如果把每一个群看作一个单位,则整群抽样可以被理解为是一种特殊的简单随机抽样。理解这一点对给出整群抽样的估计量的方差有帮助.,整群抽样也是多阶段抽样的前提和基础。,2022/12/4,9,整群抽样有特殊的用途。 有些现象的研究,如果直接调查作为基本单元的个体,很难说明问题,必须以一
5、定范围所包括的基本单元为群体,进行整群抽样,才能满足调查的目的。 例1: 人口普查后的复查、要想估计出普查的差错率,只有通过对一定地理区域(如省,市,县,街道等)内的人口群体作全面调查才行。类似地诸如人口出生率、流动率等调查都需要采用整群抽样。 例2: 对某地人口性别比例的调查,以家庭作为群比直接抽取个人进行估计精度要高,因为家庭的结构基本相似。整群抽样要求分群后各群所含次级单元数目应该确知,否则会给抽样推断带来不便。,2022/12/4,10,缺点:,整群抽样由于调查单位只能集中在若干群上,而不能均匀分布在总体的各个部分,因此,它的精度比起简单随机抽样来要低一些。 例如,在一个有500个村庄
6、、100000个农户的县,抽取1的农户就是1000户,而抽1的村庄则只有5个村庄,也许抽到的5个村庄农户多于1000,但由于样本单位只集中在5个村庄,显然不如在全县范围内简单随机抽取1000户分布均匀,代表性一般要差一些,抽样误差较大。,2022/12/4,11,当然,由于整群抽样省时省力,每个单元的平均调查费用较少,我们可以通过多抽几个群,适当增大样本量的方法弥补估计精度的损失。,2022/12/4,12,二. 群的划分 1.根据行政或地域形成的群体; 如:村庄、城镇、一片森林等 2.调查人员人为确定的; 对可控制规模的群,群规模不宜过大,2022/12/4,13,分群的原则:,划分群时应使
7、群内方差尽可能大,群间方差尽可能小。(注意:这一点与分层抽样中总体内层的划分有着极大的差别)这意味着每个群均具有足够的代表性。如果划分的群相互之间颇多相似之处,那么少量群的抽取足以提供良好的精度。,2022/12/4,14,分析: 整群抽样对于群而言是非全面调查,对于被抽中群内基本单元而言则是全面调查,是“先部分,后全体”的抽样组织形式,与分层抽样正好相反。根据方差分析原理,当总体划分为群后,总体方差可以分解为群间方差和群内方差两部分。这两部分是此消彼长的关系。由于整群抽样是对入选群中的所有单元都进行调查,因此影响整群抽样误差的主要是群间方差。为了提高整群抽样估计的精度,划分群时应使群内方差尽
8、可能大,群间方差尽可能小。,2022/12/4,15,群间相似 群间差异较大,2022/12/4,16,三. 群的规模 即组成群的单元的数量。 整群抽样中,如何有效地对群的大小进行计量,直接关系到抽样估计效率的高低。研究表明,对群的大小的最优计量尺度是各群在所研究标志上的标志总量大小。但在实际工作中,它是未知的。因此通常选择与所研究标志高度线性相关的另一辅助标志作为计量尺度。,2022/12/4,17,注: 整群抽样与分层抽样的的比较,二者在分组(层或群)的条件、调查的方式、分组(层或群)的目的、分组(层或群)的原则、总体方差的分解等方面都存在着较为明显的差别。,2022/12/4,18,群的
9、规模大,估计的精度差但费用省;群的规模小,估计的精度高但费用增大。 通常我们面临的总体会有自然的初级单元,例如各所中学它们互相之间关于学生的体质很相似,但在一个学校里每个学生之间有一定的差异。 倘若需要我们自行划分群,一般还要考虑到组织管理上的方便、精度上的要求以及费用的多少等因素。,2022/12/4,19,当各群所含次级单元数相等时,就称群的大小相等;当各群所含次级单元数不相等时,就称群的大小不相等。当群的大小接近时,常采用简单随机抽样抽取群;当群的大小相差比较大时,为提高效率则更多地采用不等概率(按与群的大小成比例的概率抽样)方法。,2022/12/4,20,第二节 群规模相等时的估计,
10、一.符号说明 总体有N个群,每个群包含的单元数M相等(或相近)。 符号:总体群数: N 样本群数: n 总体第 i 群中第 j 个单元的指标值:样本第 i 群中第 j 个单元的指标值:第 i 群中的单元数:,2022/12/4,21,总体中单元总数:总体中第 i 群的群总值:样本中第 i 群的群总值:总体中第 i 群的个体均值:,2022/12/4,22,样本中第 i 群的个体均值: 总体中的群均值: 样本中的群均值: 总体中的个体均值:,2022/12/4,23,样本中的个体均值:总体方差:总体群间方差:,2022/12/4,24,总体群内方差:样本方差: 样本群间方差:,样本群内方差:,2
11、022/12/4,25,总体ANOVA(方差分析)表-群规模相等的整群抽样,2022/12/4,26,二. 估计量 整群抽样是以群为单位进行抽样,如果群的抽取是简单随机的,则当群的大小都相等时,可以将简单随机抽样理解为是一种特殊的整群抽样,特别当总体分群后的每个群都只包括一个次级单元时,整群抽样和简单随机抽样一致。因此,整群抽样的估计量可以比照简单随机抽样方式来构造。,2022/12/4,27,(一)均值估计量的定义 在群的抽取是简单随机的,且群的大小(M)相等,则总体均值的估计为:,2022/12/4,28,(二)估计量 的性质,性质1 是 的无偏估计.性质2 的方差为:,2022/12/4
12、,29,证明: 因为 ,则,2022/12/4,30,总体总值 的估计量及相应的方差为:,性质3 的样本估计为:,2022/12/4,31,三、整群抽样效率分析,整群抽样的估计精度与群内相关系数 有关。,分子可写成:,2022/12/4,32,分母可写 成:于是 又可以写成:,2022/12/4,33,的方差可以用群内相关系数近似表示:,(当N-1=N,NM-1=NM时),2022/12/4,34,其中:,2022/12/4,35,若采用简单随机抽样,则样本均值 的方差为:等群抽样的设计效应为:说明整群抽样的方差约为简单随机抽样方差的 倍.,2022/12/4,36,另外,群内相关系数也可以用
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 章整群 抽样 课件
链接地址:https://www.31ppt.com/p-1548593.html