欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    第四章整群抽样课件.ppt

    • 资源ID:1548593       资源大小:2.29MB        全文页数:93页
    • 资源格式: PPT        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第四章整群抽样课件.ppt

    2022/12/4,1,第四章 整群抽样,4.1 引言4.2 群规模相等时的估计4.3 总体比例的估计,2022/12/4,2,第一节 引言,一.整群抽样的定义与特点(一)定义 整群抽样(cluster sampling)或集团抽样,是将总体划分为若干群,然后以群为抽样单元,从总体中随机抽取一部分群,对中选群中的所有基本单元进行调查的一种抽样技术。,2022/12/4,3,【例1】对某校的学生思想或身体情况进行调查: 某校学生 学生宿舍 宿舍学生 估计某居民区现有的电话拥有率 全体居民 若干幢楼 居民,【例2】,某地小学生的视力状况进行调查,【例3】 某地小学生,某所小学,小学生,2022/12/4,4,整群抽样是由一阶抽样向多阶段抽样过渡的桥梁。此章介绍的是单阶段整群抽样。 注: 多阶段抽样与多阶段整群抽样的不同。 (二)特点 1. 抽样框编制得以简化。 在大规模抽样调查中,常常没有或很难编制出包括总体所有次级单元在内的抽样框,而整群抽样则不需要编制庞大的抽样框。 因此,在缺少基本单元名单,但群有现成的名单或明显的空间界限时使用此方法很方便。,2022/12/4,5,【例】某市有100所小学共50,000名学生,要从中抽2000名学生显然是困难的,而若以小学为单位抽取若干小学,再对抽中的学校的全体学生进行调查就简化了.【例】调查农村居民住户,不必列出农村所有居民住户的抽样框,可以利用现成的行政区域,如县、乡、村,将农村划分为若干群,这给抽样设计方案带来很大方便。 即使具备总体基本单元的名单,能直接抽取,但总体基本单元在空间上的分布面很广,那么选定调查单位后的调查工作却可能相当大。如果是实地观测调查费用则很高,并需要较长的时间。,2. 实施调查便利,节省费用。,2022/12/4,6,对于整群抽样,由于样本单元的分布相对较集中,在样本单元数相同的条件下,整群抽样与简单随机抽样相比,虽然样本的代表性较差,但调查组织实施过程更加便利,同时还可以大大地节省调查费用。因此,实际工作中,在权衡费用和精度之后,有时宁可适当增加一些样本单元数,也采用整群抽样方法。,2022/12/4,7,例如,在进行农村居民户收入情况调查时,在一个县抽千分之五的村庄,对其所有居民户进行调查,明显地比从全县直接抽千分之五的农户进行调查,更便于组织,节省人力、旅途往返时间及费用。,2022/12/4,8,整群抽样的随机性体现在群与群间不重叠,也无遗漏,总体任何一个基本单元都必须且只能归于某一群,群的抽选按概率确定。 如果把每一个群看作一个单位,则整群抽样可以被理解为是一种特殊的简单随机抽样。理解这一点对给出整群抽样的估计量的方差有帮助.,整群抽样也是多阶段抽样的前提和基础。,2022/12/4,9,整群抽样有特殊的用途。 有些现象的研究,如果直接调查作为基本单元的个体,很难说明问题,必须以一定范围所包括的基本单元为群体,进行整群抽样,才能满足调查的目的。 例1: 人口普查后的复查、要想估计出普查的差错率,只有通过对一定地理区域(如省,市,县,街道等)内的人口群体作全面调查才行。类似地诸如人口出生率、流动率等调查都需要采用整群抽样。 例2: 对某地人口性别比例的调查,以家庭作为群比直接抽取个人进行估计精度要高,因为家庭的结构基本相似。整群抽样要求分群后各群所含次级单元数目应该确知,否则会给抽样推断带来不便。,2022/12/4,10,缺点:,整群抽样由于调查单位只能集中在若干群上,而不能均匀分布在总体的各个部分,因此,它的精度比起简单随机抽样来要低一些。 例如,在一个有500个村庄、100000个农户的县,抽取1的农户就是1000户,而抽1的村庄则只有5个村庄,也许抽到的5个村庄农户多于1000,但由于样本单位只集中在5个村庄,显然不如在全县范围内简单随机抽取1000户分布均匀,代表性一般要差一些,抽样误差较大。,2022/12/4,11,当然,由于整群抽样省时省力,每个单元的平均调查费用较少,我们可以通过多抽几个群,适当增大样本量的方法弥补估计精度的损失。,2022/12/4,12,二. 群的划分 1.根据行政或地域形成的群体; 如:村庄、城镇、一片森林等 2.调查人员人为确定的; 对可控制规模的群,群规模不宜过大,2022/12/4,13,分群的原则:,划分群时应使群内方差尽可能大,群间方差尽可能小。(注意:这一点与分层抽样中总体内层的划分有着极大的差别)这意味着每个群均具有足够的代表性。如果划分的群相互之间颇多相似之处,那么少量群的抽取足以提供良好的精度。,2022/12/4,14,分析: 整群抽样对于群而言是非全面调查,对于被抽中群内基本单元而言则是全面调查,是“先部分,后全体”的抽样组织形式,与分层抽样正好相反。根据方差分析原理,当总体划分为群后,总体方差可以分解为群间方差和群内方差两部分。这两部分是此消彼长的关系。由于整群抽样是对入选群中的所有单元都进行调查,因此影响整群抽样误差的主要是群间方差。为了提高整群抽样估计的精度,划分群时应使群内方差尽可能大,群间方差尽可能小。,2022/12/4,15,群间相似 群间差异较大,2022/12/4,16,三. 群的规模 即组成群的单元的数量。 整群抽样中,如何有效地对群的大小进行计量,直接关系到抽样估计效率的高低。研究表明,对群的大小的最优计量尺度是各群在所研究标志上的标志总量大小。但在实际工作中,它是未知的。因此通常选择与所研究标志高度线性相关的另一辅助标志作为计量尺度。,2022/12/4,17,注: 整群抽样与分层抽样的的比较,二者在分组(层或群)的条件、调查的方式、分组(层或群)的目的、分组(层或群)的原则、总体方差的分解等方面都存在着较为明显的差别。,2022/12/4,18,群的规模大,估计的精度差但费用省;群的规模小,估计的精度高但费用增大。 通常我们面临的总体会有自然的初级单元,例如各所中学它们互相之间关于学生的体质很相似,但在一个学校里每个学生之间有一定的差异。 倘若需要我们自行划分群,一般还要考虑到组织管理上的方便、精度上的要求以及费用的多少等因素。,2022/12/4,19,当各群所含次级单元数相等时,就称群的大小相等;当各群所含次级单元数不相等时,就称群的大小不相等。当群的大小接近时,常采用简单随机抽样抽取群;当群的大小相差比较大时,为提高效率则更多地采用不等概率(按与群的大小成比例的概率抽样)方法。,2022/12/4,20,第二节 群规模相等时的估计,一.符号说明 总体有N个群,每个群包含的单元数M相等(或相近)。 符号:总体群数: N 样本群数: n 总体第 i 群中第 j 个单元的指标值:样本第 i 群中第 j 个单元的指标值:第 i 群中的单元数:,2022/12/4,21,总体中单元总数:总体中第 i 群的群总值:样本中第 i 群的群总值:总体中第 i 群的个体均值:,2022/12/4,22,样本中第 i 群的个体均值: 总体中的群均值: 样本中的群均值: 总体中的个体均值:,2022/12/4,23,样本中的个体均值:总体方差:总体群间方差:,2022/12/4,24,总体群内方差:样本方差: 样本群间方差:,样本群内方差:,2022/12/4,25,总体ANOVA(方差分析)表-群规模相等的整群抽样,2022/12/4,26,二. 估计量 整群抽样是以群为单位进行抽样,如果群的抽取是简单随机的,则当群的大小都相等时,可以将简单随机抽样理解为是一种特殊的整群抽样,特别当总体分群后的每个群都只包括一个次级单元时,整群抽样和简单随机抽样一致。因此,整群抽样的估计量可以比照简单随机抽样方式来构造。,2022/12/4,27,(一)均值估计量的定义 在群的抽取是简单随机的,且群的大小(M)相等,则总体均值的估计为:,2022/12/4,28,(二)估计量 的性质,性质1 是 的无偏估计.性质2 的方差为:,2022/12/4,29,证明: 因为 ,则,2022/12/4,30,总体总值 的估计量及相应的方差为:,性质3 的样本估计为:,2022/12/4,31,三、整群抽样效率分析,整群抽样的估计精度与群内相关系数 有关。,分子可写成:,2022/12/4,32,分母可写 成:于是 又可以写成:,2022/12/4,33,的方差可以用群内相关系数近似表示:,(当N-1=N,NM-1=NM时),2022/12/4,34,其中:,2022/12/4,35,若采用简单随机抽样,则样本均值 的方差为:等群抽样的设计效应为:说明整群抽样的方差约为简单随机抽样方差的 倍.,2022/12/4,36,另外,群内相关系数也可以用群内方差 和群间方差 表示:,2022/12/4,37,证明: 因为 而 于是,(1),2022/12/4,38,当N很大,而M相对于NM很小,NM-1 NM-M,则上式可写成: 又因为,(2),(3),总离差的分解,群间方差,群内方差,2022/12/4,39,则 将其代入(1),(2)式,便有 由(3)式,(4),(5),2022/12/4,40,因为 是 的无偏估计, 是 的无偏估计,故由(6)、(2)或(5)式整理得,N很大时 (6),2022/12/4,41,整群抽样的估计效率,与群内相关系数 关系密切。 如果群内各单元的值都相等,则群内方差等于零,此时 为最大值,deff=M,即整群抽样的估计量方差是简单随机抽样估计量的方差的M倍; 若群内方差与总体方差相等,意味着分群是完全随机的,此时, ,deff=1,整群抽样与简单随机抽样估计效率相同; 当群内方差大于总体方差时, 为负值,deff1,整群抽样的效率高于简单随机抽样。,2022/12/4,42,当群间方差等于0,即各群均值 都相等时, 有极小值 ,所以 的取值范围是 。,当 1时,deffM 当 0时,deff1 当 为负时,deff1,群内方差为0,群间方差为0,群内方差大于总体方差相等,2022/12/4,43,【例】在一次对某寄宿中学在校生零化钱的调查中,以寄宿作为群进行整群抽样。每个宿舍有6名学生。用简单随机抽样在全部315间宿舍中抽取 n=8间宿舍。全部48个学生上周每人的零化钱 及相关计算数据如下页表,试估计该学校平均每个学生每周的零化钱 ,并给出其95%的置信区间。,2022/12/4,44,8个宿舍48名学生每周零化钱支出额(元),2022/12/4,45,解: N=315 n=8 M=6 f = n/N =0.0254,2022/12/4,46,置信区间:,【例】估计上例中宿舍为群的群内相关系数与设计效应。,2022/12/4,47,2022/12/4,48,deff =1+(M-1) =1+(6-1) 0.348256=2.741若采用简单随机抽样,其样本量为:,2022/12/4,49,【练习题】在一次某城市居民小区居民食品消费量调查中,以每个楼层(相当于居民小组)为群进行整群抽样。每个楼层都有M=8个住户。用简单随机抽样在全部N=510个楼层中抽取n=12个楼层。全部96个样本户人均月食品消费额yij及按楼层的平均数 与标准差si如下表所示。试估计该居民小区人均食品消费额的户平均值,并给出其95%的置信区间,计算群内相关系数与设计效应,2022/12/4,50,12个楼层96户居民人均月食品消费额资料,2022/12/4,51,解:已知N510,n12,M8,fn/N=0.0235故,2022/12/4,52,于是 的置信度为95的置信区间为也即,2022/12/4,53,例2 由例1数据,计算群内相关系数与设计效应解:由前已算出样本群间方差 而群内方差为,2022/12/4,54,2022/12/4,55,若 令为简单随机抽样的样本量则即可达到整群抽样96户样本量相同的估计精度,2022/12/4,56,第三节 群规模不等的估计,一、等概抽样,简单估计 条件: 群之间的规模差异相差不很大 对总体均值 的估计为:,的方差估计为:,当群Mi规模不等时,有不同的抽取方法和估计方法,2022/12/4,57,此法特点1.估计量 是有偏的2.操作简便,易于掌握和使用3.适用条件,群之间的规模差异不大时,2022/12/4,58,二、等概抽样,加权估计,思路: 以群规模Mi为权数,乘以各群均值 得到群观察值总和 yi.再将样本中 n个群的总和平 均,求得群总和均值 ,再除以群平均规模 , 求得均值估计 .,2022/12/4,59,如果总体平均规模 未知,可以用样本平均规模 代替.,2022/12/4,60,总体的总量Y的估计: 或 为总体中的个体单元总数. 方差:,2022/12/4,61,它的无偏估计为:均值的方差:,2022/12/4,62,特点: 此种方法由于考虑了群规模,所以估计量 是无偏估计量。在估计精度方面,如果群规模差别很大时,该方法与前一种方法相比没有明显改观。三、等概抽样,比率估计 该种方法适合大样本量情况。 总体均值: 这里辅助变量不 是Xi而是群规模Mi,2022/12/4,63,它是一个有偏估计。当样本群数n 很大时,其偏倚很小,可以忽略不计。总体总值Y的比率估计为:,2022/12/4,64,估计量的方差分别是:,对比,2022/12/4,65,由方差公式可以看出,估计量 的方差取决于群的个体均值 的差异。所以,尽管群的规模 差异可能很大,但 之间的差异比 之间的差异要小得多。因此,与前一种方法相比,在大样本量情况下,比率估计的精度要更高一些。,的样本估计分别为:,2022/12/4,66,及,2022/12/4,67,四、方法比较,【例】某县有33个乡,共726个村,该年度某农作物种植面积为30525亩。(见下表)现采用等概抽样随机抽取10个乡进行该种农作物的产量调查,根据下面的资料估计全县总产量以及估计量标准差,并对上述方法进行比较分析。,2022/12/4,68,2022/12/4,69,解: 1、用等概抽样,简单估计:,平均每个村的产量为:,=726*1.262=916.212(万公斤),2022/12/4,70,由上述计算结果可知:此种方法的估计过程虽不复杂,但却是有偏估计。 (二) 、等概抽样,加权估计,2022/12/4,71,此种方法虽可获得无偏估计量,但与前种方法相比,估计量的估计方差没有改观,反而有所增大。,2022/12/4,72,(三)等概抽样,比率估计,2022/12/4,73,比率估计将群规模 作为辅助变量引入估计,其估计方差取决于群均值 的差异。从计算的结果看,其估计量的方差比上面两种方法要小,所以比率估计比前两种方法获得更好的估计效果,但比率估计是有偏估计,当样本群数n较大时,比率估计是比较理想的估计方法。,2022/12/4,74,(四)以其他变量作为辅助变量的比率估计 由于目标变量农作物的总产量 不仅受村庄数(群规模)的影响,而且更受种植面积 的影响,下面采用种植面积为辅助变量进行比率估计:,2022/12/4,75,评价:与前面几种方法相比,估计量的估计误差最小,估计效果最好。因为和 相比, 更小,因而有更好的估计效果。 此种方法不仅用于群规模相等时的估计,也可用于群规模不等时的估计。其前提条件是能够获得与目标变量关系密切的辅助变量的总体信息。,2022/12/4,76,【例】某企业欲估计上季度每位职工的平均病假天数。该企业共有8个分厂,现用不等概整群抽样拟抽取3个分厂为样本,并以95%的置信度计算其置信区间。(资料见下表) 解: n=3 在1-12950之间产生随机数:02011,07972,10281则3,6,8分厂入样. 调查得三个分厂的职工的病假天数: y1=4320, y2=4160, y3=5790,2022/12/4,77,8个分厂的职工人数资料,2022/12/4,78,置信区间:,若估计全企业因病假而损失的人日:则,置信区间:,2022/12/4,79,第四节 总体比例的估计,一、群规模相等的估计 采用简单估计,总体比例的无偏估计:,2022/12/4,80,其无偏估计为:,二 、群规模不等时的估计,2022/12/4,81,群的抽取: 采用简单随机抽样, 则总体比例的估计量:估计量的方差为:,2022/12/4,82,V(p)的估计为:,为总体中群的平均规模,若未知,可用样本值 替代.,其中:,2022/12/4,83,【例】,某居民小区有415个居民小组,现采用整群等概抽样,随机抽取25个小组为样本,调查中的一项内容为估计男、女性别的比例,下表为样本中女性的分布。试以95%的置信度估计该小区女性比例的置信区间,并同简单随机抽样进行比较。,2022/12/4,84,25个居民小组总人数及女性人口数,2022/12/4,85,解:,2022/12/4,86,置信区间为:采用简单随机抽样:,2022/12/4,87,设计效应:当 时,群内相关系数为:,2022/12/4,88,总结:在估计总体比例时,群大小无论相等或不相等,对群的抽样均可采用简单随机抽样,不过估计量需要采用不同的形式:在群大小相等时,一般采用简单估计;在群大小不等时,需采用比估计。,2022/12/4,89,本章主要公式,总体方差:总体群间方差: 总体群内方差:,2022/12/4,90,群规模相等时:,2022/12/4,91,群规模不等时:,一、等概抽样,简单估计,二、等概抽样,加权估计,2022/12/4,92,等概抽样,比率估计,2022/12/4,93,谢谢,

    注意事项

    本文(第四章整群抽样课件.ppt)为本站会员(牧羊曲112)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开