《第八章 二阶与多阶抽样.ppt》由会员分享,可在线阅读,更多相关《第八章 二阶与多阶抽样.ppt(24页珍藏版)》请在三一办公上搜索。
1、第八章 二阶与多阶抽样,第一节 概述第二节 初级单元大小相等时的二阶抽样第三节 初级单元大小不等时的二阶抽样,第一节 概述,一、多阶抽样的定义及与其它抽样的关系1.定义:设总体由N个初级单元组成,每个初级单元又由若干二级(次级)单元组成,若在总体中按一定方法抽取m个初级单元,对每个被抽中的次级单元再抽取若干二级单元进行调查,则这种抽样称为二阶抽样,或二级抽样(two-stage sampling)。,2.实施步骤:(1)从总体中抽初级单元,称为第一阶抽样;(2)从每个被抽中的初级单元中抽二级单元,称为第二阶抽样。3.与其他几种抽样方法的关系:整群抽样可以看成是二阶抽样的特殊情形,即最后一阶抽样
2、是100%的抽样;分层抽样也可看作是多阶抽样的特例,每个初级单元即是层,第一阶抽样是100%抽样,而层内抽样则是第二阶抽样。,4.抽样方法:多阶抽样中每一个阶段的抽样可以相同,也可以不同,它通常与分层抽样、整群抽样、系统抽样结合使用。一般来说,当初级单元大小相同时,第一阶段的抽样采用简单随机抽样;当初级单元大小不同时,第一阶段的抽样采用不等概抽样。,二、多阶抽样的特点和作用1.特点:既保持(一阶)整群抽样的优点,又克服了它的缺点。2.作用:(1)分级准备抽样框,即每次只需要对被抽中的单元准备下一级抽样单元的抽样框;(2)对散料的抽样。,第二节 初级单元大小相等时的二阶抽样,一、基本思路二、常用
3、符号三、估计量及其性质四、最优抽样比五、分层二阶抽样,一、基本思路,第一阶段在总体N个初级单元中,以简单随机抽样抽取n个初级单元,第二段在被抽中的初级单元包含的M个二级单元中,以简单随机抽样抽取m个二级单元,即最终接受调查的单元。,二、常用符号,初级单元和初级单元拥有的二级单元个数:N,M第一阶段和第二阶段抽样的样本量:n,m第i个初级单元中的第j个二级单元的观测值:样本中第i个初级单元中的第j个二级单元的观测值:第一阶段和第二阶段的抽样比:总体和样本中第i个初级单元按二级单元的平均值:,总体和样本中按二级单元的平均值:,总体和样本初级单元间的方差:,总体和样本中初级单元内的方差:,三、估计量
4、及其性质,(一)总体均值的估计:对于初级单元大小相等的二阶抽样,如果两个阶段都是简单随机抽样,且对每个初级单元,第二阶抽样是相互独立进行的,则对总体均值 的无偏估计为:,其方差为:,的无偏估计为:,例1:为调查某城市居民小区食品消费量,用简单随机抽样在全部 510个楼层中抽取=24个楼层,每层有8个住户,对每个抽中的楼层再用简单随机抽样抽取=4户进行调查,总的样本量为96户,具体资料如下表所示。试估计该居民小区人均食品消费的户平均值及置信度为95%的置信区间(P247)。,(二)总体比例的估计,1.如果要估计总体中具有所研究特征的二级单元数占全体二级单元数的比例P,则P的一个无偏估计为:,2.
5、估计量p的方差为:,3.的无偏估计为:,为第i个样本初级单元中具有所研究特征的二级单元数。,例2:某部委对所属企事业单位就一项改革方案进行抽样调查,采用二阶抽样。先在全部=1250个单位(平均每个单位职工人数=250)中按简单随机抽样抽取=350个单位,然后对抽中的每个单位再按简单随机抽样抽取=8个职工进行调查。样本单位中赞成此项改革方案人数为 的单位频数,及赞成比例 如下表所示。试估计该部委全体职工赞成该项方案的比例,给出估计量的方差估计,并估计此项二阶抽样的设计效应(P249)。,四、最优样本量的确定,1.问题的提出:(1)在总费用给定的条件下,如何确定 和 才使估计量的方差最小?(2)在
6、给定估计量的精度的条件下,如何确定 和 才使费用最小。2.结论:m的最佳取值为:,其中:求出m之后,根据总费用函数或,就可以确定n,从而确定最优抽样比 和。,3.实际使用时,m应为整数,但计算出的 往往不是整数,令 为 的整数部分,则m的取值规则为:(1)当,则取(2)当,则取(3)当 或者,则取m=M,例3:在例1中,若,试求最优样本量 与。,一.一般说明及记号二.总体总和的估计三.估计量是自加权的条件及对初级单元的PPS抽样,第三节 初级单元大小不等时的二阶抽样,一.一般说明及记号,处理方法:将初级单元按大小分层,使层内的初级单元大小大致相同用不等概率抽样抽取初级单元或虽仍用简单随机抽样抽
7、取初级单元但改变估计量的形式(放回不等概率抽样)记号:,第i个初级单元中的第j个二级单元的观测值:,,样本中第i个初级单元中的第j个二级单元的观测值:,与 分别表示第一阶抽样与第二阶抽样的样本量,分别表示抽样比,其他记号如下:,二.总体总和Y的估计,实施方法:对每个初级单元,设定一个概率,进行n次独立放回抽样,每次抽到第i个初级单元的概率为。在每个被抽到的初级单元中以某种形式抽取 个次级单元。汉森赫维茨估计量,三.估计量是自加权的条件及对初级单元的PPS抽样自加权的条件第一阶抽样对初级单元进行PPS抽样,第二阶抽样进行简单随机抽样,例3:某城市进行服装消费量抽样调查,目标量是上一年户均服装消费金额。抽样采用二阶抽样,其中第一阶用PPS抽样(按居委会所包含的户数)抽取=20个居委会,第二阶抽样是在每个抽中的居委会中用简单随机抽样抽取=6户。调查每个样本户上一年全家花费在服装(包括购置成衣、面料以及加工费)方面的总金额,根据调查结果计算得到的 如下表所示。求该市上一年户均服装消费额 的估计,并求它的置信度为90%的置信区间(P257)。,
链接地址:https://www.31ppt.com/p-2234036.html