《分层抽样》PPT课件.ppt
《《分层抽样》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《分层抽样》PPT课件.ppt(83页珍藏版)》请在三一办公上搜索。
1、第四章 分层抽样,本章要点,本章主要是对分层抽样理论包括抽样方式、估计量及其性质、样本量的确定及分配、分层抽样设计效果等进行系统全面地介绍。具体要求:正确理解层、分层抽样以及分层随机抽样的涵义,分层抽样的特点及作用;掌握分层抽样的参数估计量及其性质;掌握分层抽样样本量的确定方法;了解分层抽样的设计效果;了解分层抽样其他有关理论问题,包括层权偏差、最优分配偏差、事后分层等。,第一节 抽样方式 第二节 简单估计量及其性质第三节 样本量的分配第四节 样本量的确定第五节 分层抽样设计效果分析第六节 进一步讨论的问题,一、分层抽样与分层随机抽样 在抽样之前,先将总体N个单元划分成L个互不重复的子总体,每
2、个子总体称为层,它们的大小分别为,这L个层构成整个总体()。然后,在每个层中分别独立地进行抽样,这种抽样就是分层抽样,所得到的样本称为分层样本。如果每层都是简单随机抽样,则称为分层随机抽样,所得到的样本称为分层随机样本。,第一节 抽样方式,二、分层抽样的特点及作用(一)分层抽样可以提高参数估计的精度。(二)分层抽样不仅能对总体参数进行估计,而且能对各层(子总体)参数进行估计。(三)便于依托行政管理机构进行组织和实施,同时还可以根据各层的不同特点采用不同的抽样方式。(四)分层抽样样本在总体中分布更加均匀。,第一节 抽样方式,三、层的划分原则(一)层内单元具有相同性质,通常按调查对象的不同类型进行
3、划分。这时,分层抽样能够对每一类的目标量进行估计。(二)尽可能使层内单元的标志值相近,层间单元的差异尽可能大,从而达到提高抽样估计精度的目的。(三)既按类型又按层内单元标志值相近的原则进行多重分层,同时达到实现估计类值以及提高估计精度的目的。(四)为了抽样组织实施的方便,通常按行政管理机构设置进行分层。,第一节 抽样方式,四、符号说明 设总体分为L层,下标h表示层号(h=1,2,L)。则关于第h层的记号如下:第h层总体单元数:(通常已知),且 第h层样本单元数:,且 第h层总体和样本第i个单元标志值(观察值):,第一节 抽样方式,第一节 抽样方式,层权:第h层抽样比:第h层总体均值:第h层样本
4、均值 第h层总体总值:,第一节 抽样方式,第h层样本总值:第h层总体方差 第h层样本方差:,第二节 简单估计量及其性质,一、总体均值的估计(一)简单估计量的定义 在分层抽样中,对总体均值 的估计是通过对各层的 的估计,按层权 加权平均得到的。公式为:,如果得到的是分层随机样本,则总体均值 的简单估计为:,第二节 简单估计量及其性质,(二)估计量的性质性质l 对于一般的分层抽样,如果 是 的无偏估计(h=1,2,,L),则 是 的无偏估计。的方差为:,值得强调的是,在分层抽样中只要对各层估计是无偏的,则对总体的估计也是无偏的。因此,各层可以采用不同的抽样方法,只要相应的估计量是无偏的,则对总体的
5、推算也是无偏的。,第二节 简单估计量及其性质,性质2 对于分层随机抽样,是 的无偏估计,的方差为:,性质3 对于分层随机抽样,的一个无偏估计为:,第二节 简单估计量及其性质,二、总体总量的估计(一)简单估计量的定义总体总量Y的估计为:,如果得到的是分层随机样本,则总体总量Y的简单估计为:,第二节 简单估计量及其性质,(二)估计量的性质 性质4 对于一般的分层抽样,如果 是 的无偏估计,则 是Y的无偏估计。的方差为:,第二节 简单估计量及其性质,性质 5 对于分层随机抽样,的方差为:,性质 6 对于分层随机抽样,的一个无偏估计为:,第二节 简单估计量及其性质,【例4.1】为调查某地区住户的平均家
6、庭成员数,将该地区分成城市和乡村2层,每层按简单随机抽样抽取10户,调查所获得的数据如表4-1。请估计该地区住户的平均家庭成员数及其95%的置信区间。,95%的置信区间为,其中。经计算可得:平均家庭成员数的95%的置信区间为:(3.24,4.24),第二节 简单估计量及其性质,第二节 简单估计量及其性质,三、总体比例的估计(一)简单估计量的含义 记层比例为,层样本比例,其中 与 是第h层总体及样本中具有所考虑特征的单元数,则总体比例P的估计为:,第二节 简单估计量及其性质,(二)估计量的性质 如果定义,则对总体比例的估计类似对总体均值的估计,这时 具有同样的性质。,第二节 简单估计量及其性质,
7、性质7 对于一般的分层抽样,如果 是 的无偏估计(h=1,2,,L),则 是P的无偏估计。的方差为:,性质8 对于分层随机抽样,是P的无偏估计,则:,的方差为:,第二节 简单估计量及其性质,第二节 简单估计量及其性质,性质 9 对于分层随机抽样,的一个无偏估计为:,第二节 简单估计量及其性质,【例4.2】对某地区的居民拥有家庭电脑的情况进行调查,以居民户为抽样单元,根据收入水平将居民户划分为四层,每层按简单随机抽样抽取10户,调查获得如下数据(单位:台),如表4-3。估计该地区居民拥有家庭电脑的比例计估计的标准差。,第二节 简单估计量及其性质,解:由上表可得:,第二节 简单估计量及其性质,因此
8、,该地区居民拥有家庭电脑比例的估计为:,估计量的方差为:,第二节 简单估计量及其性质,估计量的标准差为:,第三节 样本量的分配,在分层抽样抽样中,若总样本量n一定时,还需研究各层应该分配多少样本量的问题,因为对总体参数进行估计时,估计量的方差不仅与各层的方差有关,还与各层所分配的样本量有关。实际工作中有不同的分配方法,既可以按各层单元数占总体单元数的比例分配,也可以采用使估计量总方差达到最小等几种方法进行样本量的分配。,第三节 样本量的分配,一、比例分配,比例分配指的是按各层单元数占总体单元数的比例,也就是按各层的层权进行分配,即:,这时:,第三节 样本量的分配,总体比例P的估计是:,对于分层
9、随机抽样,这时总体均值的估计值是:,第三节 样本量的分配,的方差为:,总体中的任一个单元,不管它在哪一层,都以同样的概率入样,因此按比例分配的分层随机样本,估计量的形式特别简单。这种样本也称为自加权的样本。,第三节 样本量的分配,的方差为:,第三节 样本量的分配,二、最优分配(一)最优分配 最优分配是指在分层随机抽样中,如何将样本量分配到各层,使得在总费用给定的条件下,估计量的方差达到最小;或在给定估计量方差的条件下,使总费用最小,能满足这个条件的样本量分配就是最优分配。如果我们考虑简单线性费用函数,总费用,第三节 样本量的分配,则这时的最优分配是:,由此得出下面的行为准则,如果某一层单元数较
10、多,内部差异较大,费用比较省,则对这一层的样本量要多分配一些。,第三节 样本量的分配,(二)Neyman(内曼)分配,对于分层随机样本,作为特例,如果每层抽样的费用相同,即 时,最优分配可简化为:,这种分配称为Neyman分配。这时,达到最小。,第三节 样本量的分配,【例4.3】对某地区的居民豆制品年消费支出进行调查,以居民户为抽样单元,根据收入水平将居民户划分为四层,每层按简单随机抽样抽取10户,调查获得如下数据(单位:元),如表4-4。样本量为n=40,则按比例分配和Neyman分配时,各层的样本量应为多少?,第三节 样本量的分配,解:由上表,,各层的层权及抽样比为:,第三节 样本量的分配
11、,各层样本均值及方差为:,同理可得:,按比例分配时,各层的样本量为:,第三节 样本量的分配,即各层的样本量分别为3,6,11,22,对于Neyman分配,根据前面对 及 的计算结果,得到:,第三节 样本量的分配,因此,按Neyman分配时,各层应分配的样本量为:,第三节 样本量的分配,即各层的样本量分别为3,7,23,7。,(三)某些层要求大于100%抽样时的修正 按最优分配时,有时抽样比 较大,某个层的 又比较大,则可能出现按最优分配计算的这个层的样本量 超过 的情况。实际工作中,如果第k层出现这种情况,最优分配是对这个层进行100%抽样,即取,然后,将剩下的样本量 按最优分配各层。,第三节
12、 样本量的分配,一、一般公式 令,其中 已经选定,于是当方差V给定时,,第四节 样本量的确定,得到确定样本量的一般公式为:,如果估计精度是以误差限的形式给出,则,,第四节 样本量的确定,当按比例分配时,,第四节 样本量的确定,实际工作中,n的计算可以分为两步,先计算,然后进行修正:,当按Neyman分配时,,【例4.4】(续例4.3)如果要求在95%置信度下,相对误差不超过10%,则按比例分配和Neyman分配时,总样本量分别为多少?解:当按比例分配时,由前面的计算结果,可以得到各层的,第四节 样本量的确定,在95%值信度时,对应的t=1.96。又,第四节 样本量的确定,因此得到:,由此可以得
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 分层抽样 PPT 课件

链接地址:https://www.31ppt.com/p-5470092.html