《抽样调查第4章分层抽样课件.ppt》由会员分享,可在线阅读,更多相关《抽样调查第4章分层抽样课件.ppt(44页珍藏版)》请在三一办公上搜索。
1、抽样调查第4章分层抽样,第四章 分层抽样,4.1 估值法(一),4.2 估值法(二)组合比估计和回归估计,4.3 样本量的分配,4.4 与简单随机抽样之比较,4.5 如何适当分层,4.6 后分层估计和定额抽样,抽样调查第4章分层抽样,分层抽样的提法,估值法(一),4.1 估值法(一),抽样调查第4章分层抽样,分层抽样的提法,分层抽样的步骤,分层:,抽样:,从每层抽取一个样本构成总的样本,采用分层抽样的理由,可同时对子总体进行参数估计,便于组织实施,可根据各层特点采用不同抽样方式,可使样本在总体中分布均匀,从而具有更好代表性,适当分层可提高参数估计的精度,(Stratified sampling
2、),抽样调查第4章分层抽样,分层抽样的提法,分层抽样的问题,如何分层,如何确定各层样本量,如何估值,记号,抽样调查第4章分层抽样,估 值 法(一),抽样调查第4章分层抽样,估 值 法(一),抽样调查第4章分层抽样,估 值 法(一),抽样调查第4章分层抽样,估 值 法(一),例1 调查某地区居民的奶制品消费支出,以居民户为抽样单元.根据经济收入水平将居民划分为4层,每层抽取样本量为10的简单随机样本,调查数据如下表,试估计该地区居民奶制品的月消费总支出及其置信度为95%的置信区间.,抽样调查第4章分层抽样,例2 对某地区的居民拥有家庭电脑的情况进行调查,以居民为抽样单位,根据收入水平将居民户划分
3、为4层,每层按简单随机抽样抽取10户。调查数据如表。,估计该地区居民拥有家庭电脑的比例及抽样标准误。,估 值 法(一),抽样调查第4章分层抽样,例3 已知某公司一般职员及高级管理人员刚进入公司时的工资总额分别为5523965元、2541660元,欲通过抽样调查估计当前该公司职员的工资总额Y。抽样按照一般职员与高管层进行分层随机抽取。一般职员共390人,抽取15人;高管层共84人,抽取10名。调查数据如表。,给出Y的分别比估计量,估计其精度,估 值 法(一),抽样调查第4章分层抽样,练习1 为调查某地区住户的平均家庭成员数,将该地去分为城市和乡村2层,每层按照简单随机抽样抽取10户。调查数据如表
4、。,估计该地区住户的平均家庭成员数及其95%的置信区间。,估 值 法(一),抽样调查第4章分层抽样,组合比估计,4.2 组合比估计和回归估计,组合回归估计,抽样调查第4章分层抽样,组合比估计,有辅助变量X用于估值分析的,先分别对各层进行简单估计,再用比估值法获得目标指标量的估计,组合比估计的含义,(Ratio combined),抽样调查第4章分层抽样,组合比估计,定理4.2.1 对分层抽样的组合比估计,有,估值定理,抽样调查第4章分层抽样,组合比估计,例3续:给出Y的组合比估计量,估计其精度,与分别比估计进行比较,抽样调查第4章分层抽样,组合比估计,分别比估计与组合比估计的比较,抽样调查第4
5、章分层抽样,分别回归估计,分别回归估计,抽样调查第4章分层抽样,组合回归估计,组合回归估计,抽样调查第4章分层抽样,组合回归估计,抽样调查第4章分层抽样,组合回归估计,分别回归估计与组合回归估计的比较,抽样调查第4章分层抽样,比估计与回归估计小结,当Y与X高度相关时,采用比估计和回归估计都是有效的。在选择估计方法时,有以下原则:(1)由于分别估计(分别比或者分别回归估计)要求各层的样本量都比较大,所以当某些层的样本量不够大时,建议采用联合估计。(2)当回归系数需要由样本进行估计时,回归估计是有偏的,尤其当样本量较小的时候,采取联合比估计更好。(3)如果各层的样本量都比较大,每层的比估计或回归估
6、计有效,此时用分别比估计,方差更小。(4)如果各层的样本量不大,各层的Ri差异较小,采用联合估计。(5)如果各层的Ri之间的差别不是太大,而且并不是每层的样本量都相当大,采用联合估计。(6)如果各层的回归系数都接近于1,则可采用差估计。,抽样调查第4章分层抽样,例3(续)已知某公司一般职员及高级管理人员刚进入公司时的工资总额分别为5523965元、2541660元,欲通过抽样调查估计当前该公司职员的工资总额Y。抽样按照一般职员与高管层进行分层随机抽取。一般职员共390人,抽取15人;高管层共84人,抽取10名。调查数据如表。,给出Y的分别回归估计量、联合回归估计以及差估计,同时估计其精度。,估
7、 值 法(一),抽样调查第4章分层抽样,等额样本量,按比例分配,4.3 样本量的分配,奈曼最优分配,考虑费用的最优分配,抽样调查第4章分层抽样,等额样本量,各层的样本量相等,特点:实施方便,便于管理,例1 对各乡收入数据,采用分层抽样,各层采用简单随机抽样,计划抽取8个乡,按照下列样本量分配方式,确定各层的样本量,(1)等额分配,(2)按比例分配,(3)Neyman最优分配,抽样调查第4章分层抽样,按比例分配,若总体总值或均值的一个无偏估计量可以表示成样本总值或均值的常数倍,这种估计量称为自加权估计量,(proportional allocation),适用于Ni已知而其他信息很少的情形,抽样
8、调查第4章分层抽样,奈曼(Neyman)最优分配,抽样调查第4章分层抽样,考虑费用的最优分配,抽样调查第4章分层抽样,例 某市有甲、乙两个地区,现要进行家庭收入的调查。令n=500,已知甲地区共有20000户居民,乙地区共有50000户居民;甲地区和乙地区居民收入标准差估计分别为s1=2500,s2=2000;同时对甲地和乙地每户的平均抽样费用之比为2:3,请分别计算出甲地和乙地进行比例分配、一般最优分配(考虑费用因素)以及奈曼最优分配的样本量。,抽样调查第4章分层抽样,分层抽样的精度,层权误差,4.4 与简单随机抽样之比较,抽样调查第4章分层抽样,分层抽样的精度,=,+,抽样调查第4章分层抽
9、样,层 权 误 差,抽样调查第4章分层抽样,例 题 与 练 习,抽样调查第4章分层抽样,分层的思路,D-H方法,4.5 如何适当分层,抽样调查第4章分层抽样,分层的思路,最小.若采用奈曼最优分配,忽略抽样比,则使,最小.,抽样调查第4章分层抽样,D-H 方 法,Y的概率密度函数,V的近似表达式,抽样调查第4章分层抽样,D-H 方 法,适当的分层界限,为一常数,达到最小值.,抽样调查第4章分层抽样,D-H 方 法,例1 以某地区2001年企业出口数据中截取的904个企业构成的总体为例,说明分层的操作程序.,练习 表列出了美国13435家银行组成的总体内银行贷款中工业贷款占的百分数的频数分布.将1
10、3435家银行分为5层.,分层时一般只能调查与Y相关的辅助变量,很少用到Y本身,因而分层界限值无需十分精细,用辅助变量分层时,辅助变量引起的误差会使分层过细失去意义,经验表明使用五或六个层是适宜的,抽样调查第4章分层抽样,后分层估计,定额抽样,4.6 后分层估计和定额抽样,抽样调查第4章分层抽样,后分层估计,后分层估计的背景,要调查某地区居民对某一问题的意向,以年龄为辅助变量分层,要调查某校学生每月的话费支出,以家庭收入水平为辅助变量分层,现实有些情况下,缺少层内抽样框,无法实施分层抽样,此时可采用后分层估计,后分层估计的含义,对总体实施不分层简单随机抽样,在调查中明确每个样本单元属于哪个层,
11、将全部单元在调查后按分层变量分入各层,按分层抽样估值,抽样调查第4章分层抽样,后分层估计,估值定理,后分层估计的精度低于按比例分层估计的精度,但当n很大时,两者精度差别不大.,抽样调查第4章分层抽样,后分层估计,例 某地市对载货汽车进行调查,调查目标量为当月全地市发生的总运量Y.对总共19730辆货车抽取一个178辆车的样本,由于单车运量与车核定标识吨位(X)密切相关,为提高精度,对样本采用后分层,相关数据如表.估计Y及该估计的精度.,采用后分层应注意“事后层”数目不宜多.,抽样调查第4章分层抽样,定 额 抽 样,定额抽样的含义,适用于有辅助变量用于分层而按此辅助变量分层抽样不现实的情况,按分层比例抽取样本量:抽样过程中简单随机抽样与典型抽样结合,在调查后阶段,调查人员注意控制样本,使各层样本量到达定额,多用于民意测验和市场调查,由于带有典型抽样色彩,无法估计其精度,抽样调查第4章分层抽样,实验名称:分层抽样实例,实验题:估计某中学学生某次期末考试的平均分,以期中考试成绩为辅助变量将该校学生分为5个层,抽取100个样本,采用后分层估计估值,并给出该估计均方偏差的估计值。,抽样调查第4章分层抽样,演讲完毕,谢谢听讲!,再见,see you again,3rew,
链接地址:https://www.31ppt.com/p-3050739.html