现场调查中的抽样方法.ppt
《现场调查中的抽样方法.ppt》由会员分享,可在线阅读,更多相关《现场调查中的抽样方法.ppt(75页珍藏版)》请在三一办公上搜索。
1、现场调查中的抽样方法,练习,人群总数10000(男4000人,女6000)分层抽样,男性抽100人,女性抽1000人,共1100人样本中共105人抽烟,其中男性55人,女性50人问:人群总吸烟率是多少?,练习,人群总数10000(男4000人,女6000),抽取样本男100人(55人抽烟),女1000人(50人抽烟)。问:人群总吸烟率是多少?直接算法:总吸烟率=(55+50)/(100+1000)=9.5%正确算法:男4000抽100,每人代表40人(W=40)女6000抽1000,每人代表6人(W=6)总吸烟率=(55*40+50*6)/(100*40+1000*6)=25%,调查的分类,普
2、查(全面调查)典型调查(案例调查)抽样调查,普查 Census,人群中每个人都调查没有抽样误差人群很小时可以使用人群数很大时耗费人、财、物力,质量不易控制,非抽样误差大不适于患病率低和诊断技术比较复杂的疾病无应答率常常较高,典型调查(案例调查),有目的地选定典型的人、单位进行调查,对事物特征作深入了解。没有随机原则,不能估计总体参数,只能对总体特征作经验推论,不属于统计推断的范畴,抽样调查,抽样调查:从总体中抽取一定数量的观察单位组成样本,根据样本信息来了解总体特征。,基本概念,总体:根据研究目的确定的同质观察单位的全体样本:从总体中随机抽取的部分观察单位的总和抽样的目的:用样本信息推断总体特
3、征抽样误差:由抽样造成的样本信息偏离总体参数可计算总体参数的95%可信区间,95%可信区间:以样本信息推论总体时,计算出的可信区间有95%的概率覆盖总体参数。高血压患病率为20%(15%-28%)高血压患病率为18%(4%-51%),X市居民甲状腺结节患病情况调查:在沿海地区、山区、平原地区各随机抽取1个村庄,每个村中再随机抽取100户家庭,每个家庭的全部成员作为调查对象。在某地区的医院进行医院感染情况的抽样调查,抽中40所医院。实施过程中,有些医院不配合。可根据医院特征(如同级、同类、病床数)替换愿意配合的医院。,调查某地区腹泻患病率,采用多阶段抽样方法。第1阶段:兼顾地理位置、经济水平、人
4、口数量、工作基础和意愿,选择A县、B县,C区和D县作为调查点;第2阶段,在某地区进行某病患病率调查,将乡镇按收入水平分层3层(高中低三层分别有150、120、100个乡镇),在每层各抽取10个乡镇,每个乡镇再各随机抽取2个村庄,抽中村庄内居民全部调查。抽样方法设计如何?每个村庄约60人,共调查到2400人,其中240人患病,患病率为多少?,两类抽样方法,非概率抽样:无法确定被调查对象的概率,无法推断总体,常用于探索性研究碰巧抽样或方便抽样:超市里走出的前10个人意图抽样:调查者有意的抽取某些对象,认为能代表某类人群。如:选择一个大城市,一个城镇,一个乡村地区 滚雪球抽样概率抽样:每个个体有一个
5、可计算的非零概率,可计算抽样误差,可推断总体,概率抽样调查 Sample surveys,按一定的概率,在人群中抽取一部分人来调查以样本统计量估计总体参数节省时间、人力、物力,调查可以做得更细致不适用于患病率很低疾病,常用概率抽样的方法,简单随机抽样系统抽样(等距抽样、机械抽样)分层抽样(分类抽样)整群抽样,将总体的全部观察单位编号,再用随机数字等方法随机抽取部分观察单位组成样本例:某中学2100名学生,随机抽200人估计近视率 先将所有学生编号:1,2,3,4,2100 查随机数字表 6394 0710 6376 3587 0304 7988 94 710 76 1487 304 1688
6、注意:8400以上的数字不要 产生随机数字:=rand()=randbetween()随机数字发生器(练习),单纯随机抽样 Simple random sampling(SRS),1,2,3,4,21002101,2102,2103,2104,42004201,4202,4203,4204,63006301,6302,6303,6304,84008401,8402,8403,8404,999910500,1600个数,2100个数,1600个数,500个数,单纯随机抽样,优点:均数(或率)及标准误的计算简单缺点:总体例数多时,需有全部名单,编号,将全部观察单位根据某一顺序编号,计算抽样间隔,随
7、机抽第k号(小于抽样间隔)观察单位,然后依次用相等间隔抽取观察单位组成样本 先将所有学生编号:1,2,3,4,2100 确定抽样间隔:2100/200=10.5(人),取10 在1-10之间随机找一个数字,例如4 依次机械抽取:14,24,34,1994,2004,系统抽样,系统抽样,优点:易于理解,易行样本是均匀分布的,抽样误差小于单纯随机抽样,对样本进行方差估计时,可以将它看成是SRS缺点:当抽样单位的排列有周期趋势时,抽样结果可能有偏差,根据样本量估算,需要抽取该社区1/10的儿童采血检测;每个家庭有门牌号,从1-2000号,单号一排,双号一排。调查者首先用随机数字表从1-10中选一个数
8、字,然后用系统随机方法抽取该街道的1/10有儿童的家庭。这一抽样方法有什么潜在问题?,在农村某地区开展儿童维生素D缺乏调查,分层抽样,按影响较大的某种特征将总体分成若干组(统计上叫做”层”),再从每一层内随机抽取一定数量的观察单位分层变量最好是层间差别大,层内差别小层内样本量分配按比例分配等额分配最优分配按照性别分层,男生和女生每层中随机抽取100名学生,分层抽样,优点:减少抽样误差,分层后增加层内同质性便于对不同的层采取不同的抽样方法,如城乡分层还可对不同层独立进行分析(各层要满足样本量),先将总体分成若干个群,每个群包括若干观察单位,再随机抽取k个群,每个群的全部观察单位组成样本,整群抽样
9、,群间差异越小、抽取的“群”越多,精度越高,样本量确定后,宜增加“群”数而减少群内的观察数 学校共有70个班(各个班级情况相似时比较好)随机抽取20个班(各班人数越少,抽班级数越多越好)20个班级的所有学生都调查,整群抽样,整群抽样,优点:便于组织、节省经费,容易控制调查质量缺点:当样本例数一定时,抽样误差大于单纯随机抽样的误差抽取的群数应尽量多(15个),群数太少抽样误差大,各种抽样方法的方差,分层抽样 系统抽样 单纯随机抽样 整群抽样,设计效力(Design Effect):样本量不变时,实际抽样方法的方差与单纯随机抽样的方差的比值 Ratio of actual variance to
10、variance assuming SRS,given same n DE一般为1.3-3,多阶段抽样,单阶段抽样:四种基本抽样方法都是通过一次抽样产生一个完整的样本多阶段抽样:总体大,情况复杂,分布广,可分若干阶段进行抽样,每个阶段可用上述四种方法中任意一种进行抽样例:在某省进行某项调查:第一阶段:用系统抽样法随机抽取30个县第二阶段:用SRS法每县抽取10个自然村第三阶段:用SRS法每村抽取10名村民,第1阶段为初级抽样单位PSU(primary sampling unit)第2阶段为二级抽样单位SSU(second sampling unit)第3阶段为三级抽样单位TSU(tertiar
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 现场 调查 中的 抽样 方法
链接地址:https://www.31ppt.com/p-5016529.html