第11章抽样方法课件.ppt
《第11章抽样方法课件.ppt》由会员分享,可在线阅读,更多相关《第11章抽样方法课件.ppt(70页珍藏版)》请在三一办公上搜索。
1、,第十一章 抽样方法,1,2,3,4,第一节 抽样概述,一、抽样的重要性,由于研究对象的总体太大或受研究经费、人力和时间的限制,全面调查常常难以做到。为了以较低的成本获得较准确的研究结果,全面调查很多情况下也是不必要的。抽样就是从研究总体中选取一部分代表性样本的方法。,二、调查研究分类,按调查设计的对象分:普查抽样调查 典型调查 按调查涉及的时间分:按调查时间的顺序为:回顾性调查 现况调查 前瞻性调查 从抽取样本的方式分:概率抽样调查非概率抽样调查,三、抽样的基本术语,1总体(population)总体是指所研究对象的全体。组成总体的每个单位称为个体。总体有研究总体和调查总体之分。总体还可分为
2、有限总体和无限总体。2样本(sample)样本与总体相对应,样本是从总体中抽取的一部分元素的集合,是总体中某些单位的子集。,三、抽样的基本术语,3.抽样(sampling)抽样是指从总体抽取部分个体的过程。根据抽样原则的不同,有不同的抽样方法。4.抽样单位(sampling unit)抽样单位是指被抽取样本中的一个或是一组元素,是收集信息的基本单位。总体中的每个个体只属于一个单位。抽样单位和构成总体的元素有时相同,有时不同。,三、抽样的基本术语,5样本含量(sample size)样本含量是指调查抽取的样本所包含观察单位的数目。6.抽样框(sampling frame)抽样框又称做抽样范围,它
3、指的是抽样过程中所包含的所有抽样单位的名单。,三、抽样的基本术语,7.参数值(parameter)关于总体中某一变量的描述指标。8.统计量值(statistic)关于样本中某一变量的描述指标。9.抽样误差(sampling error)抽样误差是指样本统计值与被推断的总体参数值之差。,三、抽样的基本术语,10置信水平(confidence level)也称置信度,是指总体参数值落在样本统计值某一区间内的概率。置信水平反映的是样本统计量的精确度。在样本量相同的情况下,置信水平越高,置信区间越宽。11.置信区间(confidence interval,CI)是指在一定范围的置信水平下,样本统计值与
4、总体参数值之间的误差范围。,四、抽样的过程,1.界定总体 要明确总体的范围、内容和时间。调查研究内容的不同,对总体的限定也会有所不同。2.制定抽样框 根据界定的总体范围,收集总体中全部抽样单位的名单,列出名册或排序编号,以确定总体的抽样范围和结构。3.选择抽样方法,确定抽样的精确性程度与样本规模,四、抽样的过程,4.样本量的估算(1)样本量估算的意义 样本含量过大或过小都有其弊端,确定合适的样本规模是抽样设计中的一项重要内容。(2)样本量估算的依据总体中个体的变异程度精度置信程度(3)样本量的估计方法 常用的有经验法、查表法和计算法。,四、抽样的过程,5.实际抽取样本 在前述步骤的基础上,严格
5、按照所选定的抽样方法和确定的样本量大小,从抽样框中抽取相应的抽样单位,构成调查样本。6.评估样本质量 主要对样本的代表性和偏差等进行评估,评估的主要标准是样本的准确性和精确性。,第二节 常用的抽样方法,一、抽样方法的分类,1.概率抽样(probability sampling)概率抽样又称随机抽样,是按照概率论和数理统计的原理从调查研究的总体中,根据随机原则进行抽样,排除人的主观因素,组成总体的每个单位都有被抽中的概率(非零概率)。等概率抽样单纯随机抽样系统抽样分层抽样整群抽样多阶段抽样按规模成比例抽样不等概率抽样,一、抽样方法的分类,2.非概率抽样(Non-probability sampl
6、ing)非概率抽样又称非随机抽样,主要是依据研究者的主观意愿、判断或是否方便等进行的抽样(非随机的),使得组成总体的很大部分单位没有被抽中的机会(零概率),因此调查很容易出现倾向性偏差。偶遇抽样立意抽样 配额抽样滚雪球抽样同伴推动抽样法,概率抽样和非概率抽样方法的比较,二、概率抽样单纯随机抽样,1.抽样方法:具体做法是将调查总体的全部观察单位编号,按照抽签法或随机数法随机抽取部分观察单位组成样本。(1)抽签法 把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。(2)随机数法 利用随机数字表、随机数骰子或计算
7、机产生的随机数进行抽样。,二、概率抽样单纯随机抽样,优点:操作简单,是最简单的抽样技术,均数(或率)及标准误的计算简便,有标准的统计公式。缺点:总体较大时,难于对总体中的个体一一编号。,二、概率抽样单纯随机抽样,2.单纯随机抽样的样本量的估算方法:(1)连续型变量总体均数估计的样本量 其中:为相对误差,为变异系数,即总体标准差与总体均数之比,二、概率抽样单纯随机抽样,(2)01变量总体概率估计的样本量 采用以下公式进行样本量的计算:其中:为相对误差,为概率P的变异系数:,二、概率抽样系统抽样,又称机械抽样或等距抽样,先将总体的全部观察单位按与研究现象无关的特征顺序排列,并编号,根据需要的样本含
8、量大小,按照事先规定的某种规则抽样。其中最常采用的是等距离抽样,即根据总体单位数和样本含量的要求计算出抽选间隔,然后随机确定起点,每隔相同的间隔机械地依次抽取一个个观察单位组成样本。,二、概率抽样系统抽样,1.抽样方法:(1)先将总体从1N相继编号,并按以下公式计算抽样距离:抽样距离k=N/n(2)确定抽样起点。(3)将抽样起点作为样本的第一个单位,接着取ik、i2k,直至抽够n个单位为止。,二、概率抽样系统抽样,例如:在1000户居民中随机抽取200户作样本,抽样距离为50,随机确定起点为门牌号10,即按10、60、110、160、的门牌号抽取所需观察单位组成样本。,二、概率抽样系统抽样,优
9、点:易于理解,简便易行;抽出的单位在总体中是均匀分布的,且抽取的样本数可少于单纯随机抽样。缺点:是当总体的观察单位按顺序有周期趋势或单调增(或减)趋势时,容易出现周期性偏差,降低样本的代表性。此外,未使用可能有用的抽样框辅助信息抽取样本,可能导致统计效率偏低。,二、概率抽样分层抽样,先将总体全部观察单位按某种特征分为同质的、互不交叉的层(或类型),再从每层(或类型)中独立抽取一定数量的观察单位,将各层次取出的观察单位合在一起组成样本。分层的标准有三种:1.以以调查所要分析和研究的主要变量或与其高度相关的变量作为分层的标准;2.以增加层内的同质性和层间的异质性、突出总体内在结构的变量为分层变量;
10、3.以那些有明显分层区分的变量作为分层变量。,二、概率抽样分层抽样,各层样本数的确定方法:1.分层定比 即按比例分层抽样,根据各种类型或层次中的单位数目占总体单位数目的比重来抽取子样本的方法。各层的样本数与该层总体数的比值相等。2.奈曼法 即各层应抽取的样本数与该层的总体数及其标准差的乘积成正比。3非比例分层抽样 非比例抽样又称分层最佳抽样,是根据各层基本单位标准差的大小,来确定各层样本数目的抽样方法。,二、概率抽样分层抽样,分层抽样的样本量的估算方法:(1)连续型变量总体均数估计的样本量 当各层的抽样比例相等时:或将总样本量按比例分配到各层,权重为各层的相对大小:,二、概率抽样分层抽样,(2
11、)01变量总体概率估计的样本量 其中:为相对误差,为概率P的变异系数:,二、概率抽样整群抽样,整群抽样是先将调查总体按一定标准划分成若干群或集体,然后以群或集体为单位按随机的原则从总体中抽取若干群或集体,并对抽中群的所有单位都进行调查。“群”的大小有一定的相对性,可以是县、乡、镇、村、区等自然区划,也可以是人为划分的一定人群。划分群时,每群的单位数可以相等,也可以不等,但一般相差不要太大。,二、概率抽样整群抽样,整群抽样的步骤:确定分群的标准;将总体按确定的标准分为i个互不重叠的群;根据各样本量,确定应该抽取的群数;采用单纯随机抽样、系统抽样和分层抽样的方法,从i群中抽取确定数量的个体或单元,
12、并对抽中群的所有单位都进行调查。,二、概率抽样整群抽样,优点:简便易行,便于组织,节省费用,容易控制调查质量。缺点:样本分布比较集中,代表性相对较差。在样本例数一定时,其抽样误差大于单纯随机抽样。,二、概率抽样整群抽样,整群抽样的样本量的估算方法:可按单纯随机抽样的计算公式来估算样本量。对于均数或总和的估计,变异系数反映的是群与群间的变异性。其中,是以群为单位X的观察值之间的方差,是以群为单位的均数。,二、概率抽样按规模成比例抽样,按规模成比例抽样PPS是一种使用辅助信息,使得每个单位均有按其规模大小成比例的被抽中概率的一种抽样方式。其特点是规模大的被抽取的机会大,总体中每个个体被抽中的概率与
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第11章 抽样方法课件 11 抽样 方法 课件

链接地址:https://www.31ppt.com/p-2163262.html