抽样调查设计ppt课件.ppt
抽样调查设计,目 录,第一节 抽样调查的概念及程序第二节 概率抽样调查第三节 非概率抽样调查第四节 样本单位数的确定第五节 调查误差及其控制,一、抽样调查的概念抽样调查指根据某种既定规则从总体中选取一部分单位进行调查,依此来说明或推断总体的特征。按照抽取样本方法的不同,抽样调查可以分为概率抽样和非概率抽样,第一节 抽样调查的概念及程序,1、界定总体2、编制抽样框3、选择抽样方法4、确定样本容量5、实际抽取样本,二、抽样的基本程序,第一节,按照随机原则,从总体中抽取一定数目的单位作为样本,用样本数据来推断总体数量的特征,并控制抽样误差。 纯随机抽样分层抽样等距抽样整群抽样,第二节 概率抽样调查,1、概念:对所研究总体中的所有单位,不进行分组或排队,随机地从其中抽取一定数目的单位进行调查。如抽签法、随机数字表法等。 2、特点:符合随机原则,是抽样调查的基本形式。 适用于规模不大、各单位标志值差异较小的总体。,一、纯随机抽样,1、概念:将总体分组(类)后,在各类中随机抽取一定数目的单位构成样本。2、样本单位的分配方法: A 、等比例分配法:ni/n=Ni/N B 、不等比例分配法,二、类型抽样(分层抽样),1、概念:将总体单位按某一顺序排列,然后按照固定顺序和相等的间隔,从中抽取样本单位的一种抽样组织方式。 2、类型:根据排队标志,分为按照有关标志排队和按 照无关标志排队两种,三、等距抽样(系统抽样),抽样方法有: A、随机起点等距抽样 B、半距起点等距抽样 C、对称等距抽样,三、等距抽样(系统抽样),1、概念: 将总体单位划分为若干群,然后以群为单位抽取样本单位,对抽中群的所有单位进行全面调查。 2、特点: 整群抽样的优点是组织工作方便,但可能出现较大的误差。,四、整群抽样,概念:从总体中非随机地选择部分单位构成样本,说明总体的特征。常用的非概率抽样有方便抽样、判断抽样、配额抽样、滚雪球抽样等。,第三节 非概率抽样调查,非概率抽样的特点: 1、没有按随机抽样原则抽取样本,所以失去了大数定律的存在基础,无法判断样本代表性的大小; 2、虽然根据样本调查的结果也可在一定程度上说明总体的特征,但不能推算总体。,第三节 非概率抽样调查,第三节 非概率抽样调查,非概率抽样的应用:受客观条件限制,无法实行概率抽样调查的。尽快取得调查数据,提高时效性。一般来讲,非概率抽样比概率抽样用的时间少。节约调查成本。适用于准确性要求不高的调查。探索性调查往往采用这种方式。 总体各单位间差异不大,且相关的调查人员具有丰富的抽样调查经验。,一、方便抽样,方便抽样是根据调查者的方便,以无目标、随意的方式进行的抽样调查活动。例如,常见的街头拦访和随意的入户访问就是方便抽样的常见形式。在某些调查测试中,方便抽样会取得快速有效的结果。在进行探索性调研时,即缺乏经验而又急需真实数据的近似值时,这种方法也很实用。,二、判断抽样(立意抽样),基于调查人员的经验和知识,依据对总体有关特征及实际情况的了解,从目标总体中抽选有代表性的单位作为样本单位,或由了解情况的专家圈定样本的一种抽样组织形式。样本的代表性取决于研究者对总体的了解程度和判断能力。当研究者对自己的研究领域十分熟悉,对研究总体比较了解时采用这种抽样方式,可获得代表性较高的样本。,三、配额抽样(定额抽样),将总体依某种标准分层(群),然后按照各层样本数与该层总体数成比例的原则主观抽取样本。配额抽样与分层概率抽样很接近,最大的不同是分层概率抽样的各层样本是随机抽取的,而定额抽样的各层样本是非随机的。,三、配额抽样,进行配额抽样时,研究者要尽可能地依据那些有可能影响研究变量的各种因素来对总体分层,并找出具有各种不同特征的成员在总体中所占的比例。然后依据这种划分以及各类成员的比例去选择调查对象,使样本中的成员在上述各种因素、各种特征方面的构成和在样本的比例尽量接近总体情形。,配额抽样法的基本步骤 A、选择控制特性作为分层标准 B、分层 C、确定各层样本单位数 D、配额指派,三、配额抽样,三、配额抽样,配额抽样根据其抽样方法可以分为: 1、独立控制配额抽样 2、 交叉控制配额抽样 3、最佳比例配额抽样,1、独立控制配额抽样,例如,某市进行空调器消费需求调查,确定样本容量为200名,分别选择消费者收入、年龄、性别三个标准为控制特征进行独立控制配额抽样,其各个样本配额比例及配额数如下表所示。,1、独立控制配额抽样,2、交叉控制配额抽样,以年龄、性别与收入水平作为交叉控制因素进行配额抽样的样本配额分布,3、最佳比例配额抽样,在将总体分类定额抽样时,不仅要依据各类在总体中的比重,还考虑到总体各类标准差的大小。其样本单位数在各类中的定额公式为:,四、滚雪球抽样,以若干个具有所需特征的人为最初的调查单位,然后依靠他们提供认识的合格的调查单位,再由这些人提供第三批调查单位,依此类推,样本如同滚雪球般由小变大。滚雪球抽样多用于总体单位的信息不足的情况。这种抽样中有些个体最后仍无法找到,有些个体被提供者漏而不提,两者都可能造成误差。,滚雪球抽样调查的优点是调查费用大大减少,然而这种成本的节约是以调查质量的降低为代价的。整个样本很可能出现偏差,因为那些个体的名单来源于那些最初调查过的人,而他们之间可能十分相似,因此,样本可能不能很好地代表整个总体。另外,如果被调查者不愿意提供人员来接受调查,那么这种方法就会受阻。,四、滚雪球抽样,第四节 样本单位数的确定,样本单位数的确定方法:公式法经验法,一、公式法计算样本单位数,样本单位数的影响因素: 1、被研究总体的标志变动度 2、允许的误差范围(抽样极限误差) 3、抽样推断的可信程度 4、不同的抽样组织方式和方法,一、公式法计算样本单位数,纯随机抽样条件下:,二、经验法确定样本单位数,根据抽样调查的经验,得出针对不同规模的总体,样本单位数占总体的比重经验数,供抽样调查抽取样本时参考。 由于它是根据多次成功的抽样调查总结出的经验,所以具有较高的参考价值,但只是为调查者提供了一个样本单位数的范围,在应用时还必须根据市场调查的具体要求和总体的具体情况,确定样本单位数。,二、经验法确定样本单位数,经验确定样本单位数的范围,二、经验法确定样本单位数,由经验确定样本单位数,一般多用于非随机抽样;在随机抽样中应用公式计算样本单位数更为科学,当然,在随机抽样中把经验作为参考也是可以的。,第五节 调查误差及其控制,调查误差的概念调查误差的分类调查误差的控制,一、调查误差的概念,调查误差:调查所得结果与真实数据之间的差异 。 误差的大小体现了调查的准确性。,二、调查误差的分类,抽样误差非抽样误差,(一)抽样误差,抽样误差:是样本调查结果与使用相同程序进行全面调查的结果之间的差异。换言之,抽样误差是指根据样本数值来估计总体特征所引起的误差。,(一)抽样误差,抽样误差的影响因素:样本容量;总体单位标志值的差异程度;抽样方式;抽样方法。,(二)非抽样误差,非抽样误差:是指除抽样之外的几乎所有调查活动过程中所产生的误差。 非抽样误差主要是由于研究设计以及调研执行中的缺憾而导致的。,非抽样误差的分类,1、设计误差,设计误差主要是指由于调研设计不周密或者所开发调研技术不适当所引起的一类非抽样误差。设计误差最有可能造成调研结果的系统性偏差,对整个调研数据质量的影响也最为深远。,1、设计误差,设计误差按照来源大致分为:替代信息误差总体定义误差抽样框误差调查方法误差测量工具误差,2、现场访员误差,指由于访员过失或主观故意而没有完全遵照设计要求执行而产生的误差。访员误差主要包括:现场选样误差提问误差:访问人员没有按照问卷中 的措辞来提问记录误差:在听、理解和记录被访问人员的回答时造成的误差欺骗误差:伪造调查数据,3、现场应答者误差,指由于应答者误解、不愿回答、不能回答等原因而不能客观、真实地回答调查的部分或全部问题而导致的误差。应答者误差主要包括:误解误差无能力回答误差不愿意回答误差无回答误差,4、数据处理误差,数据处理误差可能发生在数据编码、数据录入、审核及插补的任何步骤之中。数据处理误差可能包括:数据编码误差:编码错误引起的误差。数据录入误差:数据没能准确地录入。审核和插补误差:由于审核和插补的程序未经充分测试。,三、调查误差的控制,非抽样误差所导致调研结果的偏倚不会随样本量的增大而减少,相反,会随着样本量的增大而增大。非抽样误差带来的损失非常大,而且要测量也很困难,因此,在抽样调查数据质量管理活动中,非抽样误差成为调查误差控制的主要对象。,三、调查误差的控制,非抽样误差的控制策略:在调查设计和开发阶段,应尽力预测可能发生的调查误差并采取适当措施加以避免。在调查实施阶段,应该使用质量控制技术对调查误差加以控制,使其达到最小。,三、调查误差的控制, 严谨的计划; 进行可行性研究; 进行试调查; 对访员、数据录入人员和编码员等培训; 改进抽样框; 改进问卷设计; 调整数据收集方法; 优化追踪回访方法; 改善数据处理程序; 对调查活动的重要数据进行即时核查。,Thank You !,