第六章抽样方法课件.pptx
,第六章 抽样方法,市场调查理论与方法 主编:徐映梅,学习目的,2,3,2,市场调查理论与方法 主编:徐映梅,理解抽样调查的含义、特点与作用,并掌握重点专用术语,熟悉抽样方案设计程序以及需要考虑的相关问题,理解非概率抽样的含义、优缺点,并掌握其专门方法,理解概率抽样的含义、特点并掌握各种专门方法及适用场景,目录,CONTENTS,3,市场调查理论与方法 主编:徐映梅,4,市场调查理论与方法 主编:徐映梅,抽样调查的含义,一,抽样调查的特点与作用,抽样方案设计程序,抽样调查中的专用术语,二,三,四,CH6-1 抽样方法概述,抽样调查,按照一定程序,从所研究对象的总体中抽取一部分总体单元(样本),对其特征进行调查和观察,并在一定的条件下,运用数理统计的原理和方法对总体的数量特征进行估计与推断的方法技术。,一、抽样调查的含义,5,CH6-1 抽样方法概述,二、抽样调查的特点与作用,6,(一)抽样调查的特点,与全面调查相比,样本量大大减少,从而可以显著地节约人力、物力和财力,对总体中的少量单位进行调查,所以能够比较快地得到调查结果,调查部分总体单位,数目较小,参加调查的人员较精干,登记性调查误差较小,良好的经济性,较高的时效性,较高的准确性,CH6-1 抽样方法概述,二、抽样调查的特点与作用,7,抽样调查的功能,适用于不可能或不必要进行全面调查的社会经济现象的调查,适用于少而精的调查,适用于连续不断的观察,适用于对全面调查进行验证,适用于统计过程控制,(二)抽样调查的作用,CH6-1 抽样方法概述,总体与样本,三、抽样调查中的专用术语,8,放回,总量大,样本单元数比例较小,CH6-1 抽样方法概述,参数:描述总体的特征,通常参数有总体平均数、总体总量、 总体比例等;总体参数客观存在,但却未知,需要通过 调查来获得。,三、抽样调查中的专用术语,9,假设有限总体的单位数为N,要调查的目标变量通常用Y表示,于是其变量值为 , , ,其参数用符号表示如下: 总体总量:= = 总体平均数: = = 总体比例:= = ( 为属性变量),CH6-1 抽样方法概述,三、抽样调查中的专用术语,10,估计量:样本观察值的函数,用它来对总体参数进行估计 估计值:根据具体样本所计算的结果称为估计值,根据估计值 来对总体参数进行估计(点估计),CH6-1 抽样方法概述,抽选概率: 一定的抽样方式下有多少不同的样本可以抽取,某 个具体样本被抽中的概率 。 某个总体单元被选入样本的概率 。抽样比:样本量n与总体N之间的比率,其倒数为扩张系数或权数,三、抽样调查中的专用术语,11,假设有一个总体, N=5(A,B,C,D,E),从中抽取样本n=2,则每个样本被抽中的概率是1/10,而总体单元入样的次数是4次,因此入样概率为4/10=2/5,与抽样比一致。,两重含义,CH6-1 抽样方法概述,三、抽样调查中的专用术语,12,CH6-1 抽样方法概述,抽样分布:样本估计量的分布 ,每一个样本可以计算一个估 计值,这些估计值就会形成一个分布,即抽样分布,抽样误差:抽样调查中由于样本代表性引起的样本估计值与待 估的参数真值之间存在的误差,抽样方差:估计量的方差称为抽样方差。它表示该抽样方案抽 样结果的离差大小 ,平方根称为抽样标准误差,抽样框:提供给抽样用的所有调查单位的详细名单,三、抽样调查中的专用术语,13,识别资料:帮助识别抽样框中每个单元的项目,如姓名、地址、身份证号,联系资料:调查时用来确定总体单元所在位置的项目,例如通信地址或联 系电话,辅助资料:用来分类与维护的资料信息。如果调查的单元是“个人”,则 其性别、年龄和文化程度等都是辅助资料,抽样单元:总体分层的条件下,每层有限个且互不重迭又穷尽 的每个部分,例如,在全国居民生活状况调查中, 各省就是一级单元 。,抽样框内容,CH6-1 抽样方法概述,精确性:抽样中若反复抽样其结果的差别大小,差别越小精确 性越高,反映了估计量抽样误差或抽样方差的大小 精度:相对概念,主要指标有相对标准误和相对方差,三、抽样调查中的专用术语,14,假如待估参数是总体评价数 Y ,它的抽样标准误为 y ,则有: 相对抽样标准误: y Y 相对方差: Y ,CH6-1 抽样方法概述,抽样效率:两个抽样方案在样本量相同情况下的抽样方差之比, 抽样方差小的估计量效率比较高,三、抽样调查中的专用术语,15,一个好的抽样方案要求在固定的费用下使抽样方差尽可能小,或者在满足规定的误差限内使费用最省 。,设计效应:衡量抽样设计方案好坏的一个评价指标,最常用的 一个指标由美国统计学家Kish提出:,= ,CH6-1 抽样方法概述,简单随机抽样设计设计效应 = 1 分层抽样设计效应 1 整群抽样和多阶段抽样设计效应 1,四、抽样方案设计程序,16,抽样方案设计:从总体抽取样本资料以前,预先确定抽样程序和 方案,在保证所抽选的样本对总体有充分代表性 的前提下,力求取得经济、有效的结果。,CH6-1 抽样方法概述,定义总体及抽样单位,确定抽样框,选择抽样技术,确定必要样本量,确定总体目标量估算方法,17,市场调查理论与方法 主编:徐映梅,CH6-2 非概率抽样技术,一、非概率抽样及其优缺点,18,(一)非概率抽样的含义,没有严格的定义,它有许多不同的抽样方法,它们的一个共同特点是用一种主观的(非随机的)方法从总体中抽选单元。主要用于如下研究:用来形成一种想法;作为设计开发概率抽样调查的初始步骤;在后续步骤中帮助理解概率抽样调查结果。,CH6-2 非概率抽样技术,一、非概率抽样及其优缺点,19,(二)非概率抽样的优缺点,优点: 快速简便 费用相对较低 不需要任何抽样框 对探索性研究和调查的 设计开发很有用,缺点:为了对总体进行推断,需要对样本的代表性做很强的假定由于不可能确定总体单元的入样概率,故不可能得到可靠的估计值以及抽样误差的估计值,CH6-2 非概率抽样技术,二、非概率抽样方法,20,(一)方便抽样,假定:总体同质含义:又称偶遇抽样,其样本单元的抽选以调查员方 便的方式进行,几乎没有或完全没有计划。优点:省时、省力,节约费用 。 缺点:容易受到调查员的倾向性影响,且抽样偏差大。,CH6-2 非概率抽样技术,二、非概率抽样方法,21,(二)志愿者抽样,含义:指被调查者都是志愿者的一种抽样方法 适用场景:医学研究中的志愿者招聘 电视主持人邀请听众或观众打电话发表意见缺点:存在选择性偏差,CH6-2 非概率抽样技术,二、非概率抽样方法,22,(三)判断抽样,含义:依据研究者的主观意愿、经验和知识,从总体中 选择具有典型代表性的样本作为调查对象的一种 抽样方法 适用场景:探索性研究缺点:误差大小很大程度上依赖于研究者对调查对象的 了解程度、判断水平以及对结果的解释,CH6-2 非概率抽样技术,二、非概率抽样方法,23,(四)配额抽样,含义:将总体中的所有单位按一定的标志分为若干类(组),然后在 每个类(组)中用方便抽样或判断抽样的方法选取样本单位,独立控制:根据调查总体不同特性,对具有某个特性的调查样本分别规定单独分配数额,不规定必须同时具有两种或两种以上特性的样本数额,交叉控制:对调查对象的特性样本数额进行交叉分配,即复合分组,对每一个控制特性所需分配的样本数都做了具体规定,调查员必须按规定在总体中抽取调查单位,按配额要求,CH6-2 非概率抽样技术,二、非概率抽样方法,24,(五)滚雪球抽样,含义:从一个已知属于目标总体对象的名单开始,访问、 询问他们所知道的该群体中其他人的姓名,再通 过这些人接触更多其余的人,直到没有新的对象 出现为止,或者满足所需要的样本量为止 适用场景:特征稀少、小的、特殊总体,CH6-2 非概率抽样技术,25,市场调查理论与方法 主编:徐映梅,一、概率抽样及其优缺点,26,(一)抽样概率的含义,含义:遵循随机原则从总体中抽选单元组成样本进行调 查的方法 基本准则:样本单元是按随机原则抽取 调查总体中的每一个单元都有一定的概率被抽中,CH6-3 概率抽样技术,一、概率抽样及其优缺点,27,(二)抽样概率的优缺点,优点:能得到总体的可靠估计值并能计算每个估计值的抽样误差,因而能对总体进行推断,缺点:与非概率抽样相比,概率抽样比较复杂、费时,通常也更费钱,CH6-3 概率抽样技术,二、概率抽样方法,28,(一)简单随机抽样,含义:又称纯随机抽样,它是最基本的抽样方式,分为有放 回的抽样和无放回的抽样,假设调查总体共有N个单元,从中随机抽取n个单元作为样本,每一个单元都有同样的机会被抽中,也即有相同的入样概率,这个概率为P,它等于 ,CH6-3 概率抽样技术,二、概率抽样方法,29,简单随机抽样抽取方法,抓阄或抽签、投掷硬币,随机数表,CH6-3 概率抽样技术,如表所示的随机数表法,假定第01行和第85-88列被选为起始点,顺着这个起始点按列方向向下。,二、概率抽样方法,30,简单随机抽样的优缺点,简单直观抽样框不需要其他(辅助)信息就能进行抽样可以利用标准的现成公式,估计的统计效率较其他利用辅助信息的抽样设计要低 费用较高抽出的样本有可能不能很好地代表总体随机数表抽选一个大样本时单调又费时,CH6-3 概率抽样技术,优点,缺点,二、概率抽样方法,31,(二)系统抽样,含义:将研究总体按一定的标志排序后,每隔一定的间隔抽取一个单元直至抽到所需样本量的抽样方法,假设总体共有N个单元,从中随机抽取n个单元作为样本先计算抽样间距k,它等于 ,随机起点r是1到k范围内的一个随机数;被抽中单元的顺序位置分别是:r,r+k,r+2k, ,r+(n-1)k,样本抽取方法,CH6-3 概率抽样技术,二、概率抽样方法,32,系统抽样样本抽取问题:n不能被N整除,解决方法,k取与其最接近的整数,而如果这样做,实际抽到的样本大小就会不一样,使用圆形系统抽样法:把总体单元假想排列在一个圆上,并采用模余数法,随机起点r是1到N范围内的一个随机数,被抽中单元的顺序位置分别是:r,r+k,r+2k, ,r+(n-1)k,如果第j个单位使r+(j-1)kN,则取单元r+(j-1)k-N,CH6-3 概率抽样技术,二、概率抽样方法,33,不同的系统抽样中对称等距抽取样本:塞蒂方法与辛方法比较,CH6-3 概率抽样技术,举例说明,二、概率抽样方法,34,系统抽样的优缺点,优点:没有抽样框时,可以构造一个概念抽样框;不需要辅助的抽样框信息 ; 系统抽样样本的分布比较好; 有较好的理论支持,估计值容易计算;只需要一个随机起点,缺点:抽样间隔正好碰上总体变化的某种未知周期性,形成系统偏误;不使用抽样框中的辅助信息,抽样策略的效率不高;不能预先知道最终样本量;系统抽样的抽样方差有偏;当总体大小不能被样本量整除时需要选用合适的方法。,CH6-3 概率抽样技术,二、概率抽样方法,35,(三)PPS:与单元大小成比例的概率抽样,以抽选农场的例子来说明:一个面积为200公顷的农场被抽入样本的概率,是面积为100公顷农场的两倍。现假定一个总体有六个农场,我们要估计这个农场总体的总支出。,变异性比简单随机抽样要小得多,与实际的支出额947300元都比较接近,CH6-3 概率抽样技术,二、概率抽样方法,36,PPS抽样的方法,(1)随机放回的PPS抽样,接上例,如表所示:,由于是有放回的,因此规模较大的单元,就有可能再次被抽中,该单元入样概率会增加,影响估计的结果。,CH6-3 概率抽样技术,二、概率抽样方法,37,PPS抽样的方法,(2)系统PPS抽样方法,CH6-3 概率抽样技术,二、概率抽样方法,38,PPS抽样的方法,CH6-3 概率抽样技术,(3)随机系统抽样法:名录在系统抽样前要进行随机排序,大于抽样间隔的单元有重复被抽中的可能,估计值抽样方差估计比较困难,可能出现的问题,解决的方案,大单元单设一层独立进行抽样,二、概率抽样方法,39,PPS抽样的优缺点,优点:使用了辅助信息,从而提高了抽样效率,与简单随机抽样相比能显 著地减少抽样误差,缺点:成本高,更复杂 要求高质量的、能使用大小度量的辅助信息 对每一个总体与主要调查变量要求较多,适用范围较窄 与大小变量不相关的调查变量,会降低抽样效率 估计量抽样方差的计算比较复杂 单元大小度量不准确或不稳定时不适用,CH6-3 概率抽样技术,二、概率抽样方法,40,(四)分层抽样:在抽样之前将总体分为同质的、互不重叠的若干子总体,然后 在每一个层中独立地抽取样本,优点:提高对总体估计值的精度 保证样本对被定义为层的那些子总体的代表性 操作与管理方便 能避免得到一个“差的”样本 不同的层中可以使用不同的抽样框和不同的抽样方法,缺点:抽样框中的所有单元,必须有高质量的、能用于分层的辅助变量 对抽样框的要求更高,需要更多的费用 调查变量与分层变量不相关时抽样效率低 估计值的计算比较复杂,CH6-3 概率抽样技术,二、概率抽样方法,41,(五)整群抽样,注:群内单元可以相等, 也可以不等 “群”大致可分为两 类:一类是根据行政、 地域及其他自然形成 的群体,而另一类群 是一个连续总体,CH6-3 概率抽样技术,二、概率抽样方法,42,整群抽样优缺点,优点:费用较低; 创建自然形成群的名录较容易; 一定条件下有较高的抽样效率。,缺点:通常无法提前知道调查总样本量; 群内单元有趋同性,则整群抽样的统计效率降低; 调查的组织比其他方法复杂; 方差估计往往比简单随机抽样更为复杂,CH6-3 概率抽样技术,二、概率抽样方法,43,(六)多阶段抽样,含义:用两个或更多个连续的阶段抽取样本的过程,CH6-3 概率抽样技术,多阶段抽样方法,常见的多阶段抽样是二阶段抽样,常与地域框结合,阶数的选择:阶数越多,设计就越复杂,估计也更复杂,多阶段中的抽样方法选择灵活:对某个第一阶段抽样中的初级抽样单元,第二阶段可采用简单随机抽样,也可采用pps抽样,二、概率抽样方法,44,多阶段抽样优缺点,优点:以调查变量衡量的群特征差异不大时,效率相对较高 ; 采用面访调查的时间和费用都大为降低 ; 不需要有整个总体的名录框 。,缺点:没有简单随机抽样的效率高 ; 通常不能提前知道多阶段抽样的样本量 ; 与单阶段整群抽样相比,调查组织较为复杂 ; 估计值与抽样方差的计算较为复杂,CH6-3 概率抽样技术,二、概率抽样方法,45,(七)多相抽样,优点:显著提高估计值精度; 能用来获得抽样框中所没有的辅助信息; 适用于某些调查指标的数据收集费用特别高,或会给被调查者带 来较重负担的情况,缺点:一般得到整个调查结果的时间比单相调查的时间要长; 所需费用比一相调查要多; 调查的组织比较复杂; 估计值和抽样误差的计算会相当复杂,CH6-3 概率抽样技术,在同一抽样框中,先抽一个含有很多单元的大样本,收集基本的信息,然后在这个大样本中抽一个子样本,收集更详细信息的方法,46,市场调查理论与方法 主编:徐映梅,一、概率抽样与非概率抽样的选择,47,只是了解一些概况或者是正式调查前的预调查,需要对总体进行推断,概率抽样,非概率抽样,CH6-4 抽样设计中需要考虑的几个问题,二、考虑概率抽样时需要合理选择抽样方法,48,结合抽样框的情况和收集数据的方法来决定;是否要求对一个相当大的地理区域进行面访;总体单元是否自然形成群体或是否有此类群体的名录;是否具有辅助信息的抽样框;是否需要作“域估计”,“域”能否在抽样框中确定;如果抽样框缺乏分层的信息也缺乏对总体单元进行筛选的辅助变量,而又打算分层,则考虑二相或多相抽样;如果在搜集的信息中有部分信息收集起来费用比较高,可以考虑采用多相抽样。,选择抽样方法时需要考虑的问题,CH6-4 抽样设计中需要考虑的几个问题,三、重复性抽样调查需要考虑的问题,49,核心问题:固定样本连续调查与抽取一系列独立的样本调查的权衡,优点:减少对变化估计的抽样误差; 能得到被调查者随时间变化的信息; 能减少回答误差; 费用会随时间而减少,缺点:估计与无回答的处理更复杂;需要在较长时间内保证费用; 使样本保持在长时间内的代表性比较困难; 可能会增加回答误差; 回答负担比较重; 组织工作比一次性调查复杂得多; 容易产生诱导性,并会造成某些概念上的模糊; 不得不继续使用 “差”的样本,CH6-4 抽样设计中需要考虑的几个问题,固定样本连续调查,四、敏感性问题的抽样设计,50,随机化的问答(沃纳,1965),提出无关的第二个问题,进行随机化回答,如何针对收入、吸毒、作弊等敏感性问题进行抽样设计?,CH6-4 抽样设计中需要考虑的几个问题,两种有效的处理方法,第六章小结,51,CH6 本章小结,第六章课后作业与实训,市场调查理论与方法 主编:徐映梅,1.理解本章的基本概念2.思考并回答问题,检验学习目的3.组织课后实训,