《统计基础知识》第七章 抽样调查基础知识.ppt
,第七章 抽样调查基础知识,第七章 抽样调查基础知识,第一节 抽样调查概念、特点及分类第二节 抽样推断的几个基本概念第三节 抽样误差第四节 参数估计第五节 样本单位数的确定,一、抽样调查的概念与特点(一)抽样调查的概念 抽样调查是从研究的总体中按随机原则抽取部分单位作为样本进行观察研究,并根据这部分单位的调查结果来推断总体,以达到认识总体的一种统计调查方法。抽样调查又称为概率抽样或随机抽样。,第一节 抽样调查概念、特点及分类,随机原则:在抽取调查单位时,完全排除人为的主观因素影响,保证每一个调查单位都有相等的中选可能的原则。,(二)抽样调查的特点*(1)按照随机原则抽取样本;(2)根据样本的资料推断总体的数值;(3)费用低;(4)时效性强;(5)抽样调查有时是唯一的选择。,二、抽样调查的种类(一)非概率抽样 用主观方法从总体中抽选单位进行调查。包括随意抽样、志愿者抽样、判断抽样、配额抽样。1、随意抽样 单位的抽选以无目的、随意的方式进行,几乎没有或完全没有计划。2、志愿者抽样 被调查单位都是自愿参加接受调查,即都是志愿者。,3、判断抽样 选择一些很了解总体的专家来决定总体中哪些单位被抽中作为样本。4、配额抽样 先根据总体的某些特征将总体划分为若干组(或类),然后根据各组(或类)在总体中的比重来分配样本单位数额,最后根据调查者的主观判断从各组(或类)中抽取配额内的样本单位。,(二)概率抽样*概率抽样在抽取样本单位时不带有任何倾向性,它通过从总体中随机抽选单位来避免这种偏差,因而对总体的推断更具有代表性。两条基本准则:(1)样本单位按随机原则抽取;(2)总体中的每个单位都有被抽中的可能性。,1、重复抽样与不重复抽样*重复抽样:从总体N个单位中随机抽取样本容量为n的样本,每次从总体中抽取一个,连续进行n次实验构成抽样样本。每次抽出一个单位把结果登记下来又放回,重新参加下一次的抽选。不重复抽样:从总体N个单位中随机抽取容量为n的样本,每次从总体中抽取一个,连续进行n次实验构成抽样样本。但每次抽选出的单位就不再放回参加下一次抽选。,2、常用的抽样组织形式*(1)简单随机抽样*在总体N中不加任何分组、划类、排队等,完全随机抽取n个调查单位作为样本。(直接从总体N个单位中随机抽取n个单位作为样本。)(2)系统随机抽样 也称机械抽样或等距抽样。将总体各单位按某一标志进行排队,然后依一定顺序和间隔抽取样本单位的一种抽样组织形式。,(3)分层随机抽样 又称为类型随机抽样。它是按照某一标志,先将总体分成若干组(类),其中每一组(类)称为一层,再在层内按简单随机抽样方法进行抽样。(4)整群随机抽样 将总体各单位划分为许多群,然后随机抽取部分群,对中选群的所有单位进行全面调查的抽样组织形式。,(5)多阶段抽样 用两个或更多个连续的阶段抽取样本的过程。(6)与大小成比例的抽样 是一种使用辅助信息从而使入样概率不相等的抽样技术。,一、总体和样本 1、总体 也称全及总体,指所要认识的研究对象全体,由具有某种共同性质许多单位组成的集合体,一般用N表示。无限总体、有限总体 2、样本 又称子样,是从全及总体中随机抽取出来,作为代表这一总体的那部分单位组成的集合体,一般用n表示。,总 体,样 本,第二节 抽样推断的几个基本概念,二、总体指标和样本指标1、总体指标 根据总体各单位的标志值或标志特征计算的,反映总体数量特征的综合指标,又称总体参数。,常用的总体参数有总体均值、总体成数P、总体方差、(或标准差、),2、样本指标*根据样本各单位标志值或标志属性计算的综合指标。,某学校进行一次英语测验,为了了解学生的考试情况,随机抽选部分学生进行调查,所得资料如下:,求样本中成绩在80分以上的学生所占的比重及样本的平均成绩。,样本中考试成绩在80分以上的学生比重,解:样本学生的平均成绩,第三节 抽样误差,一、抽样误差的概念(一)代表性误差 在抽样调查中,用部分样本推断总体时,由于样本各单位的结构情况不足以代表总体的状况而产生的误差。系统性代表性误差 偶然性代表性误差(随机误差),系统性代表性误差可以防止或避免,偶然性代表性误差不可避免,只能加以控制。*,(二)抽样平均误差 反映抽样误差一般水平的指标。是所有可能出现的样本指标和总体指标的平均离差(三)影响抽样误差大小的因素:*(1)总体各单位标志值的差异程度;(2)样本单位数;(3)抽样方法;(4)抽样组织形式。,二、抽样平均误差的计算1、抽样平均数的平均误差,也可称为抽样平均数的标准差。(1)重复抽样情况下,(2)在不重复抽样的情况下,2、抽样成数的平均误差(1)在重复抽样下,P:总体成数n:样本单位数,3、总体方差未知时的解决办法(1)用样本方差代替;(2)用过去调查的资料代替;(3)用估计资料代替;(4)用小规模试验性调查资料代替。,三、抽样误差的允许范围1、抽样极限误差 指变动的抽样指标与确定的总体指标之间离差的可能范围,统计上称为抽样极限误差。,2、抽样误差范围估计的可靠程度,3、极限误差的计算,第四节 参数估计,一、总体参数的点估计 根据总体指标的结构形式设计样本指标作为总体参数的估计量,并以样本指标的实际值直接作为相应总体参数的估计值,即直接以样本平均数、成数推断总体的平均数和成数。,二、总体参数的区间估计 对于总体的被估计值(总体参数)X,找出两个数值 使被估计指标X落在区间 内的概率 为已知的。(用一个具有一定可靠程度的区间范围来估计总体参数),某城市某街道所管辖的10000户居民中,用单纯随机重复抽样方法抽取200户,对某种商品的平均需求量和需求倾向进行调查,调查结果表明,每户居民对该商品的月平均需求量为500克,标准差为100克,表示一年内不选择其他替代商品,继续消费该商品的居民户为90,试对总体平均数,总体成数进行区间估计。,(1)当置信度85时,该街道10000户居民表示继续消费该商品的居民户占8793,估计的置信度为85,(2)当置信度95时,,该街道10000户居民对该商品需求量为486.1513.9克,置信度为95,总体参数的区间估计的三要素是:估计值、抽样误差范围、概率保证程度。,该街道10000户居民表示继续消费该商品的居民户占86.193.9,置信度为95.,第五节 样本单位数的确定,一、影响样本单位数的几个主要因素(一)抽样推断的可靠程度(二)总体标志的变异程度(三)极限误差的大小(四)抽样方法与抽样组织形式(五)人力、物力和财力的可能条件二、必要抽样单位数目的计算,a.在重复抽样下,由于样本平均数的抽样极限误差公式为:,b.在不重复抽样下,由于样本平均数的抽样极限误差公式为:,c.在重复抽样下,由于样本成数的抽样极限误差公式为,d.在不重复抽样下,由于样本成数的抽样极限误差公式为,练习题,一、单选题1、下列属于抽样调查的是()。A、经济普查 B、人口普查C、农业普查 D、1人口调查2、下列属于概率抽样的是()。A、志愿者抽样 B、判断抽样C、随意抽样 D、简单随机抽样3、某校高三年级学生共1000人参加考试,将1000份试卷编好号码后,从中随机抽取30份计算平均成绩,此种抽样方法为()。A、简单随机抽样 B、系统随机抽样C、分层随机抽样 D、整群抽样,4、为获得某批日光灯产品平均寿命数据,现随机从中抽取100件产品,测得平均寿命为2000小时,则样本平均数为()。A、100小时 B、2000小时C、1900小时 D、2100小时5、某商品的100件样品中,测得的优质品为98件,则样本优质品成数为()。A、100 B、98C、2 D、无法计算,6、在其他条件不变的情况下,抽样误差()。A、与样本单位数目无关B、不受抽样组织方式的影响C、与总体标志变异程度成正比D、不受抽样方法不同的影响7、影响样本单位数的主要因素为();总体标志变异程度;极限误差的大小;抽样方法与组织方式的不同;人力、物力、财力的可能条件。A、总体单位的分布 B、总体单位的个数C、时间期限 D、抽样推断的可靠程度,二、多选题1、抽样调查具有的特点有()。A、总体中每个单位被抽中的机会不等B、抽样调查存在一定抽样误差,误差范围可以计算但难以控制C、在时间紧急的情况下,不可能采用普查方法,抽样调查时效性强D、与普查相比,可节省调查费用E、对一些产品进行破坏试验以检验总体的性能时,只能采取抽样调查,2、影响抽样误差的因素有()。A、样本单位数 B、总体标志变异程度C、投入经费大小 D、抽样方法E、抽样组织方式,三、判断题1、有些调查必须也只能使用抽样调查。()2、抽样调查是从总体中按随机原则抽取部分单位作为样本,进行观察研究,并根据这部分单位的调查结果来推断总体,以达到认识总体的一种统计调查方法。()4、重复抽样情况下,总体单位数在每一次抽取时都是相同的。(),