抽样调查基本理论框架.ppt
《抽样调查基本理论框架.ppt》由会员分享,可在线阅读,更多相关《抽样调查基本理论框架.ppt(127页珍藏版)》请在三一办公上搜索。
1、抽样调查的基本理论主讲教师 任栋,课前提问,在抽样调查设计时,如何确定样本容量?在抽样调查过程中,如何保证抽样调查项目的质量?抽样调查结束后,如何评价样本数据的可靠性?如何检验样本指标对总体指标的代表性?如何计算抽样调查的抽样误差?,一、什么是抽样调查?,有广义的抽样调查和狭义的抽样调查两种理解广义的抽样调查概念是指:所有的统计非全面调查都可称为抽样调查。即除了随机性的抽样调查方法之外,把重点调查、典型调查、偶遇调查、定额调查、简便调查、判断抽样等方法也认为是抽样调查。这些调查方法在市场调查中广泛应用。,狭义的抽样调查方法,狭义的抽样调查概念认为:只有随机性的抽样调查方法才是抽样调查。随机的(
2、或狭义的)抽样调查方法包括:简单(纯)随机抽样、分层随机抽样、系统(或等距)抽样、整群随机抽样、多阶段随机抽样、多相随机抽样、多期随机抽样等等。事实上,只有随机性的抽样调查才能够从数量上推断总体。因此,在本课程中,我们侧重介绍随机性的抽样调查方法。,统计过程,总体,样本,统计量,计算统计量,抽样,描述,统计推断,抽样技术:理论、技术、经验、工程,明确研究目的,定义总体、抽样单元,选择抽样方案,确定、购置抽样框,确定样本量,制定实施细节和步骤,确定主要目标量的精度,两个基本原则:实现抽样的随机性原则 等概率或不等概率 实现抽样效果最佳原则 固定费用,抽样误差最小 确定精度下,研究费用最小,什么是
3、抽样调查,抽样调查是一种重要的统计非全面调查方法。它是遵循随机原则,采用科学的方法,从总体中抽取一部分单位进行调查,并根据调查结果对总体的数量特征作出具有一定可靠度的推断,从而达到认识总体的一种统计方法。抽样调查既是一种统计调查的方法,又是一种统计推断的方法。中国统计改革制定了“以必要的周期性普查为基础,以经常性的抽样调查为主体,同时辅之以全面统计报表、重点调查和科学推算综合运用的统计调查方法体系”的目标模式。,二、什么是抽样调查的随机原则,所谓随机原则是指在抽选样本单位时,不受如何主观因素和其他系统性因素的影响,从而保证总体中的每一个单位都有一定的可能性被抽中的可能性。随机原则是抽样调查所必
4、须遵循的基本原则。这里所说的排除任何主观因素是指:样本单位的抽取既不取决于调查者的主观意志,也不受被调查者的态度所左右。这里所说的不受其他系统性因素的影响,是指在抽样时,总体应当“拌和”均匀,以免产生系统性的偏误。,随机原则不是“随意性的原则”,也不能简单地理解为“客观性的原则”。抽样的客观性和随机性是随机原则所包含的缺一不可的性质。在抽样调查中,必须坚持随机原则:1、只有坚持随机原则,才能保证抽样的科学性。2、只有坚持随机原则,才能保证所抽样本的分布“类似于”总体的分布。3、坚持随机原则,还要排除其他系统性因素的影响。4、坚持随机原则,并不是绝对排斥人的主观能动性。,三、抽样调查的特点和优越
5、性,1、按随机的原则抽取样本 只有这样,才能保证所抽的样本带来总体的有效信息,才能保证样本对总体具有代表性。2、用样本资料对总体进行推断 这个特点是抽样调查不同于其它非全面调查的主要特点。前面所谈到的非概率抽样,虽然有时也能抽到代表性大的样本,但它不具备推断总体数量特征的条件。3、抽样调查可以计算抽样误差,并且在一定的概率保证下,将估计误差控制在某个范围。,4、抽样调查的优越性(1)用样本推断总体,并计算和控制抽样误差。(2)有很高的时间、人力、物力和财力的价值。(3)具有坚实的理论基础,有高度的客观性和科学性。,抽样调查有什么作用,抽样调查具有其它调查方法无法相比的优点,所以这种调查方法在经
6、济工作、科学技术研究和人们日常生活中都得到了广泛的应用。1、在不可能进行全面调查情况下采用抽样调查法;2、在不必要进行全面调查的情况下,可以采用抽样调查法;3、在来不及进行全面调查时,可以进行抽样调查;4、对全面调查资料进行修正和补充。,抽样调查的基本工作步骤,不同的抽样调查方法有不同的特点,抽样设计也有所不同,但就其工作步骤大致有以下几个环节:第一 确定调查目的和调查对象 抽样调查的目的是整个抽样调查的出发点和归宿,是抽样调查最终要解决的问题。当调查目的确定之后,调查的对象就随之而确定了。它确定了调查人员应该到什么范围内进行调查、搜集信息。所以调查对象就是统计调查所要研究的现象总体。调查对象
7、的确定具体表现为抽样框的确定。,什么是抽样框 抽样框就是指包括全部总体单位的框架,以此代表总体,进行随机抽样,这个框架称为抽样框。抽样框的表现形式有以下三种:第一种是名录框架。即包括全部总体单位的一览表或名录表;第二种是区域框架。即将调查的区域按某种标志分成若干个小区域作为抽样框单位进行抽样;第三种是时间框架。即将一个较长的时间过程分为若干个小的时间单位所形成的抽样框。,第二、确定调查的容许误差和样本容量,抽样调查是一种以部分样本单位来推 断总体的方法,必然存在抽样误差。在进行抽样设计时,应当根据调查任务对抽样准确程度的要求以及若、财、物力等方面的条件,确定抽样调查的容许误差。抽样调查容许误差
8、的大小,与抽样调查的样本容量有着直接的关系。适当的容许误差一经确定,样本容量的大小也就容易确定了。,第三、确定抽样调查的调查项目 在抽样调查中,调查目的和内容需要具体落实在调查的项目上。只有一个调查项目的抽样调查称为单项抽样调查,具有多个调查项目的抽样调查称为多项目(多目标)抽样调查。对于每一个调查项目,要满足定义明确、调查需要和可以取得调查结果这几个方面的条件。,第四、确定抽样的组织方式和方法,不同的抽样组织方式和方法,其所抽样本对总体的代表性的大小是不同的。在抽样设计时,应当在对总体有关情况进行深入分析的基础上,选择适当的抽样组织方式和抽样方法,以提高抽样调查的准确性和可靠性,提高抽样调查
9、的经济效益。,第五、确定调查的其他事项,抽样调查是一项科学的工作,需要进行科学的配套管理。抽样调查还需要具体确定的事项有:调查时间和期限的确定;调查问卷或表式的确定;调查经费和人员的确定;调查组织管理制度的确定等。,抽样调查的误差问题,在统计调查中,误差是一个不可回避的问题。全面调查也存在调查误差,有时可能还会很严重。在各种非全面调查调查方法中,抽样调查方法的优势在于:只有随机抽样调查才能计算抽样误差,而且还可以在一定的条件下控制抽样误差的大小。从理论上看,抽样调查存在着抽样误差和非抽样误差两种类型的误差。,抽样误差的分类,抽样误差抽样调查结果与真实值的差称为抽样调查误差。可分为两类:抽样误差
10、与非抽样误差。抽样误差是指因抽样的随机性而产生的用样本估计总体的代表性误差。在抽样调查中,抽样误差是不可避免的,但是可以计算和控制的。非抽样误差泛指在统计调查的整个过程中,由于调查工作方面的原因而产生的各种误差,有时又把非抽样误差称为工作误差。理论上讲,非抽样误差是可以通过提高工作责任感和业务水平而加以控制的。,抽样误差的概念又可进一步分为抽样平均误差和抽样极限误差这两个概念,抽样平均误差是指所有可能样本的样本指标与所对应的总体指标之间的标准差或称为样本指标的标准差(如平均数或成数)它是一个反映一种抽样方法可能产生的平均的误差大小是衡量抽样方法优劣的标准其理论的计算公式为:,按照理论公式计算抽
11、样平均误差或样本指标的标准差是不现实的。数理统计给出了另一种计算的方式。即样本平均数和成数的标准差可以按如下方式计算:后面我们可以看到,这实际上就是简单随机重复抽样下,样本平均数和样本成数的抽样平均误差。,抽样极限误差,抽样极限误差又称为(最大)容许的误差范围它是样本指标和总体指标离差的绝对值。抽样极限误差等于抽样平均误差与概率度的乘积这是因为,抽样极限误差可以表示为:不难看出,抽样极限误差抽样平均误差的比值,是一个服从标准正态分布的随机变量,即 故有:,影响抽样误差大小的因素主要有,(1)总体各单位之间的差异程度;(2)允许误差(极限误差)的大小;(3)样本容量的大小;(4)抽样组织方式和方
12、法的不同;(5)估计方法的不同。(6)总体容量或抽样比例的大小(7)拒访率的高低,抽样推断的一般问题,概念,抽样推断是抽样调查的基础上,利用样本的实际资料计算样本指标。并据以推算总体相应数量特征的一种统计方法。,特点,1、抽样推断是由部分推算整体的一种认识方法。2、抽样推断是建立在随机取样的基础上。3、抽样推断是运用概率估计的方法。4、抽样推断的误差可以事先计算并加以控制。,内容,1、参数估计2、假设检验,几对基本概念,总体和样本,总体,样本,(全及总体)所研究的对象用“N”表示(它是确定的,唯一的),(子样)指随机抽取的一部分单位的集合体。用“n”表示(它是不确定的可变的),参数和统计量,参
13、数,1、它是反映总体综合数量特征的指标。2、数量标志,表现为总体平均数用“”表示。总体方差:“”表示3、品质标志:用成数表示,具有某种性质用“P”表示:不具有某种性质用“Q”表示式:(成数的平均数就是其本身),统计量,1、根据样本各单位标志值或属性计算的综合指标称为样本统计量,2、常用的样本指标,1、样本平均数 2、样本方差,3、样本标准差,4、成数平均数,5、成数方差,样本容量和样本个数,样本容量,1、一个样本。所包含的单位数是多少2、样本容量超过30个,即 称为大样本3、样本容量小于30个,即 n30 称为小样本,样本个数,指从总体中可能抽取的样本个数。一个总体中有多少个样本,则统计量就有
14、多少个了取值,重复抽样和不重复抽样,重复抽样,每次抽取一个单位把结果登记下来又重新放回,参加下一次抽选,不重复抽样,每次抽出一个单位就不再放回去,不参加下一次抽选。,抽样误差,概念,抽样误差是指由于随机的偶然因素使样本各单位的结构不是以代表总体各单位的结构而引起抽样指标与 全及指标之标之间的绝对离差。,影响因素,1、总体各单位标志值的差异程度;2、样本的单位数;3、抽样的方法;4、抽样的组织形式,抽样平均误差,1、反映抽样误差的一般水平的指标。代表平均数的平均误差。代表成数的抽样误差,2、抽样平均数的平均误差,重复抽样,不重复抽样,抽样成数的平均误差,重复抽样,不重复抽样,抽样极限误差,1、反
15、映样本指标与总体指标之间抽样误差的一种可能范围,2、平均数极限误差,3、成数极限误差,4、为置信间。总长度为 或,抽样误差的概率度,1、概率度指抽样误差的可靠程度,用“t”表示,2、平均数的概率度,3、成数的概率度,三者的关系,1、平均误差:是衡量误差范围的尺度(准确度),2、极限误差:表示抽样估计准确度的范围。(可能范围),3、概率度:“t”表示抽样误差的可靠程度(把握程度),即:误差范围为平均误差的多少倍。在抽样平均误差一定的条件下,t值越大,极限误差范围越大,样本指标的可靠程度就越高,否则相反,总体参数的点估计,概念,1、根据总体指标的结构形式设计样本指标作为总体参数的估计量,并以样本指
16、标的实际值直接作为相应总体参数的估计值。,2、平均数的估计值:,3、成数的估计值:,估计标准,1、无偏性:即以抽样指标估计总体指标要求抽样指标值的平均数等于被估计的总体指标值本身,2、一致性:以抽样指标估计总体指标要求,当样本的单位数充分大时,抽样指标也充分地靠近总体指标。,3、有效性:以抽样指标估计总体指标要求作为优良的估计量的方差应该比其他估计量的方差小。,估计精度,1、抽样极限误差 是指抽样平均数与总体平均数离差的绝对值。但同一数值对于不同的现象可能具有完全不同的意义,绝对值后边掩盖着不平等。,2、利用相对误差(误差率)来表示误差范围,就可以解决这个问题。,3、误差率,4、估计精度=1误
17、差率,估计置信度,1、抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。,2、现论证明:在样本单位数足够多的条件下,抽样平均数的分布接近于正态分布。即:抽样平均数的正误差和负误差可能相等。3、抽样误差的概率度用“t”表示。,总体参数的区间估计,概念,根据给定的概率保证程度的要求,利用实际抽样资料,指出总体被估计值的上限和下限,即指出总体参数可能存在的区间范围。,具备条件,1、估计值。用抽样平均数或抽样成数代替。2、抽样误差范围。3、概率保证程度。,计算方法,给定误差范围,求保证程度:F(t),1、计算样本平均数或成数作为总体的估计值。2、计算样本标准差和抽样平均误差
18、。3、根据给定的极限误差范围 或 估计总体的置信区间,4、计算概率度,5、根据概率度“t”值,求出相应的保证程度,给定置信度F(t)求极限误差的可能范围,1、计算样本平均数或成数,作为总体的估计值。2、计算样本标准差和抽样平均误差。3、根据给定的置信度F(t)的要求,求出概率度“t”值。4、计算抽样极限误差的可能范围,找出总体估计值的上限和下限。5、对总体参数作出区间估计,例1、对某型号的电子元件进行耐用性能检查,抽查的资料分组列表如下,要求耐用时数的允许误差范围 小时,试估计该批电子元件的平均耐用时数。,解:1、计算样本平均数,2、计算标准差,3、抽样平均误差,4、根据给定的误差范围 小时,
19、计算置信区间,,5、计算“t”值。求得置信度F(t),6、做出区间估计。以概率为95.45%的保证程度,该批电子元件的耐用时数在10451066小时之间,例2、对某城市进行居民家计调查,随机抽取400户居民,调查结果得出年平均每户耐用消费品支出为850元,标准差为200元,要求以95%的概率保证程度,估计该城市居民每户年平均耐用消费品的支出额。,解:1、计算样本平均数 2、计算标准差,3、计算平均误差,4、根据给定的置信度F=(t)=95%.求“t”值查表.t=1.96,5、计算抽样极限误差和总体平均数的上下限,6、对总体参数作出区间估计 以95%的概率保证程度,估计该城市居民户家庭年平均每户
20、耐用消费品支出在830.4869.6元之间,抽样数目的确定,确定原则,在保证预期的抽样推断可靠程度的要求下,抽取样本的单位数不宜过多。,影响因素,1、总体被研究标志的变异程度;2、允许误差的大小,即“”的大小;3、可靠程度的高低,即“t”值的大小;4、抽样方法与组织形式;5、人、财、物的允许条件。,抽样数目的计算,重复抽样,不重复抽样,平均数必要抽样数目的公式:成数必要抽样数目的公式:,平均数必要抽样数目的公式:成数必要抽样数目的公式:,例1、对某型号电子元件10000只进行耐用性能检查,根据以往测定,求得耐用时数的标准差为600小时,在重复抽样条件下,概率保证程度为68.27%。元件平均耐用
21、时数的误差范围不超过150小时,问要抽取多少个元件做检查?,解:1、重复抽样条件下:,2、不重复抽样条件下:,例2、根据以往的经验,元件的合格率为95%,合格率的标准差为21.8%,要求在99.73%的概率保证下,允许误差不超过4%,试确定所要抽取的元件数目是多少?,解:1、重复抽样条件下:,2、不重复抽样条件下:,调查费用包括调查的组织费用、调查人员的差旅费、每次采访的费用(或邮寄的费用)、资料的印刷费用、汇编费用、检查观测费用等等,它是抽样调查的组织者必须面对的一个问题。抽样调查费用的多少可以决定样本容量的大小和抽样方式。,样本容量和调查费用的确定,样本容量是抽样调查方案设计工作中要解决的
22、主要问题之一。对于几种基本的抽样方式,能借助总体的一些已知资料求出在给定抽样误差范围时的样本容量,或者在对费用函数的一些经验假设下求出给定费用时使抽样误差达到最小的样本容量。对于较为复杂的抽样组织方式,求最小的样本容量就比较麻烦,有时甚至不可能。因此,只好借助于基本抽样方式用变通方法来解决。常用的方法是:,先计算复杂抽样设计的设计效应系数deff,其公式为:然后求出简单随机抽样的样本容量,则:复杂抽样的样本容量 简单随机抽样的样本容量deff,3、总体比例 即总体中具有某种特征或属性A的单位数 在总体容量中所占的比重:或记为:这里,Y=1表示该总体单位具有特征A,Y=0表示该总体单位不具有特征
23、A,4、总体比率,即同一总体两个不同的总值指标或平均指标之比率。记为:5、总体分位数 例如全国家庭人均收入的5、10、50、90、95的分位数。6、总体方差和标准差,非抽样误差的分类,(1)设计误差;(2)回答误差;(3)调查登记误差;(4)计算整理误差;(5)系统性偏差。,样本量的确定,涉及到的一些基本概念:费用 精度 误差 标准差(方差)置信度(置信水平)最大容许误差 最大容许相对误差 所要估计总体的比例 总体大小 抽样方法 访问方法 拒访率,非抽样误差,非抽样误差会对调查估计值的精度产生显著的影响非抽样误差的大小与样本容量的大小却没有很大的关系确定样本容量,就不必将这些误差作为影响因素加
24、以考虑为确保调查结果的准确性,应该消除非抽样误差,至少应尽可能使之最小化,抽样技术:理论、技术、经验、工程,明确调查目的,定义总体、抽样单元,选择抽样方案,确定、购置抽样框,确定样本量,制定实施细节和步骤,确定主要目标量的精度,两个基本原则:实现抽样的随机性原则 等概率或不等概率 实现抽样效果最佳原则 固定费用,抽样误差最小 确定精度下,调查费用最小,第三章 简单随机抽样,31简单随机抽样概述简单随机抽样的概念 简单随机抽样也叫纯随机抽样。它是不作任何加工处理,按完全随机的原则,从总体中抽取部分单位,保证总体的每个单位都有同等的被抽中的可能性的抽样调查方法。简单随机抽样是一种最简单、同时也是一
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样调查 基本理论 框架

链接地址:https://www.31ppt.com/p-6387817.html