抽样方案的制作.ppt
《抽样方案的制作.ppt》由会员分享,可在线阅读,更多相关《抽样方案的制作.ppt(56页珍藏版)》请在三一办公上搜索。
1、能力单元三:抽样方案的制作,学习目标:1、掌握不同的抽样方法及其适用条件2、培养抽样方案制作能力,开篇案例,我们知道,近几十年来,美国总统大选前夕,总有一些民意测验机构喜欢对总统选择投票的结果进行预测。1936年美国总统选举前夕,盖洛普民意测验所仅仅调查了3000人,就成功地预测了民主党人罗斯福将当选为美国的新一任总统。1984年这家民意测验机构又一次成功地预测了罗纳得里根将以59%比41%的优势战胜蒙代尔而当选为美国的新一任总统。这一预测结果与实际投票结果(59%:41%)相一致。而当时盖洛普民意测验所在将近1亿美国选民中,调查的对象还不到2000人。,1,2,3,4,第四章 抽样,一、抽样
2、的有关术语1、总体(Population)(此指调查总体)(在社会调查中用N表示)通常与构成的元素共同定义,总体是构成它的所有元素的集合,而元素则是构成总体的基本单位。(1)研究总体:是在理论上明确界定的个体(分析单位)集合体。(是理论上的总体)(2)调查总体:是研究者实际抽样样本的个体(分析单位)的集合体。(是实际操作中的总体)二者不同:研究总体是我们概念上的,而调查总体是我们实际抽取样本的集合。二者关系:调查总体应当无限趋近直至等于研究总体。如:开展对某省大学生择业倾向调查时,该省所有在校大学生的集合就是研究总体,每个在校大学生就是构成总体的元素。该省所有在册大学生则构成调查总体。2、样本
3、(Sample)(社会调查中用n表示)是从调查总体中按一定方式抽取出来的那一部分代表的集合体。,第四章 抽样,3.抽样(Sampling)是一种选择调查对象的程序与方法,即从总体中选取一部分代表的过程,也即从总体中按一定方式选择或抽取样本的过程。如:从某省总数为10万人的大学生总体中按照一定方式抽取出1000名大学生进行调查,这1000名大学生就是构成总体的一个样本。(从一个总体中可以抽取出若干个不同的样本)4.抽样单位(Sampling Unit)一次直接的抽样所使用的基本单位。抽样单位和构成总体的元素有时相同,有时不同。5.抽样框(Sampling Frame)也称抽样范围,指抽取样本的所
4、有抽样单位的名单。如:从某所大学全体学生中直接抽取200名学生作为样本该校全体学生的名单 从某一所大学所有班级中抽取3个班级作为样本该校所有班级的名单,第四章 抽样,6.参数值(Parameter)也称总体值,是关于总体中某一变量的综合描述。如:某厂职工的平均收入、平均年龄7.统计值(Statistic)也称样本值,是关于样本中某一变量的综合描述。如:某厂职工中抽取出一部分,得到的平均收入、平均年龄参数值与统计值之间的区别与联系:(1)参数值是确定不变的、唯一的,并且通常是未知的。(2)统计值则是变化的,即对于同一个总体来说,不同样本所得到的统计值常常是有差别的;对于某一个特定的样本来说,统计
5、值是已知的,是可以通过计算得到的。(3)联系:通过样本统计值可以推算总体参数值,从而达到调查部分以认识总体的目的。这就是抽样调查的作用所在。,第四章 抽样,8.抽样误差(Sampling Error)是指在用样本统计值去推估总体参数值时所存在的偏差。它是由抽样本身的随机性引起的,是不可避免的。但是抽样误差的大小是控制的。抽样误差的意义:是衡量样本代表性好坏的标准,抽样误差越小,说明样本的代表性越好,反之,则越不好。,第四章 抽样,9.置信水平与置信区间(1)置信水平(Confidence Level)也称置信度,指的是总体参数值落在样本统计值某一区间内的概率。(2)置信区间(Confidenc
6、e Interval)是指在一定范围的置信水平下,样本统计值与总体参数值之间的误差范围(3)置信水平与置信区间的关系置信水平反映的是抽样的可靠性程度,置信区间反映的是抽样的精确性程度。在其他条件不变的情况下,置信水平越高,置信区间越大;置信水平越低,置信区间越小。对抽样的可靠性程度要求越高,抽样的精确性程度将越低;对抽样的可靠性程度要求越低,则抽样的精确性程度将越高。,1,2,3,4,第四章 抽样,二、抽样的基本程序(一)界定总体 即在具体抽样前,对从中抽取样本的总体范围作出明确的界定。为什么要对总体进行界定?原因之一:是由抽样调查的目的决定的,其目的是调查部分以反映总体。原因之二:界定总体是
7、达到良好的抽样效果的前提条件。例如:1936年美国总统大选前文学文摘杂志的抽样,思考,美国的文学文摘是一本1890年1938年间在美国发行颇为流行的新闻杂志。1920年、1924、1928、1932年的美国总统大选前都作出了准确的预测。1936,文学文摘进行了一次最具雄心的民意测验活动:选票寄给了从电话薄与车牌登记单中挑选出来的1000万人。收到了200万人以上的回应;结果显示,有57%人支持共产党候选人阿尔夫兰登,而当时在任的美国总统富兰克林罗斯福的支持率为43%。两个星期以后全民选举的结果出来了,罗斯福以历史上最大的优势61%的得票率获得第二届任期。思考:为什么文学文摘的预测会失败?,第四
8、章 抽样,(二)选择抽样的具体方法,确定抽样的精确性程度与样本规模如何确定抽样的精确性和样本规模(待)(三)制作抽样框(回顾什么是抽样框)当采用一次性抽样时,应依据已经明确界定的总体范围,收集总体中全部抽样单位的名单,并对名单按随机原则进行统一编号,建立起供抽样使用的抽样框。例如:我们要在重庆城市管理职业学院进行一项该校大专学生职业观的抽样调查。注意:当采取多级抽样时,则需制作多个抽样框。例如:为了了解某市小学生的学习情况,需要从全市500所小学中抽取500名小学生调查。,第四章 抽样,准确的抽样框原则:1、完整性2、不重复性 例如:在城市居民户的抽样中,会经常出现一户有多处住房的情况,这样很
9、容易把一户重复列入抽样框,使得他们在抽样中的中选概率高于其他居民,相反,许多城市居民居住条件比较差,很多居民同住在一个门牌号中,因此很容易遗漏。两种情况均违背了随机抽样的等概率原则。,第四章 抽样,(四)实际抽取样本 即在前进几个步骤的基础上,严格按照所选定的抽样方法,从抽样框中抽取一个个抽样单位,构成调查样本。(五)评估样本质量 所谓样本评估,就是对样本的质量、代表性、偏差等进行初步的检验和衡量,其目的是防止由于前面步骤中的失误而使样本偏差太大,进而导致整个调查的失误。评估样本的基本方法:将可得到的反映总体中某些重要特征及其分布的资料与样本中的同类指标的资料进行对比。若二者之间的差别很小,则
10、可认为样本的质量较高,代表性较好;反之,若二者之间的差别十分明显,则表明样本的质量和代表性不可能高。因而需要对前面的抽样步骤进行检查、修正,直到抽出质量较高、代表性较好的样本为止。,第四章 抽样,例如:从我院3000名学生中抽取300名学生作为样本。同时,我们从学院教务处或学生处得到下列统计资料:全院男生占学生总数的53%,女生占47%;本市学生占40%,外省学生占60%。那么,我们可以对抽出的300名学生进行这两方面分布情况的统计。假定样本统计得到的结果是:男生占52%,女生占48%;本市学生占41%,外省学生占59%。两相对比,可以发现二者之间的差距很小,这就在一定程度上说明,样本的质量较
11、高,代表性较好,从这样的样本中得到的结果往往能较好地反映和体现总体的情况。,1,2,3,4,第四章 抽样,三、抽样类型 根据调查总体中每一个个体有无同等的机会入选样本,可以将抽样分为概率抽样与非概率抽样两大类。概率抽样是依据概率论的原理,按照等概率原则进行的抽样,因而它能够避免抽样过程中的人为误差,保证样本的代表性。此法在社会调查最常用。非概率抽样主要是依据研究者的主观意愿、主观判断或是否方便等因素来抽取调查对象,它不考虑抽样中是否等概率,因而往往产生较大的误差,难以保证样本的代表性。此法在社会调查中用得较少。,第四章 抽样,根据抽取调查对象的具体方式的不同,又可分将概率抽样与非概率抽样分为若
12、干小类,具体分类如下图所示。简单随机 系统抽样 概率抽样 分层抽样 整群抽样抽样方法 多段抽样 偶遇抽样 非概率抽样 判断抽样 定额抽样 雪球抽样,probability sample,Non-probability sample,sample,第四章 抽样,(一)概率抽样1、简单随机抽样(Simple Random Sampling)概念:它是按等概率原则直接从含有N个个体的总体中抽取n个个体组成样本(N n)。其典型就是抽签。方法:一是抽签;二是利用随机数表来抽样(P317)。利用随机数表进行抽样的具体步骤是:(1)先取得一份调查总体所有个体的名单(即抽样框);(2)将总体中所有个体一一按
13、顺序编号;(3)根据总体规模是几位数来确定从随机数表中选几位数码;(4)以总体规模为标准,对随机数表中的数码逐一进行衡量并决定取舍;(5)根据样本规模的要求选择出足够的数码个数;(6)依据从随机数表中选出的数码,到抽样框中去找出它所对应的个体。这些个案的集合就构成样本。适用范围:总体单位数目和所需样本数目都比较少。例:某总体共6000人,现需要从中抽取300名作为样本进行调查,运用随机数表法。,第四章 抽样,2、系统抽样(Systematic Sampling)概念:是把总体中的个体进行随机编号并排序,再计算出某种间隔,然后按这一固定的间隔抽取个体的号码来组成样本的方法。具体步骤:(1)给总体
14、中的每一个个体随机编上号码并按号码排序,即制作抽样框;(2)计算出抽样间距,公式为:K=N/n(K抽样间隔,N总体规模,n样本规模);(3)在最前面的K个个体中,随机抽取一个个体,并记号其编号(假定为A),作为随机起点;(4)在抽样框中,自A开始,每隔K个个体抽取一个个体,即所抽取个体的编号分别为A,AK,A2K,A(n1)K;(5)将这n个个体合起来,就构成了该总体的一个样本。,第四章 抽样,例如:某大学共有3000名学生,要抽取一个容量为100的大学生样本,使用系统抽样的方法如何抽取。课堂练习:现要对某一产品的口味进行测试,需要从调查总体的150人中抽取12人进行测试,请使用系统抽样的方法
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样 方案 制作

链接地址:https://www.31ppt.com/p-5735592.html