现代社会调查方法之抽样.ppt
《现代社会调查方法之抽样.ppt》由会员分享,可在线阅读,更多相关《现代社会调查方法之抽样.ppt(87页珍藏版)》请在三一办公上搜索。
1、章 第四章 抽样 抽样,目的要求,掌握概率抽样的原理、程序与方法;掌握抽样误差的概念与测量方法;熟悉非概率抽样方法与样本规模;了解抽样的意义;,目录,抽样的意义与作用,1,概率抽样的原理与程序,2,概率抽样方法,3,非概率抽样方法,4,样本规模与抽样误差,5,以上现象是否说明了这样一个道理:我们可以通过对部分的观察来推论总体的情况。,“管中窥豹,可见一斑”“一叶知秋”,在日常生活当中所熟知的抽样有哪些?,一、抽样的意义与作用,(一)抽样的意义 人们在研究某个自然现象或社会现象时,往往会遇到不方便、不可能或不必要对所有的对象作调查的情况,于是从中抽取一部分对象作调查,这就是抽样.复杂的社会现象
2、有限的研究资源 抽样主要涉及和处理有关总体与部分之间的关系问题。抽样作为人们从部分认识整体这一过程的关键环节,其基本作用是向人们提供一种实现“由部分认识总体”这一目标的途径和手段。,抽样,(二)抽样的作用 抽样是社会研究的主要内容之一,也是社会调查的一个重要步骤。它与研究目的及研究内容紧密相关。它直接关系到资料的收集、整理与分析。它还涉及到整个研究的费用以及应用的范围。抽样是否科学,直接关系到研究的成败,一、抽样的意义与作用,(三)抽样的相关概念抽样(sampling):从组成某个总体的所有元素的集合中,按一定的方式选择或抽取一部分元素的过程。总体(population):构成它的所有元素的集
3、合例:四川省应届毕业生择业倾向调查。通常用N表示样本(sample)从总体中按一定方式抽取出的一部分元素的集合。例:12.8万名应届毕业生中抽取1000名大学生。通常用n表示,一、抽样的意义与作用,抽样单位(sampling unit)一次直接的抽样所使用的基本单位。抽样单位与构成总体的元素有时是相同有时又不同。如12.8万大学生,当以1000名大学生作为样本时?当以40个班级作为样本时?抽样框(sampling frame)抽样范围,指一次直接抽样时总体中所有抽样单位的名单。例:从一所中学的全体学生中抽取200名学生作为调查样本。从一所中学的所有班级中抽取20个班级作为调查样本。参数值(pa
4、rameter)是对总体中某一变量的综合描述,或总体中所有元素某些特征的综合数量表现。最常见的参数值是总体某一变量的平均值。参数值只有对总体中的每一个元素进行调查或测量才能得到。例:某市待业青年平均年龄,某工厂工人的平均收入。,一、抽样的意义与作用,统计值(statistic)是对样本中某一变量的综合描述,或样本中所有元素某些特征的综合数量表现。根据样本计算出来的关于样本变量的数量表现。统计值是从样本中计算出来的,它是相应的参数值的估计值。参数值:确定的、唯一的、未知的。统计值:变化的。置信度(confidence level)总体参数值落在样本统计值某一区间内的概率,或者说,是总体参数值落在
5、样本统计值某一区间内的把握性程度。反映的是样本的可靠性程度。如置信水平为95%,则表示总体参数值落在样本统计值某一区间的概率为95%。置信区间(confidence intevalue)上述“某一区间”,就是置信区间。指在一定置信水平下,样本统计值与总体参数值之间的误差范围。与误差范围成正比。,一、抽样的意义与作用,依据概率论的基本原理,按照等概率原则进行的抽样,能够避免抽样过程中的人为误差,保证样本的代表性,依据研究者的主观意愿、判断或是否方便等因素来抽取对象,往往产生较大误差,难以保证样本的代表性。,(四)抽样的类型根据抽取对象的具体方式分类:,概率抽样,非概率抽样,一、抽样的意义与作用,
6、抽样方法,概率抽样,非概率抽样,简单随机抽样系统抽样分层抽样整群抽样多段抽样,偶遇抽样判断抽样定额抽样雪球抽样,(一)概率抽样的基本原理1.无意识抽样导致的偏差方便获取的样本:易得,但缺乏代表性;例如:如何获取由100个学生构成的样本访问者的偏好影响样本的代表性;例如:有意回避具有某些特(“酷”、“冷”)的受访者抽样的地点影响样本的代表性 例如:图书馆门口访问,二、概率抽样的原理与程序,(一)概率抽样的基本原理2.同质性和异质性 买100支单价为1元的铅笔,在结账的时候是用乘法还是加法?买10支单价为1元的铅笔、20支单价为2元的签字笔和30支单价为5元的钢笔,结账时该如何计算?10*1+20
7、+2+30*5100铅笔具有同质性,60支笔具有异质性(价格不同),二、概率抽样的原理与程序,是否可以这样认为?对于具有同质性的总体,我们只需要了解其中一个成员,就能知道整个群体的情况;对于具有异质性总体,我们往往需要根据总体内部的不同特征选取一定数量具有代表性的样本来推论总体的情况。,例:西南医科大学在校生网购情况分析研究总体:西南医科大学在校大一、大二、大三学生是否具有同质性?否,不同经济状况、消费观念会导致不同的网购行为采用抽样调查:选取100个具有代表性的样本来推论西南医科大学在校生的网购情况。,什么样的样本才能代表总体的情况?从年级分类:大一、大二、大三从学院分类:药学院、法学院、公
8、共卫生学院。从性别分类:男、女采用概率抽样抽取的样本为什么能代表总体的情况?,(二)抽样分布 抽样分布是根据概率的原则而成立的理论分布,它显示出:从一个总体中不断抽取样本时,各种可能出现的样本统计值的分布情况。,二、概率抽样的原理与程序,当样本容量为2个时,根据组合公式计算总共可以抽取45个不同的样本,这些样本的平均数范围从6.5年(当)到14.5年,其中会产生一些相同的平均数,比如6-14,7-13,8-12,9-11这四个样本的平均数都是10年。,当样本容量为3个时,可以抽取120个样本,这些样本的平均数范围从7年到14年,其中相同的平均数更多。,当样本容量继续增大时(越来越接近总体的1/
9、2时),样本平均数的分布会进一步发生变化。趋势是:平均数的范围将逐步缩小(即分布图的底部越来越窄);相同的平均数会相应增多;全部平均数的分布向总体平均数集中的趋势也会越来越明显。,根据“中心极限定理”,当n(抽取的样本量)足够大时(通常假定大于30),无论总体的分布如何,其样本平均数所构成的分布都趋于正态分布。,根据概论统计理论,正态根部曲线下的任何部分的面积都可以用数学方法推算。这意味着,任何两个数值之间的样本平均数次数所占的比例都是可以求得的。,约有68%的样本平均数在“”这两个数值的范围内约有95.46%的样本统计值落在总体参数值正负两个标准差范围内。,在实际应用中,人们更多的是采用以下
10、几个数字:有90%落在 之间;有95%落在 之间;如果从反面来考虑这一结论,可以得出以下推论:对于任何一次随机抽样来说,其样本的统计值落在总体参数值正负1.65个标准差之间的概率是90%。只要我们采用的是随机抽样的方法,就可以根据抽样分布,用样本的数值来推论总体的情况。,界定总体:对从中抽取样本的总体范围与界限作明确的界定 制定抽样框:依据已经明确界定的总体范围,收集总体中全部抽样单位的名单,并通过对名单进行统一编号来建立起供抽样使用的抽样框 决定抽样方案:选择抽样方法,确定样本规模 实际抽取样本:1.先抽好样本,再调查 2.一边抽样一边调查(样本规模较大时)评估样本质量:对样本的质量、代表性
11、、偏差等进行初步的检验和衡量,二、概率抽样的原理与程序,(三)抽样的一般程序,例:西南医科大学在校生学习倦怠的原因及影响因素的调查界定总体:所有西南医科大学在校学生制定抽样框:假定有3万名在校生,则需要搜集所有3万名学生名单,进行统一编号来建立起供抽样使用的抽样框。决定抽样方案:根据实际的情况,选择合适的抽样方法,并确定样本规模。如选择简单随机抽样,样本规模为200人。抽取样本:评估样本质量:对样本的代表性、偏差等进行检验,在实践上可行,可行性,目的性,最有利于研究资料的获取和最符合研究的目的,与研究的可得资源相适应,能够从样本自身计算出有效的估计值或抽样变动的近似值,(四)抽样设计的原则,美
12、国抽样专家科什(kish)教授提出一个优秀的抽样设计应该满足的四条标准:,经济性,可测性,目的性,可行性,四条标准之间存在着一定的制约关系,甚至相互冲突。增加可测性加大样本容量增加资源经济性减弱实际的抽样设计就是研究者在这四条标准中进行取舍和保持平衡的过程,三、概率抽样的方法,偶遇抽样判断抽样定额抽样雪球抽样,简单随机抽系统多层抽样分层抽样整群抽样多段抽样,概率抽样,非概率抽样,抽样类型,概率抽样是按照概率原理进行的,它要求样本具有随机性,即总体中每一个成员都有被抽中的可能性。不同形式的概率抽样对选择涉及调查研究问题的性质、良好的抽样框的获得、调查研究经费的多少、资料收集方法等因素有不同的要求
13、。,三、概率抽样的方法,三、概率抽样的方法,(一)简单随机抽样:又称纯随机抽样,是按照等概率原则直接从含有N个元素的总体中抽取n个元素组成样本(Nn),常用的办法是抽签。概率抽样的最基本形式。,要点:它要求被抽取样本的总体的个体数有限它是从总体中逐个进行抽取它是一种不放回抽样它是一种等概率抽样,方法:1.总体较少:搅拌抽签;2.总体较多:用随机数表,抽签法(抓阄法)将总体中的所有个体(共N个)编号(号码可以从1到N),并把号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌。抽签时,每次从中抽出1 个号签,连续抽取n次,就得到一个容量
14、为n的样本。对个体编号时,也可以利用已有的编号。例如学生的学号,座位号等。,三、概率抽样的方法,随机数表法随机数表是统计工作者用计算机生成的随机数,保证表中的每个位置上的数字是等可能出现的用随机数表进行抽样的步骤:将总体中个体编号;选定开始的数字;获取样本号码用随机数表抽取样本,可以任选一个数作为开始,读数的方向可以向左,也可以向右、向上、向下等等。因此并不是唯一的由于随机数表是等概率的,因此利用随机数表抽取样本保证了被抽取个体的概率是相等的,三、概率抽样的方法,简单随机抽样方法的优缺点优点:可能产生代表性样本缺点:不容易做抽样元素多,编号难必须能够接触到被选中的个体搅拌均匀不易,三、概率抽样
15、的方法,(二)系统抽样 定义:等距抽样或机械抽样,将总体的元素编号排序后,按照固定的间隔抽取个体组成样本的方法。,系统抽样的具体步骤1、给总体中的每一个元素按顺序编上号码,制定出抽样框。2、计算出抽样时间距,方法是用总体的规模除以样本的规模。K(抽样间隔)=N(总体规模)/n(样本规模)3、在最前面的K个元素中,采用简单随机抽样的方法抽取一个元素,记下这个元素的编号(假设为A),A称为随机起点。4、在抽样框中,自A开始,每隔K个元素抽取一个元素,即所抽元素编号为A,A+K,A+2K,A+(n-1)K。5、将这n个元素合起来,就构成了该总体的一个样本。,三、概率抽样的方法,系统抽样例子:某校30
16、00名新生中抽取100名样本。3000/100=30每隔30人取1名。起始值是2号,下一个就是32号。依次类推。,注意1:系统抽样的一个十分重要的前提条件,是总体中个体的排列,相对于研究的变量来说是随机的,即不存在某种与研究变量相关的规则分布。否则,系统抽样的结果将会产生极大的偏差。例如:从总体2000户家庭的社区中,抽取一个50户家庭的样本进行调查消费状况的调查,而这2000户家庭的名单是按每个家庭总收入的多少,由高到低的顺序排列的。初始号码为3和38,所抽样本家庭平均收入有很大区别,消费状况也有很大区别。注意2:元素排列的周期性可能导致抽样的重大偏差!例如:每个班级内的50名学生按照学生成
17、绩的高低来排序,抽样间距为50,每个班抽取一名学生组成样本,初始号码为2或48号,所抽样本的平均成绩差别很大,系统抽样的优缺点,优点:(1)简单易操作(2)当对总体结构有一定了解时,充分利用已有的信息对总体中的个体进行排队后再抽样,可提高抽样效率(3)当总体中的个体存在一种自然编号时,采用系统抽样比较方便缺点:(4)当在不了解样本总体的情况下(如性别差异,经济基础,个人喜好,天气因素等等),所抽出的样本可能会有一定的偏差。,三、概率抽样的方法,(三)分层抽样(stratified sampling)又称类型抽样,它是先将总体中的所有元素按某种特征或标志(如性别、年龄、地域等)划分成若干类型或层
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 现代社会 调查 方法 抽样
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-5291273.html