欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    第四章、抽样ppt课件.ppt

    • 资源ID:1356606       资源大小:603.50KB        全文页数:82页
    • 资源格式: PPT        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第四章、抽样ppt课件.ppt

    第四章 抽样,总体,抽取样本,推断总体,样本,第四章 抽样,1.抽样的意义与作用 2.概率抽样的原理与程序 3.概率抽样方法 4.非概率抽样方法 5.样本规模与抽样误差,一、抽样的意义与作用,1.抽样的意义与作用 人们在研究某个自然现象或社会现象时,往往会遇到不方便、不可能或不必要对所有的对象作调查的情况,于是从中抽取一部分对象作调查,这就是抽样复杂的社会现象 有限的研究资源 抽样主要涉及和处理有关总体与部分之间的关系问题。抽样作为人们从部分认识整体这一过程的关键环节,其基本作用是向人们提供一种实现“由部分认识总体”这一目标的途径和手段。,抽样,一、抽样的意义与作用,1.抽样的作用 抽样是社会研究的主要内容之一,也是社会调查的一个重要步骤。它与研究目的及研究内容紧密相关。它直接关系到资料的收集、整理与分析。它还涉及到整个研究的费用以及应用的范围。抽样是否科学,直接关系到研究的成败,一个著名的案例抽样中的泰坦尼克事件,1936年美国正从经济大恐慌中复苏,全国仍有9百万人失业当年的美国总统大选,由民主党员罗斯福与共和党员兰登进行角逐文学文摘(Literary Digest)杂志对结果进行了调查预测他们根据当时的电话号码簿及该杂志订户俱乐部会员名单,邮寄1千万份问卷调查表,回收约240万份工作人员获得了大量的样本,对此进行了精确的计算,根据数据的整理分析结果,他们断言:在总统选举中,兰登将以370161的优势,即以57%比43%,领先14个百分点击败罗斯福与之相反,一个名叫乔治盖洛普的人,对文学文摘调查结果的可信度提出质疑他也组织了抽样调查,进行民意测验他的预测与文学文摘截然相反,认为罗斯福必胜无疑结果,罗斯福以62%比38%压倒性地大胜兰登这一结果使文学文摘销声匿迹,而盖洛普则名声大噪,从美国总统大选预测看抽样的效率:,一、抽样的意义与作用,2.抽样的概念在我们的日常生活中经常存在着抽样。如抽血化验,尝试水温,窥一斑而知全豹。抽样(sampling) 从组成某个总体的所有元素的集合中,按一定的方式选择或抽取样本的过程 抽样调查,就是从研究总体中抽取一部分代表加以调查研究,然后用所得结果推论和说明总体的特性。 总体(population): 构成它的所有元素的集合样本(sample) 从总体中按一定方式抽取出的一部分元素的集合抽样单位(sampling unit) 一次直接的抽样所使用的基本单位,一、抽样的意义与作用,抽样框(sampling frame) 抽样范围,指一次直接抽样时总体中所有抽样单位的名单 参数值(parameter) 是对总体中某一变量的综合描述,或总体中所有元素某些特征的综合数量表现。最常见的参数值是总体某一变量的平均值。 统计值(statistic)是对样本中某一变量的综合描述,或样本中所有元素某些特征的综合数量表现。根据样本计算出来的关于样本变量的数量表现 置信度(confidence level) 总体参数值落在样本统计值某一区间内的概率,或者说,是总体参数值落在样本统计值某一区间内的把握性程度置信区间(confidence intevalue) 上述“某一区间”,就是置信区间,二、概率抽样的原理与程序,概率抽样: (1)每一个体有同等机会被抽取 (2)每一个体的抽取都是相互独立的,二、概率抽样的原理与程序,概率抽样的逻辑 (1)同质性和异质性 如果研究总体是完全同质的,抽样就没有必要;社会科学中的研究总体往往具有较强的异质性;为了实现“通过部分认识整体”,样本应该包含总体的各种差异特征。,二、概率抽样的原理与程序,概率抽样的逻辑 (2)无意识抽样导致的偏差方便获取的样本:易得,但缺乏代表性; 例如:如何获取由100个学生构成的样本访问者的偏好影响样本的代表性; 例如:有意回避具有某些特征(“酷”,“冷”)的受访者抽样的地点影响样本的代表性 例如:图书馆门口访问,二、概率抽样的原理与程序,概率抽样的逻辑 (3)代表性和选择的概率 如果总体中的每一个体都具有同等机会被选入样本,那么从这一总体中抽取的样本就能够代表总体。 概率抽样的优点 (1)样本对总体更具代表性(相对其它类型抽样) (2)可以对样本的精确性和代表性作出估计,二、概率抽样的原理与程序,总体分布、样本分布、抽样分布 当样本容量继续增大,样本平均数的分布会进一步发生变化。这种变化趋势是:平均数的范围将逐步缩小(即底部越来越窄);相同的平均数会相应增多;全部平均数的分布向总体平均数集中的趋势也会越来越明显.,总体分布(population distribution),总体分布: 总体中各元素的观察值所形成的相对频数(频率)分布 分布通常是未知的(因为几乎得不到总体所有观察值)可以(根据理论分析)假定它服从某种分布,(sample distribution),样本分布也称经验分布,指一个样本中各观察值的形成的相对频数(频率)分布。当样本容量n逐渐增大时,样本分布逐渐接近总体的分布。,抽样分布(sampling distribution),抽样分布:样本统计量的概率分布,是一种理论分布。在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布 样本统计量是样本的函数,依据不同的样本计算出来的值是不同的,所以统计量是随机变量样本均值, 样本比例,样本方差等,样本均值的抽样分布,在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布,总体分布、样本均值的抽样分布(例题分析),【例】设一个总体,含有4个元素(个体) ,即总体单位数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4 。总体分布、总体的均值、方差及分布如下,均值和方差, 现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为, 计算出各样本的均值,如下表。并给出样本均值的抽样分布,样本均值的分布与总体分布的比较 (例题分析), = 2.5 2 =1.25,的分布形式与原有总体和样本容量n的大小有关,总体分布,样本均值的抽样分布与中心极限定理,当总体服从正态分布N(,2)时,来自该总体的所有容量为n的样本的均值x也服从正态分布,x 的数学期望为,方差为2/n。即xN(,2/n),中心极限定理 (central limit theorem),中心极限定理:设从均值为,方差为 2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布,中心极限定理(central limit theorem),x 的分布趋于正态分布的过程,抽样分布与总体分布的关系,样本均值的数学期望样本均值的方差(方差的概率意义在于刻画了随机变量取值的分散程度。方差越小,随随机变量的取值越集中在期望值附件。) 重复抽样,样本均值的抽样分布,抽样的一般程序,界定总体:对从中抽取样本的总体范围与界限作明确的界定 制定抽样框:依据已经明确界定的总体范围,收集总体中全部抽样单位的名单,并通过对名单进行统一编号来建立起供抽样使用的抽样框 决定抽样方案:选择抽样方法,确定样本规模 实际抽取样本:1.先抽好样本,再调查 2.一边抽样一边调查 评估样本质量:对样本的质量、代表性、偏差等进行初步的检验和衡量,概率抽样的方法,抽样的类型,偶遇抽样判断抽样定额抽样雪球抽样,简单随机抽系统多层抽样分层抽样整群抽样多段抽样,概率抽样,非概率抽样,抽样类型,三、概率抽样的方法,1.简单随机抽样: 概率抽样的最基本形式 方法: 1.总体较少:搅拌抽签; 2.总体较多:用随机数表 3.利用EXCEL的randbetween(a,b)函数实现简单随机抽样,三、概率抽样的方法,1.简单随机抽样概念:一般地,设一个总体的个体数为N,如果通过逐个不放回地抽取的方法从中抽取n (nN) 个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。要点:它要求被抽取样本的总体的个体数有限它是从总体中逐个进行抽取它是一种不放回抽样它是一种等概率抽样,三、概率抽样的方法,1.简单随机抽样抽签法(抓阄法)将总体中的所有个体(共N个)编号(号码可以从1到N),并把号码写在形状、大小相同的号签上( 号签可以用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌。抽签时,每次从中抽出1 个号签,连续抽取n次,就得到一个容量为n的样本。对个体编号时,也可以利用已有的编号。例如学生的学号,座位号等。,三、概率抽样的方法,练习1.高二(21)班有53名同学,现要从中抽取8名去参加一个座谈会,请写出用抽签法抽选的过程。2.假设一个总体有5个元素,分别记为a、b、c、d、e,采用抽签法抽取一个容量为2的样本,样本共有多少个?为了考察某公司生产的250克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60件产品进行检查.,当总体的个数较多时,将总体“搅拌均匀”比较困难,抽签法产生的样本代表性差的可能性很大。,三、概率抽样的方法,1.简单随机抽样随机数表法随机数表是统计工作者用计算机生成的随机数,保证表中的每个位置上的数字是等可能出现的用随机数表进行抽样的步骤:将总体中个体编号;选定开始的数字;获取样本号码用随机数表抽取样本,可以任选一个数作为开始,读数的方向可以向左,也可以向右、向上、向下等等。因此并不是唯一的由于随机数表是等概率的,因此利用随机数表抽取样本保证了被抽取个体的概率是相等的,练习例:为了考察某公司生产底250克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60件产品进行检查.S1,将800袋牛奶编号,可以编为000,001,799;S2,在随机数表中任意选一个数,例如第8行第7列的数7;S3,从选定的数7开始向右读,得到一个三位数,如果这个三位数在000799范围内,则取出,否则去掉;继续向右读,得下一个三位数;依次下去,直到样本的60个号码全部取出.将总体中的个体编号时从000开始,用意何在?当随机地选定开始读数的数后,读数的方向只能向右吗?,三、概率抽样的方法,三、概率抽样的方法,练习将全班同学按学号编号,制作相应的卡片号签,放入同一个箱子里均匀搅拌,从中抽出15个号签,就相应的15名学生对看足球比赛的喜爱程度(很喜爱、喜爱、一般、不喜爱、很不喜爱)进行调查。上述问题中抽取样本的方法用随机数表法来进行!规则1:从269页表中第3行第11列的两位数开始,依次向下读数,到头后再转向它左面的两位数号码,并向上读数,以此下去,直到取足样本。规则2:从269页表中第12行第10列的两位数开始,依次向左读数,到头后再转向它下面的两位数号码,并向右读数,以此下去,直到取足样本。,三、概率抽样的方法,1.简单随机抽样利用EXCEL的randbetween(a,b)函数实现简单随机抽样例:某总体共3000人(四位数),需要从中抽取100人作为样本进行调查打开EXCEL,用鼠标左键点击1A,点开fx,出现一个对话框,在对话框的选择类别这一栏中选择“数学与三角函数”,在选择函数这一栏中选择randbetween,在randbetween后又出现对话框,在对话框的bottom栏填写最小数,在top栏填写最大数,鼠标左键点击确定,在1A栏出现一个随机数字,下拉该栏到100A处就出现了100个随机数字。,三、概率抽样的方法,1.简单随机抽样简单随机抽样方法的优缺点优点:可能产生代表性样本缺点:不容易做抽样元素多,编号难必须能够接触到被选中的个体成分比例难,三、概率抽样的方法,2.系统抽样(等距抽样或间隔抽样) 定义:等距抽样或机械抽样,将总体的单位编号排序后,按照固定的间隔抽取个体组成样本的方法。步骤:编号确定抽样间距确定抽样起点等间距抽样,三、概率抽样的方法,2.系统抽样(等距抽样)举例:一个礼堂有30排座位,每排有40个座位。一次报告会礼堂坐满了听众。会后为听取意见,需要抽取30名听众进行座谈,除了用简单随机抽样获得样本外,你能否设计其他的抽取样本的方法?留下每排座位号为20的30名听众进行座谈。注意:这种抽取样本的方法与简单随机抽样有什么区别?你能说出操作步骤吗?,2.系统抽样(等距抽样)优点:简便易行条件:抽样框里的元素应该是随机排列的.。,三、概率抽样的方法,三、概率抽样的方法,注意1:系统抽样的一个十分重要的前提条件,是总体中个体的排列,相对于研究的变量来说是随机的,即不存在某种与研究变量相关的规则分布。否则,系统抽样的结果将会产生极大的偏差。例如:从总体2000户家庭的社区中,抽取一个50户家庭的样本进行调查消费状况的调查,而这2000户家庭的名单是按每个家庭总收入的多少,由高到低的顺序排列的。初始号码为3和38,所抽样本家庭平均收入有很大区别,消费状况也有很大区别。注意2:元素排列的周期性可能导致抽样的重大偏差!例如:每个班级内的50名学生按照学生成绩的高低来排序,每个班抽取一名学生组成样本,初始号码为2和48号,所抽样本的平均成绩差别很大,三、概率抽样的方法,2.系统抽样(等距抽样)下列抽样不是系统抽样的是()A、从标有115号的15个球中,任选三个作为样本,按从小号到大号排序,随机选起点k,以后k+5,k+10(超过15则从1再数起)号入样B、工厂生产的产品,用传送带将产品送入包装车间前,检验人员从传送带上每隔5分钟抽一件产品进行检验C、搞某一市场调查,规定在商场门口随机抽一个人进行询问调查,直到调查到事先规定调查人数为止D、报告厅对与会听众进行进行调查,通知每排(每排人数相等)座位号为14的观众留下来座谈,三、概率抽样的方法,2.系统抽样(等距抽样)应用举例某地区有3000名学生参加学科竞赛,现要从中抽取一个样本对他们的成绩进行分析,每个学生被抽到的概率均为1/15,试确定样本容量,并说出抽样步骤。设某校共有108名教师,为了支援西部的教育事业,要从中随机抽出16名教师组成暑期西部讲师团。请用系统抽样方法选出讲师团成员。有人说,可以借用居民身份证号码(18位)来进行央视春晚的收视率调查:在1999中抽出一个随机数,比如632,那么身份证后三位是632的观众就是要调查的对象。你觉得这样所获得的样本有代表性吗?,系统抽样的优缺点,如何改进?,优点:(1)简单易操作(2)当对总体结构有一定了解时,充分利用已有的信息对总体中的个体进行排队后再抽样,可提高抽样效率(3)当总体中的个体存在一种自然编号时,采用系统抽样比较方便缺点:(4)当在不了解样本总体的情况下(如性别差异,经济基础,个人喜好,天气因素等等),所抽出的样本可能会有一定的偏差。,三、概率抽样的方法,3.分层抽样问题情景: 一个单位的职工有500人,其中不到35岁的有125人,3549岁的有280人,50岁以上的有95人。为了了解该单位职工年龄与身体状况的有关指标,从中抽取100名职工作为样本,应该怎样抽取?,三、概率抽样的方法,3.分层抽样 首先将总体中的所有单位按某种特征或标志划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系统抽样的办法抽取一个子样本,最后将这些子样本合起来构成总体的样本。,三、概率抽样的方法,分层抽样的步骤,1.总体与样本容量确定抽取的比例。2.由分层情况,确定各层抽取的样本数。3.各层的抽取数之和应等于样本容量。4.对于不能取整的数,求其近似值。,问题:每个个体在整个抽样过程中被抽取的概率是否相等?,三、概率抽样的方法,3.分层抽样优点:在不增加样本规模的前提下降低抽样误差,提高抽样精度,增大代表性。便于了解总体内不同层次的情况,以及对总体中的不同层次进行单独研究或者进行比较。缺点: 对抽样框的要求比较高,必须有分层的辅助信息;收集或编制抽样框的费用比较高;若调查变量与分层的变量不相关,效率可能降低;,三、概率抽样的方法,3.分层抽样分层的标准问题以分析的主要变量或相关变量作为分层的标准保证各层内部同质性强,各层之间异质性强以已有明显层次区分的变量作为分层变量分层的比例问题按比例分层抽样 不按比例分层抽样,三、概率抽样的方法,分层抽样举例 一个单位的职工有500人,其中不到35岁的有125人,3549岁的有280人,50岁以上的有95人。为了了解该单位职工年龄与身体状况的有关指标,从中抽取100名职工作为样本,应该怎样抽取?解:抽取人数与职工总数的比是100:5001:5,则各年龄段(层)的职工人数依次是125:280:9525:56:19,然后分别在各年龄段(层)运用简单随机抽样方法抽取。 答:在分层抽样时,不到35岁、3549岁、50岁以上的三个年龄段分别抽取25人、56人和19人。,三、概率抽样的方法,练习1.某科研单位有科研人员160人,其中具有高级以上职称的24人,中级职称48人,其余均为初级以下职称,现要抽取一个容量为20的样本,试确定抽样方法,并写出抽样过程.2.某市3个区共有高中学生20000人,且3个区的高中学生人数之比为2:3:5,现在要用分层抽样的方法从所有学生中抽取一个容量为200的样本,这3个区应该分别抽取多少人?3.如果采用分层抽样,从个体数为N的总体中,抽取一个容量为n的样本,那么每个个体被抽到的概率等于 ( ),4.下列属于分层抽样特点的是( )A.从总体中逐个抽取 B.将总体分成几层,分层进行抽取 C.将总体分成几部分,按事先确定的规则在各部分抽取 D.将总体随意分成几部分,然后进行随机抽取5.某校高中生共有900人,其中高一年级300人,高二年级200人,高三年级400人,现采用分层抽样抽取容量为45的样本,那么高一,高二,高三各年级抽取人数分别为( ),A 15, 5, 25 B 15, 15 ,15C 10, 5, 30 D 15, 10, 20,三、概率抽样的方法,B,6. 某公司在A、B、C、D四个地区分别有150个、120个、180个和150个销售点,公司为了调查产品销售情况,需从这600个销售点中抽取容量为100的样本,记这项调查为;在C地区有20个特大型销售点,现从中抽取7个调查它的销售收入和销后服务情况,记这项调查为;则完成、这两项调查应采取的抽样方法依次为( )A.分层抽样法,系统抽样法;B.分层抽样法,简单随机抽样法;C.系统抽样法,分层抽样法; D.简单随机抽样法,分层抽样法;,三、概率抽样的方法,7.在100个零件中,有一级品20个,二级品30个,其余为三级品,从中抽取20个作为样本.(1)采用随机抽样法,将零件编号为00,01,99.抽签取出20个;(2)采用系统抽样法,将所有零件分成20组,每组5个,然后每组中随机抽取1个;(3)采用分层抽样法,从一级品中 随机抽取4个,从二级品中随机抽取6个,从三级品中随机抽取10个,则下列说法正确的是 ( )A .不论用哪种抽样方法,这100个零件中每个被抽到的概率都是1/5B. (1),(2)2种方法,这100个零件中每个被抽到的概率都是1/5;(3)并非如此C. (1),(3)2种方法,这100个零件中每个被抽到的概率都是1/5;(2)并非如此D.用不同的抽样方法,这100个零件中每个被抽到的概率是各不相同的,三、概率抽样的方法,8某中学有学生2000名,高一、高二、高三的学生人数之比为5:3:2,现要抽取一个容量为200的样本,则学生甲被抽到的概率是_,若高一学生抽取50人,则样本的容量为_.9.一个电视台在因特网上就观众对其某一节目的喜爱程度进行调查,参加调查的总人数为12000人,其中持各种态度的人数如下所示: 很喜爱 喜爱 一般 不喜爱 2400 4200 3800 1600 打算从中抽取60人进行详细调查,如何抽取?,三、概率抽样的方法,三种抽样方法的比较,简单随机抽样最简单,但是也是相对复杂的。系统抽样操作简单,在有充分的总体信息的前提下,估计精度比随机抽样高,且操作、简单。分层抽样由于已经利用了总体信息,因此估计精度也比随机简单抽样要高。,三、概率抽样的方法,4.整群抽样 将总体按某种标准划分为一些子群体,每个子群为一个抽样单位,用随机方法从中抽若干子群,将抽出的子群中的所有个体结合起来构成样本。,三、概率抽样的方法,整群抽样特点: 抽样单位不是单个的个体,而是成群的个体 优缺点: 优点:不需要详细的所有元素的名单,简单,费用低 缺点:样本的分布面不广,代表性相对较差 整群抽样和分层抽样的比较: 子群间异质性强,群内同质性强分层抽样 子群间同质性强,群内异质性强整群抽样,三、概率抽样的方法,5.多阶段抽样 按抽样元素的隶属关系或层次关系,把抽样分为几个阶段进行。 例1:大学院系班级学生 例2:城市区街道居委会 家庭个人 特征: 适用于范围大、总体数量多的社会调查 优缺点:优点:不需要总体的全部名单,各阶段的抽样单一般较少,容易操作 缺点:每一个阶段都存在误差,抽样误差可能较大 应对方法:尽量增加开头阶段的样本数适当减少最后阶段的样本数,三、概率抽样的方法,6.PPS抽样(概率与元素的规模大小成比例的抽样) 什么情况下要使用PPS抽样: 以上所介绍的抽样方法有一个共同的特点:总体(或子总体)中的每一个元素都具有同等的被抽中的概率。如果总体中每个元素的“大小”基本相同,或者每一个元素在总体中的地位或重要性相差不多,则这种基于同等概率的抽样是合适的。但当元素的大小不同,或者元素在总体中的地位不同时,则需要采用不等概率抽样的方法。,三、概率抽样的方法,如何进行PPS抽样?( P72)例:从全市100家不同规模的企业(共20万职工)中抽取1000名职工进行调查 100家企业抽取20家企业, 20家企业每家抽取50个工人,合计1000名职工 20家企业抽取概论相同每个企业职工抽取的概论不同企业3每个职工抽取的概论=50/16000企业4每个职工抽取的概论=50/200,四、非概率抽样方法,非概率抽样: 又称非随机抽样,就是调查者根据自己的方便或主观判断抽取样本,这样的抽样方法不遵循概率均等的原则。常见的非概率抽样方法: 偶遇抽样 判断抽样 定额抽样 滚雪球抽样,四、非概率抽样方法,1.偶遇抽样 定义:方便抽样或自然抽样,指研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为对象,或者仅仅选择那些离得最近、最容易找到的人作为对象。适用范围可用于经常性的市场调查;可用于正式市场调查之前 的试验调查;任意调查适用于同质总体。,1.偶遇抽样优点:方便、灵活,简便易行,及时取得所需资料,节约时间和费用成本低缺点:样本的代表性差、有很大的偶然性。例:1.在商场、码头等公共场所调查 2.街头拦截调查 3.报刊的读者调查,四、非概率抽样方法,四、非概率抽样方法,判断抽样: 也叫立意抽样,研究者根据自己的主观判断来抽选样本,分为印象判断抽样和经验判断抽样。印象判断抽样:纯粹凭研究者的主观印象抽样经验判断抽样:根据以往经验和对调查对象的了解抽样注意的问题: 判断抽样的关键是抽样标准的确立,这种方法的运用与研究者本人的因素比如理论修养、实践经验以及对调查对象的熟悉程度有关,四、非概率抽样方法,判断抽样:适用场合:多用于无法确定总体边界、或总体规模小、调查所涉及的范围较窄,或调查时间、人力等条件有限而难以进行大规模抽样的情况。 优点:可以充分发挥研究人员的主观能动作用。样本是按照调查人员的需要来选定的,所以较好地满足了特殊的调查需要。缺点:如果调查人员在选取样本时主观判断出现偏差,则判断抽样极易发生较大的抽样误差。样本的代表性难以判断,不能推论。,四、非概率抽样方法,3.定额抽样 又称配额抽样,先根据总体各个组成部分所包含的抽样单位的比例分配样本数额,然后由调查者在各个组成部分内根据配额的多少采用偶遇抽样或判断抽样方法抽取样本。,四、非概率抽样方法,定额抽样 例:某高校有2000名学生,其中男生占60,女生占40;文科学生和理科学生各占50;一年级学生占40、二年级、三年级、四年级学牛分别占30、20和10。现在要用定额抽样方法依上述3个变数抽取一个规模为100人的样本。依据总体的构成和样本规模,我们可得到下列定额表,四、非概率抽样方法,定额抽样 定额抽样与分层抽样的区别在于,定额抽样最后抽取样本时所采用的方法是非随机抽样。配额抽样的优点 适用于设计调查者对总体的有关特征具有一定的了解而样本数较多的情况下,实际上,配额抽样属于先“分层”(事先确定每层的样本量)再“判断”(在每层中以判断抽样的方法选取抽样个体);费用不高,易于实施,能满足总体比例的要求。 配额抽样的缺点 容易掩盖不可忽略的偏差,四、非概率抽样方法,滚雪球抽样 当无法了解总体时,可以从总体中少数成员入手,对他们进行调查,并进一步询问还知道哪些符合条件的再进一步询问 。例:对球迷、戏迷的调查缺点:同质性较强,四、非概率抽样方法,非随机抽样抽选样本的质量,主要取决于调查者的主观状况和各种偶然因素。优点:简单、易行,可以获得对调查对象的大致了解。缺点:代表性差,调查资料不能从数量上推断总体。,五、样本规模与抽样误差,样本规模:又称样本容量,就是指样本所含个案的数量。 确定样本规模也是每一项具体的社会研究所必须解决的问题之一.统计学与社会研究的样本统计学中通常以30为界,把样本分为大样本和小样本.社会研究中的样本规模至少不能少于100个个案,五、样本规模与抽样误差,确定样本规模需要考虑的因素: 1.推断的把握性与精确度; 2.总体的规模; 3.总体的异质性程度; 4.研究者所拥有的资源。,五、样本规模与抽样误差,1.推断的把握性与精确度 置信度:把握性 置信区间:精确度 一般地说,在其他条件不变的情况下,置信度越高,即推断的可靠程度越高,所要求的样本规模就越大;置信区间越小,即样本值与总体值之间误差范围越小 ,所要求的样本规模就越大。,五、样本规模与抽样误差,不同允许误差水平所需的最少样本量,五、样本规模与抽样误差,2.总体的规模 在置信度和抽样误差不变的条件下,样本规模是随着总体规模的扩大而扩大,但样本占总体的比重却不断缩小。 当总体规模大到一定程度时(例如100万),样本规模的增加对抽样误差的影响就微乎其微。例如:美国大选的民意调查中样本通常不超过3000,五、样本规模与抽样误差,总体规模与样本规模的关系(置信度95%,抽样误差3%),五、样本规模与抽样误差,3.总体的异质性程度;4.研究者所拥有的资源。,五、样本规模与抽样误差,经验确定样本数的范围,五、样本规模与抽样误差,抽样调查中的误差来源:抽样误差:抽样的随机性引起非抽样误差:人为原因导致的误差注意:并非样本规模越大调查结果就越精确!,

    注意事项

    本文(第四章、抽样ppt课件.ppt)为本站会员(牧羊曲112)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开