第四章、抽样ppt课件.ppt
《第四章、抽样ppt课件.ppt》由会员分享,可在线阅读,更多相关《第四章、抽样ppt课件.ppt(82页珍藏版)》请在三一办公上搜索。
1、第四章 抽样,总体,抽取样本,推断总体,样本,第四章 抽样,1.抽样的意义与作用 2.概率抽样的原理与程序 3.概率抽样方法 4.非概率抽样方法 5.样本规模与抽样误差,一、抽样的意义与作用,1.抽样的意义与作用 人们在研究某个自然现象或社会现象时,往往会遇到不方便、不可能或不必要对所有的对象作调查的情况,于是从中抽取一部分对象作调查,这就是抽样复杂的社会现象 有限的研究资源 抽样主要涉及和处理有关总体与部分之间的关系问题。抽样作为人们从部分认识整体这一过程的关键环节,其基本作用是向人们提供一种实现“由部分认识总体”这一目标的途径和手段。,抽样,一、抽样的意义与作用,1.抽样的作用 抽样是社会
2、研究的主要内容之一,也是社会调查的一个重要步骤。它与研究目的及研究内容紧密相关。它直接关系到资料的收集、整理与分析。它还涉及到整个研究的费用以及应用的范围。抽样是否科学,直接关系到研究的成败,一个著名的案例抽样中的泰坦尼克事件,1936年美国正从经济大恐慌中复苏,全国仍有9百万人失业当年的美国总统大选,由民主党员罗斯福与共和党员兰登进行角逐文学文摘(Literary Digest)杂志对结果进行了调查预测他们根据当时的电话号码簿及该杂志订户俱乐部会员名单,邮寄1千万份问卷调查表,回收约240万份工作人员获得了大量的样本,对此进行了精确的计算,根据数据的整理分析结果,他们断言:在总统选举中,兰登
3、将以370161的优势,即以57%比43%,领先14个百分点击败罗斯福与之相反,一个名叫乔治盖洛普的人,对文学文摘调查结果的可信度提出质疑他也组织了抽样调查,进行民意测验他的预测与文学文摘截然相反,认为罗斯福必胜无疑结果,罗斯福以62%比38%压倒性地大胜兰登这一结果使文学文摘销声匿迹,而盖洛普则名声大噪,从美国总统大选预测看抽样的效率:,一、抽样的意义与作用,2.抽样的概念在我们的日常生活中经常存在着抽样。如抽血化验,尝试水温,窥一斑而知全豹。抽样(sampling) 从组成某个总体的所有元素的集合中,按一定的方式选择或抽取样本的过程 抽样调查,就是从研究总体中抽取一部分代表加以调查研究,然
4、后用所得结果推论和说明总体的特性。 总体(population): 构成它的所有元素的集合样本(sample) 从总体中按一定方式抽取出的一部分元素的集合抽样单位(sampling unit) 一次直接的抽样所使用的基本单位,一、抽样的意义与作用,抽样框(sampling frame) 抽样范围,指一次直接抽样时总体中所有抽样单位的名单 参数值(parameter) 是对总体中某一变量的综合描述,或总体中所有元素某些特征的综合数量表现。最常见的参数值是总体某一变量的平均值。 统计值(statistic)是对样本中某一变量的综合描述,或样本中所有元素某些特征的综合数量表现。根据样本计算出来的关于
5、样本变量的数量表现 置信度(confidence level) 总体参数值落在样本统计值某一区间内的概率,或者说,是总体参数值落在样本统计值某一区间内的把握性程度置信区间(confidence intevalue) 上述“某一区间”,就是置信区间,二、概率抽样的原理与程序,概率抽样: (1)每一个体有同等机会被抽取 (2)每一个体的抽取都是相互独立的,二、概率抽样的原理与程序,概率抽样的逻辑 (1)同质性和异质性 如果研究总体是完全同质的,抽样就没有必要;社会科学中的研究总体往往具有较强的异质性;为了实现“通过部分认识整体”,样本应该包含总体的各种差异特征。,二、概率抽样的原理与程序,概率抽样
6、的逻辑 (2)无意识抽样导致的偏差方便获取的样本:易得,但缺乏代表性; 例如:如何获取由100个学生构成的样本访问者的偏好影响样本的代表性; 例如:有意回避具有某些特征(“酷”,“冷”)的受访者抽样的地点影响样本的代表性 例如:图书馆门口访问,二、概率抽样的原理与程序,概率抽样的逻辑 (3)代表性和选择的概率 如果总体中的每一个体都具有同等机会被选入样本,那么从这一总体中抽取的样本就能够代表总体。 概率抽样的优点 (1)样本对总体更具代表性(相对其它类型抽样) (2)可以对样本的精确性和代表性作出估计,二、概率抽样的原理与程序,总体分布、样本分布、抽样分布 当样本容量继续增大,样本平均数的分布
7、会进一步发生变化。这种变化趋势是:平均数的范围将逐步缩小(即底部越来越窄);相同的平均数会相应增多;全部平均数的分布向总体平均数集中的趋势也会越来越明显.,总体分布(population distribution),总体分布: 总体中各元素的观察值所形成的相对频数(频率)分布 分布通常是未知的(因为几乎得不到总体所有观察值)可以(根据理论分析)假定它服从某种分布,(sample distribution),样本分布也称经验分布,指一个样本中各观察值的形成的相对频数(频率)分布。当样本容量n逐渐增大时,样本分布逐渐接近总体的分布。,抽样分布(sampling distribution),抽样分布
8、:样本统计量的概率分布,是一种理论分布。在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布 样本统计量是样本的函数,依据不同的样本计算出来的值是不同的,所以统计量是随机变量样本均值, 样本比例,样本方差等,样本均值的抽样分布,在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布,总体分布、样本均值的抽样分布(例题分析),【例】设一个总体,含有4个元素(个体) ,即总体单位数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4 。总体分布、总体的均值、方差及分布如下,均值和方差, 现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16个
9、样本。所有样本的结果为, 计算出各样本的均值,如下表。并给出样本均值的抽样分布,样本均值的分布与总体分布的比较 (例题分析), = 2.5 2 =1.25,的分布形式与原有总体和样本容量n的大小有关,总体分布,样本均值的抽样分布与中心极限定理,当总体服从正态分布N(,2)时,来自该总体的所有容量为n的样本的均值x也服从正态分布,x 的数学期望为,方差为2/n。即xN(,2/n),中心极限定理 (central limit theorem),中心极限定理:设从均值为,方差为 2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布,中心极限定理
10、(central limit theorem),x 的分布趋于正态分布的过程,抽样分布与总体分布的关系,样本均值的数学期望样本均值的方差(方差的概率意义在于刻画了随机变量取值的分散程度。方差越小,随随机变量的取值越集中在期望值附件。) 重复抽样,样本均值的抽样分布,抽样的一般程序,界定总体:对从中抽取样本的总体范围与界限作明确的界定 制定抽样框:依据已经明确界定的总体范围,收集总体中全部抽样单位的名单,并通过对名单进行统一编号来建立起供抽样使用的抽样框 决定抽样方案:选择抽样方法,确定样本规模 实际抽取样本:1.先抽好样本,再调查 2.一边抽样一边调查 评估样本质量:对样本的质量、代表性、偏差
11、等进行初步的检验和衡量,概率抽样的方法,抽样的类型,偶遇抽样判断抽样定额抽样雪球抽样,简单随机抽系统多层抽样分层抽样整群抽样多段抽样,概率抽样,非概率抽样,抽样类型,三、概率抽样的方法,1.简单随机抽样: 概率抽样的最基本形式 方法: 1.总体较少:搅拌抽签; 2.总体较多:用随机数表 3.利用EXCEL的randbetween(a,b)函数实现简单随机抽样,三、概率抽样的方法,1.简单随机抽样概念:一般地,设一个总体的个体数为N,如果通过逐个不放回地抽取的方法从中抽取n (nN) 个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。要点:它要求被抽取样本的总体的个体数
12、有限它是从总体中逐个进行抽取它是一种不放回抽样它是一种等概率抽样,三、概率抽样的方法,1.简单随机抽样抽签法(抓阄法)将总体中的所有个体(共N个)编号(号码可以从1到N),并把号码写在形状、大小相同的号签上( 号签可以用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌。抽签时,每次从中抽出1 个号签,连续抽取n次,就得到一个容量为n的样本。对个体编号时,也可以利用已有的编号。例如学生的学号,座位号等。,三、概率抽样的方法,练习1.高二(21)班有53名同学,现要从中抽取8名去参加一个座谈会,请写出用抽签法抽选的过程。2.假设一个总体有5个元素,分别记为a、b、c、d、e,
13、采用抽签法抽取一个容量为2的样本,样本共有多少个?为了考察某公司生产的250克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60件产品进行检查.,当总体的个数较多时,将总体“搅拌均匀”比较困难,抽签法产生的样本代表性差的可能性很大。,三、概率抽样的方法,1.简单随机抽样随机数表法随机数表是统计工作者用计算机生成的随机数,保证表中的每个位置上的数字是等可能出现的用随机数表进行抽样的步骤:将总体中个体编号;选定开始的数字;获取样本号码用随机数表抽取样本,可以任选一个数作为开始,读数的方向可以向左,也可以向右、向上、向下等等。因此并不是唯一的由于随机数表是等概率的,因此利用随机数表抽取样本保证了被抽
14、取个体的概率是相等的,练习例:为了考察某公司生产底250克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60件产品进行检查.S1,将800袋牛奶编号,可以编为000,001,799;S2,在随机数表中任意选一个数,例如第8行第7列的数7;S3,从选定的数7开始向右读,得到一个三位数,如果这个三位数在000799范围内,则取出,否则去掉;继续向右读,得下一个三位数;依次下去,直到样本的60个号码全部取出.将总体中的个体编号时从000开始,用意何在?当随机地选定开始读数的数后,读数的方向只能向右吗?,三、概率抽样的方法,三、概率抽样的方法,练习将全班同学按学号编号,制作相应的卡片号签,放入同一个箱
15、子里均匀搅拌,从中抽出15个号签,就相应的15名学生对看足球比赛的喜爱程度(很喜爱、喜爱、一般、不喜爱、很不喜爱)进行调查。上述问题中抽取样本的方法用随机数表法来进行!规则1:从269页表中第3行第11列的两位数开始,依次向下读数,到头后再转向它左面的两位数号码,并向上读数,以此下去,直到取足样本。规则2:从269页表中第12行第10列的两位数开始,依次向左读数,到头后再转向它下面的两位数号码,并向右读数,以此下去,直到取足样本。,三、概率抽样的方法,1.简单随机抽样利用EXCEL的randbetween(a,b)函数实现简单随机抽样例:某总体共3000人(四位数),需要从中抽取100人作为样
16、本进行调查打开EXCEL,用鼠标左键点击1A,点开fx,出现一个对话框,在对话框的选择类别这一栏中选择“数学与三角函数”,在选择函数这一栏中选择randbetween,在randbetween后又出现对话框,在对话框的bottom栏填写最小数,在top栏填写最大数,鼠标左键点击确定,在1A栏出现一个随机数字,下拉该栏到100A处就出现了100个随机数字。,三、概率抽样的方法,1.简单随机抽样简单随机抽样方法的优缺点优点:可能产生代表性样本缺点:不容易做抽样元素多,编号难必须能够接触到被选中的个体成分比例难,三、概率抽样的方法,2.系统抽样(等距抽样或间隔抽样) 定义:等距抽样或机械抽样,将总体
17、的单位编号排序后,按照固定的间隔抽取个体组成样本的方法。步骤:编号确定抽样间距确定抽样起点等间距抽样,三、概率抽样的方法,2.系统抽样(等距抽样)举例:一个礼堂有30排座位,每排有40个座位。一次报告会礼堂坐满了听众。会后为听取意见,需要抽取30名听众进行座谈,除了用简单随机抽样获得样本外,你能否设计其他的抽取样本的方法?留下每排座位号为20的30名听众进行座谈。注意:这种抽取样本的方法与简单随机抽样有什么区别?你能说出操作步骤吗?,2.系统抽样(等距抽样)优点:简便易行条件:抽样框里的元素应该是随机排列的.。,三、概率抽样的方法,三、概率抽样的方法,注意1:系统抽样的一个十分重要的前提条件,
18、是总体中个体的排列,相对于研究的变量来说是随机的,即不存在某种与研究变量相关的规则分布。否则,系统抽样的结果将会产生极大的偏差。例如:从总体2000户家庭的社区中,抽取一个50户家庭的样本进行调查消费状况的调查,而这2000户家庭的名单是按每个家庭总收入的多少,由高到低的顺序排列的。初始号码为3和38,所抽样本家庭平均收入有很大区别,消费状况也有很大区别。注意2:元素排列的周期性可能导致抽样的重大偏差!例如:每个班级内的50名学生按照学生成绩的高低来排序,每个班抽取一名学生组成样本,初始号码为2和48号,所抽样本的平均成绩差别很大,三、概率抽样的方法,2.系统抽样(等距抽样)下列抽样不是系统抽
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 抽样 ppt 课件

链接地址:https://www.31ppt.com/p-1356606.html