03第三章简单随机抽样.ppt
《03第三章简单随机抽样.ppt》由会员分享,可在线阅读,更多相关《03第三章简单随机抽样.ppt(38页珍藏版)》请在三一办公上搜索。
1、第三章 简单随机抽样,第一节 简单随机抽样概述,一、简单随机抽样的概念定义之一:简单随机抽样就是从总体N个抽样单元中,一次抽取n个单元时,使全部可能的 种不同的样本被抽到的概率均相等,即都等于1/A。定义之二:简单随机抽样是从总体的N个抽样单元中,每次抽取一个单元时,使每一个单元都有相等的概率被抽中,连续抽n次,以抽中的n个单元组成简单随机样本。按简单随机抽样,抽到的样本称为简单随机样本。简单随机抽样是一种最简单、最基本的抽样组织形式。它适用于均匀总体,即具有某种特征的总体单位均匀地分布于总体的各个部分。简单随机抽样具有下列优点:,首先,在理论上最符合随机原则。对此可有二种理解:一种是总体中各
2、个单位被抽中的机会相等。设总体有N个单位,各单位被抽中的概率均为。另一种是总体中各个样本被抽中的概率相等。我们知道,一个总体N中可以抽取许多个容量为 的样本,通常情况下按组合形式有 个样本,那么,在一次抽样中,某个样本被抽中的概率为,这个概率对每个可能的样本都相等。简单随机抽样遵循这种等可能性原则,为进行抽样估计,计算抽样误差,提供了重要前提条件。,其次,它是设计其他更复杂抽样形式的基础。例如,设计分层抽样,将总体划分为若干层,然后对各个层实施简单随机抽样。对一个非常大的总体,需要分若干个阶段进行抽样。例如,进行全国性抽样调查,第一阶段可以由全国抽取若干个省份,第二阶段再由抽中的省份抽取若干个
3、县(市);第三阶段再由抽中的县(市)抽取若干个乡(街道);第四阶段再由抽中的乡(街道)抽取若干个村(居委会)等等。在这种多阶段抽样中,每个阶段中抽取样本单位均可采用简单随机抽样方法。,再次,是衡量其他抽样效果的比较标准。抽样效果首先体现在抽样误差的大小上。而反映或者比较某一抽样形式的误差大小,需要有一个比较指标,这通常采用抽样设计效果指标,这个抽样设计效果是以某一抽样形式的方差与简单随机抽样的方差进行对比,设前者为,后者为,那么,抽样设计效果为:这个设计效果 取反指标的形式。若 值大于等于1,即,则抽样估计效果较差;反之,小于l,即,则抽样估计效果较好。,例如,用分层抽样从某企业抽100个职工
4、户,调查每户平均收入,得到抽样方差=25,以相同的单位数用简单随机抽样形式,得到抽样方差=49,则抽样设计效果为:=2549=0.51 这表明在同样抽取100户条件下,用分层抽样优于简单随机抽样。并且,可以利用抽样设计效果 计算有效单位数:式中,为某一抽样形式的样本单位数,表示在相同的抽样方差下,采用简单随机抽样形式所需要的样本单位数。在上面的例子中,=100户,=0.51,所以,=1000.51=196,二、简单随机抽样的具体实施方法(一)抽签法抽签法是先对总体N个抽样单元分别编上1到N的号码,再制作与之相对应的N个号签并充分摇匀后,从中随机地抽取n个号签(可以是一次抽取n个号签,也可以一次
5、抽一个号签,连续抽n次),与抽中号签号码相同的n个单元即为抽中的单元,由其组成简单随机样本。(二)随机数法随机数法就是利用随机数表、随机数骰子或计算机产生的随机数进行抽样。,1、随机数表及其使用方法随机数表是由0到9的10个阿拉伯数字进行随机排列组成的表。所谓随机排列,即每个数字都是按等概和重复独立抽取的方式排定的。随机数表的用途很多,不仅可以组织等概样本,也可组织不等概样本。简单随机抽样属等概率抽样,在使用随机数表时,要注意以下几点:每次使用时,确定使用哪页及哪行哪列的数字为起点,必须是随机的。设总体容量为N,若N的位数为r,则一定要从r位数中抽取。遇到1至N的数可直接使用;遇到其它的数不能
6、直接使用。,当r2时,可从含有起点数字左边的r位数开始,也可从右边的r位数开始。可从起点开始向下抽取,也可向右抽取。但一经确定使用哪一种方式,就必须用一种方式抽取全部单元号,中途不能变更。在重复抽样时,遇到重复的数字应重复使用;在不重复抽样时,遇到重复的数字应舍去不用。随机数表法一般分下述几步:第一步:确定起点页码;第二步:确定起点的行数与列数;第三步:确定所抽样本单元的号码。快速抽取的常用方法有:余数法。如果N是个r位数,由1到 随机取一个数R,而 是N的最大r位整倍数,则编号等于R除N所得余数的单元便被选中。商数法;修正余数法;修正商数法;独立选择数位法。,2、随机数骰子及其使用方法随机数
7、骰子是由均匀材料制成的正二十面体(通常的骰子是正六面体,即正方体),面上刻有09的数字各2个。两个有名的试验试验一:随意数试验。让六个人写下100个自己随意想到的三位数,将这些数内的0、1、9数字列成次数分布表。可见,六个人都对数字存在偏好,如第一个人更加偏好数字4、3、0;第二个人则偏好数字1、8、4;等等。这种由于数字偏好所引起的偏估类型可称之为数字偏误。,试验二:着色试验。让四个人将1010方格的纸板着色,可供选择的颜色有蓝、绿、红、白和黄色五种,对每一个四分象限来说,规定每种颜色只能在每行和每列出现一次。每个方格以其所在的列号与行号表示,如(4,6)代表第四列第六行的方格。请四个人对这
8、100个方格随意选择行列号,而对其着色。将这些由这四个人着色所得到的资料形成次数分布表如下:四个人对方格着色的次数分布,可见四个人都对颜色存在偏好,如第一个人偏爱绿色,第二个人偏爱蓝色等。这种由于对颜色偏好所引起的偏估类型,可称之为颜色偏误。结论:随意抽样随机抽样,三、简单随机抽样的方法评估1.简单随机抽样对总体不加任何限制,等概率地从总体中直接抽取样本,是最简单、最单纯的抽样技术,它具有计算简便的优点,是研究其它复杂抽样技术的基础,也是比较各种抽样技术之间估计效率的标准,同时,从理论上讲简单随机抽样在各种抽样技术中是贯彻随机原则最好的一种,并且数学性质很简单,是等概率抽样的特殊类型。2.因为
9、是等概率抽取样本,所以要求总体在所研究的主要标志上同质性或齐性(共性)较好,也即总体要比较均匀;要求样本容量要比较大,以保证样本对总体具有充分的代表性。但是,在社会经济现象中,这种均匀总体是很少见的。因此,实际工作中很少单纯使用简单随机抽样方法。,3.直接从总体中抽取样本,未能充分利用关于总体的各种其它已知信息,以有效地提高样本的代表性,并进而提高抽样的估计效率。4.简单随机抽样要求在抽样前编制出抽样框,并对每一个总体抽样单元进行编号,而且当总体抽样单元的分布比较分散时,样本也可能会比较分散,这些都会给简单随机抽样方法的运用造成许多的不便,甚至在某些情况下干脆无法使用。结论:在此基础上研究其它
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 03 第三 简单 随机 抽样
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-6111269.html