简单随机抽样系统抽样分层抽样.ppt
简单随机抽样,回顾(初中知识):总体、个体、样本、样本容量 的概念.,总体:所要考察对象的全体。,个体:总体中的每一个考察对象。,样本:从总体中抽取的一部分个体叫做这个总 体的一个样本。,样本容量:样本中个体的数目。,在高考阅卷过程中,为了统计每一道试题的得分情况,如平均得分、得分分布情况等,如果将所有考生的每题的得分情况都统计出来,再进行计算,结果是非常准确的,但也是十分烦琐的,那么如何了解各题的得分情况呢?,通常,在考生有这么多的情况下,我们只从中抽取部分考生(比如说1000名),统计他们的得分情况,用他们的得分情况去估计所有考生的得分情况。,联系生活,样本 总体,估计,思 考:样本一定能准确地反应总体吗?,在1936年美国总统选举前,一份颇有名气的杂志的工作人员做了一次民意测验,调查兰顿 和罗斯福中谁将当选下一届总统。为了了解公众意向,调查者通过电话簿和车辆登记簿上的名单给一大批人发了调查表(在1936年电话和汽车只有少数富人拥有),通过分析收回的调查表,显示兰顿非常受欢迎。于是此杂志预测兰顿将在选举中获胜。实际选举结果正好相反,最后罗斯福在选举中获胜。其数据如下:,思 考,问题:如何科学地抽取样本?使得样本能比较准确地反映总体,搅拌均匀使得每个个体被抽取的机会均等合理、公平,现从我校高一(6)班54名同学中选取10名参加全市文艺汇演,为保证选取的公平性,你打算如何操作?,抽签决定,实 例 一,开始,抽签法,54名同学从0到53编号,制作编号为0到53的号签(共54个),将54个号签搅拌均匀,随机从中逐一抽出10个号签,与所抽取号码一致的学生即被选中,结束,抽签法的一般步骤:,(1)将总体中的N个个体编号;,(2)将这N个号码写在形状、大小相 同的号签上;,(3)将号签放在同一箱中,并搅拌均匀;,(4)从箱中每次抽出1个号签,连续抽出n次;,(5)将总体中与抽到的号签编号一致的n个个体取出。,(总体个数N,样本容量n),简单随机抽样的概念,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(nN),如果每次抽取时总体内的各个个体被抽到的机会都相等,这种抽样方法叫做简单随机抽样。,抽签法(抓阄法)是一种常见的简单随机抽样方法,注意以下四点:,(1)它要求被抽取样本的总体的个体数有限;,(2)它是从总体中逐个进行抽取;,(3)它是一种不放回抽样;,(4)它是一种等概率抽样(每个个体入样的概率 n/N)。,简 单 随 机 抽 样,C,简 单 随 机 抽 样,及时检测一:下列抽取样本的方式是属于简单随机抽样的是()从无限多个个体中抽取100个个体作样本;盒子里有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出一个零件进行质量检验 后,再把它放回盒子里;从8台电脑中不放回的随机抽取2台进行质量检验(假设8台电脑已编好号,对编号随机抽取)A.B.C.D.以上都不对,用抽签法抽取样本时,编号的过程有时可以省略(如果已有编号),但制签的过程就难以省去了,而且制签也比较麻烦,有简化制签的方法吗?,简化制签过程的一个有效方法就是制作一个表,其中的每个数都是用随机方法产生的,这样的表称为随机数表,于是,我们只需要按一定的规则到随机数表中选取号码就可以了,这种抽样方法叫做随机数表法,简 单 随 机 抽 样,及时检测二:要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,若用抽签法抽取,请写出其过程。,随机数表法,随机数表:,制作一个表(由数字0,1,2,.,9组成),表中各个位置上的数都是随机产生的(随机数)即每个数字在表中各个位置上出现的机会都是一样。,简 单 随 机 抽 样,随机数表,简 单 随 机 抽 样,范例:要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,用随机数表法抽取的过程如下,简 单 随 机 抽 样,第一步,先将800袋牛奶编号,可以编为000,001,799,第二步,在随机数表中任选一个数,例如选出第8行第7 列的数7.(为了便于说明,下面摘取了附表1的第6行至第10行),第三步,从选定的数7开始向右读(读数的方向也可以是向左、向上、向下等),得到一个 三位数 785,由于785799,说明号码785在总体内,将它取出;继续向右读,得到916,由于916799,将它去掉,按照这种方法继续向右读,又取出567,199,507,依次下去,直到样本的60个号码全部取出,这样我们就得到一个容量为60的样本.,简 单 随 机 抽 样,随机数表法,随机数表:,表由数字0,1,2,.,9组成,表中各个位置上的数都是随机产生的(随机数)即每个数字在表中各个位置上出现的机会都是一样。,第一步、先将总体中的所有个体(共有N个)编号,第二步、然后在随机数表内任选一个数作为开始,第三步、再从选定的起始数,沿任意方向取数(不在 号码范围内的数、重复出现的数必须去掉),第四步、最后根据所得号码抽取总体中相应的个体,得到总体的一个样本.,步 骤:,编号、选数(起始数)、取数、抽取.,简 单 随 机 抽 样,系统抽样,用抽签法抽取样本的步骤:,简记为:编号;制签;搅匀;抽签;取个体。,用随机数表法抽取样本的步骤:,简记为:编号;选数;读数;取个体。,适用范围:总体中个体数较少的情况,抽取的样本容量也较小时。,【探究】:某学校为了了解高一年级学生对教师教学的意见,打算从高一年级500名学生中抽取50名进行调查,用简单随机抽样获取样本方便吗?你能否设计其他抽取样本的方法?,我们按照下面的步骤进行抽样:第一步:将这500名学生从1500开始进行编号;第二步:确定分段间隔k,对编号进行分段.由于 k=500/50=10,这个间隔可以定为10,将编号分段为 110,1120,491500;第三步:从号码为110的第一个间隔中用简单随机抽样 的方法确定第一个个体编号,假如为6号;第四步:从第6号开始,每次增加10,得到 6,16,26,36,496.这样就得到一个样本容量为 50的样本.,一.系统抽样的定义:要从容量为 N 的总体中抽取容量为 n 的样本,可将总体分成均衡的若干部分,然后按照一定的规则,从每一部分抽取一个个体得到所需要的样本,这种抽样的方法叫做系统抽样。,【探究】:某学校为了了解高一年级学生对教师教学的意见,打算从高一年级500名学生中抽取50名进行调查,用简单随机抽样获取样本方便吗?你能否设计其他抽取样本的方法?,我们按照下面的步骤进行抽样:第一步:将这500名学生从1开始进行编号;第二步:确定分段间隔k,对编号进行分段.由于 k=500/50=10,这个间隔可以定为10,将编号分段为 110,1120,491500;第三步:从号码为110的第一个间隔中用简单随机抽样 的方法确定第一个个体编号,假如为6号;第四步:从第6号开始,每次增加10,得到 6,16,26,36,496.这样就得到一个样本容量为 50的样本.,【例题解析】例1、某校高中三年级的295名学生已经编号为1,2,295,为了了解学生的学习情况,要按1:5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程。,解:第一步:样本容量为2955=59.,第二步:确定分段间隔k=5,将编号分段15,610,291295;,第三步:采用简单随机抽样的方法,从第一组5名学生中抽出一名学生,如确定编号为L的学生,依次取出的学生编号为L+5,L+10,L+15,L+290,这样就得到一个样本容量为59的样本.,两种抽样方法比较,练习:某中学有高一学生322名,为了了解学生的身体状况,要抽取一个容量为40的样本,用系统抽样法如何抽样?,第一步,随机剔除2名学生,把余下的320名学生编号为1,2,3,320.,第二步,把总体分成40个部分,每个部分有8个个体.,第三步,在第1部分用抽签法确定起始编号L.,第四步,将编号为L,L+8,L+16,L+312共40号码取出,得到样本容量为40的样本。,分层抽样,例如要调查我校高一学生的平均身高,由于男生一般比女生高,故用简单随机抽样或系统抽样,都可能使样本不具有好的代表性。对于此类抽样问题,我们需要一个更好的抽样方法来解决。下面我们探究:,分层抽样,某地区有高中生2400人,初中生10800人,小学生11100人,当地教育部门为了了解本地区中小学生的近视率及其形成原因,要从本地区的中小学生中抽取1%的学生进行调查。你认为应当如何抽取样本?不同年龄阶段的学生的近视情况可能存在明显差异,因此,宜将全体学生分成高中、初中和小学三部分分别抽样。另外,三部分的学生人数相差较大,因此,为了提高样本的代表性,还应考虑他们在样本中所占比例的大小。,探究,某地区有高中生2400人,初中生10800人,小学生11100人,当地教育部门为了了解本地区中小学生的近视率及其形成原因,要从本地区的中小学生中抽取1%的学生进行调查。你认为应当如何抽取样本?由于样本容量与总体个体数之比为1:100,因此,样本中包含的各部门的个体数应该是:2400/100,10900/100,11100/100即抽取24名高中生,109名初中生和110名小学生作为样本。,探究,分层抽样,分层抽样,一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样。,适用范围:分层抽样适用于总体由差异明显的几部分构成,分层抽样的操作步骤为:,第一步,计算样本容量与总体的个体数之比。第二步,将总体分成互不交叉的层,按比例确定各 层要抽取的个体数。第三步,用简单随机抽样或系统抽样在各层中抽取 相应数量的个体。第四步,将各层抽取的个体合在一起,就得到所取 样本。注:样本容量与总体的个数之比是分层抽样的比例常数,按这个比例可以确定各层应抽取的个体数,如果各层应抽取的个体数不都是整数该如何处理?,应该调整样本容量,剔除个体,【例一】一个单位的职工500人,其中不到35岁的有125人,35到49岁的有280人,50岁以上的有95人。为了了解这个单位职工与身体状况有关的某项指标,要从中抽取一个容量为100的样本。试问:应用如何抽取?,分层抽样例题:,解:(1)确定样本容量与总体的个体数之比100:500=1:5。,(3)利用简单随机抽样或系统抽样的方法,从各年龄段分别抽取25,56。19人,然后合在一起,就是所抽取的样本。,(2)利用抽样比确定各年龄段应抽取的个体数,依次为,即25,56,19。,【例二】已知甲、乙、丙三个车间一天内生产的产品分别是150件、130件、120件,为了掌握各车间产品质量情况,需从中取出一个容量为40的样本,应如何抽取?15,13,12,分层抽样例题:,强调两点:(1)分层抽样是等概率抽样,它也是公平的。用分层抽样从个体为N的总体中抽取一个容量为n的样本时,在整个抽样过程中每个个体被抽到的概率相等,都等于n/N。(2)分层抽样是建立在简单随机抽样或系统抽样的基础上的,由于它充分利用了已知信息,因此它获取的样本更具代表性,在实用中更为广泛。,