《筒单随机抽样》PPT课件.ppt
第一讲随 机 抽 样,重点难点重点:各种随机抽样方法的定义、特点及适用范围难点:理解随机抽样的必要性和重要性及抽样方法的合理性,知识归纳1总体、个体、样本把所考察对象的某一数值指标的全体构成的集合看成总体,构成总体的每一个元素为个体从总体中随机抽取若干个个体构成的集合叫做总体的一个样本2随机抽样抽样时保持每一个个体都可能被抽到,每一个个体被抽到的机会是均等的,满足这样条件的抽样是随机抽样,3简单随机抽样(1)定义:设一个总体含有N个个体,从中不放回地抽取n个个体作为样本(nN),如果每次抽取时,总体内的各个个体被抽到的机会都相等,称这种抽样方法为简单随机抽样(2)简单随机抽样的特点如下:它要求总体中个体数有限它是从总体中逐个地进行抽取它是一种不放回抽样它每一次抽取时总体中的各个个体有相同的可能性被抽到,(3)常用的简单随机抽样方法抽签法先将总体中的所有N个个体编号(号码可以从1到N),并把号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条、竹块等制作),然后将这些号签放在同一个容器里,搅拌均匀抽签时,每次从中抽出1个号签,连续抽取n次,就得到一个容量为n的样本抽签法的优点是简单易行缺点是,当总体的容量非常大时,费时、费力又不方便况且,如果标号的纸片或小球搅拌得不均匀,可能导致抽样的不公平,随机数法a随机数表随机数表是由0,1,2,9这10个数字组成的数表,并且表中的每一位置出现各个数字的可能性相同,b用随机数表抽样的步骤第一步:将总体中的个体编号为了保证抽取样本有很好的代表性,编号时位数要相同第二步:选定开始的数字为了保证所选定数字的随机性,应在面对随机数表之前就指出开始数字的纵横位置第三步:获取样本号码随机确定一个读数方向,读数的方向可以向右,也可以向左、向上、向下等,重复的号码跳过,4系统抽样(1)定义:当总体元素个数很大时,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体得到所需要的样本,这种抽样方法叫做系统抽样,(2)系统抽样的步骤编号采用随机的方式将总体中的个体编号,编号的方式可酌情决定分段先确定分段的间隔k.当(N为总体中的个体数,n为样本容量)是整数时,k;当 不是整数时,通过从总体中随机剔除一些个体使剩下的总体中个体总数N能被n整除,这时k,确定起始个体编号在第1段用简单随机抽样确定起始的个体编号S.按照事先确定的规则抽取样本通常是将S加上间隔k,得到第2个个体编号Sk,再将(Sk)加上k,得到第3个个体编号S2k,这样继续下去,获得容量为n的样本其样本编号依次是:S,Sk,S2k,S(n1)k.,5分层抽样(1)定义:当总体由有明显差别的几部分组成时,按某种特征在抽样时将总体中的各个个体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫做分层抽样分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个体数在总体中所占比例抽取各层抽取时采用简单随机抽样或系统抽样,(2)分层抽样的步骤分层;按比例确定每层抽取个体的个数;各层抽样(方法可以不同);汇合成样本(3)分层抽样的优点分层抽样时,每个个体被抽到的机会是均等的,由于分层抽样充分利用了己知信息,充分考虑了保持样本结构与总体结构的一致性使样本具有较好的代表性,而且在各层抽样时,可以根据具体情况采取不同的抽样方法,因此分层抽样在实践中有着非常广泛的应用,6.三种抽样方法的比较,误区警示1抽样时不能抽取方便样本2用随机数表抽样时,由于编号时位数不一致,导致抽样的不均匀3系统抽样时,当总体个数N不能被样本容量整除时,剔除多余个体,必须随机抽样,剔除多余个体后要重新编号,一、统计思想我们生活在一个数字化时代,时刻都在和数据打交道,了解产品的合格率、农作物的产量、商品的销售量、自然资源、社会资源、就业率等等数据都要通过调查收集数据获得如何在减少人力、物力资源浪费的前提下,获得可靠的数据成为统计中的首要问题,统计就是研究如何收集整理、分析数据的一门学科,随机抽样研究如何抽取样本,使样本数量少,且具有好的代表性用样本估计总体研究的是怎样处理获得的数据,才能使样本更好地反映总体的信息,例1下列抽取样本的方式是否属于简单随机抽样?说明道理(1)从无限多个个体中抽取100个个体作样本;(2)盒子里共有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意抽出一个零件进行质量检验后再把它放回盒子里,分析:用简单随机抽样的四个特点进行判断解析:(1)不是简单随机抽样,由于被抽取样本的总体的个数是无限的而不是有限的(2)不是简单随机抽样,由于它是放回抽样,一个总体含有150个个体,用简单随机抽样方法从该总体中抽取一个容量为5的样本,则指定的某个个体被抽到的概率为_解析:每个个体被抽到的概率相等,为,例2某商场想通过检查发票及销售记录的2%来快速估计每月的销售总额采取如下方法:从某本发票的存根中随机抽一张,如15号,然后按序往后将65号,115号,165号,发票上的销售额组成一个调查样本这种抽取样本的方法是()A抽签法B随机数表法C系统抽样法 D其他方式的抽样,解析:上述抽样方法是将发票平均分成若干组,每组50张从第一组中抽出了15号,以后各组抽1550n(n为自然数)号符合系统抽样的特点故选C.,1.为了了解参加一次知识竞赛的3204名学生的成绩,决定采用系统抽样的方法抽取一个容量为80的样本,那么总体中应随机剔除的个体数目是()A2 B3 C4 D5解析:因为320480404,所以应随机剔除4个个体,故选C.答案:C,2.工厂生产的产品,用传送带将产品送入包装车间之前,检查人员从传送带上每隔5分钟抽一件产品检查,问这是一种什么抽样方法?解析:这是系统抽样因为每5分钟抽一件,相当于把每件产品编号后,5分钟生产的产品为一段,在每一段中抽取一件产品,所以满足系统抽样的原则答案:系统抽样,3有20位同学,编号从120,现在从中抽取4人的作文卷进行调查,用系统抽样方法确定所抽的编号为()A5,10,15,20 B2,6,10,14C2,4,6,8 D5,8,11,14,答案:A,解析:将20分成4个组,每组5个号,间隔等距离为5,故选A.,例3某电台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12000人,其中持各种态度的人数如下表:电视台为进一步了解观众的具体想法和意见,打算从中抽取60人进行更为详细的调查,应当怎样进行抽样?,分析:因为总体中人数较多,所以不宜采用简单随机抽样又由于持不同态度的人数差异较大,故也不宜用系统抽样法,而以分层抽样法为妥,(09广东)某单位200名职工的年龄分布情况如图所示,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1200编号,并按编号顺序平均分为40组(15号,610号,196200号)若第5组抽出的号码为22,则第8组抽出的号码应是_若用分层抽样方法,则40岁以下年龄段应抽取_人,解析:间距为5,第5组抽22号,第8组抽出的号码为225(85)37.40岁以下的职工人数为100,应抽取 答案:3720,例4某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,270;使用系统抽样时,将学生统一随机编号为1,2,270,并将整个编号依次分为10段如果抽得号码有下列四种情况:,7,34,61,88,115,142,169,196,223,250;5,9,100,107,111,121,180,195,200,265;11,38,65,92,119,146,173,200,227,254;30,57,84,111,138,165,192,219,246,270.关于上述样本的下列结论中,正确的是A、都不能为系统抽样B、都不能为分层抽样C、都可能为系统抽样D、都可能为分层抽样,解析:因为为系统抽样,所以选项A不对;因为为分层抽样,所以选项B不对;因为不为系统抽样,所以选项C不对故选D.,例.为了考察某校的教学水平,将抽查这个学校高三年级的部分学生本年度的考试成绩.为了全面反映实际情况,采取以下三种方式进行抽查(已知该校高三年级共有20个班,并且每个班内的学生已经按随机方式编好了学号,假定该校每班学生的人数相同):从高三年级20个班中任意抽取一个班,再从该班中任意抽取20名学生,考察他们的学习成绩;每个班抽取1人,共计20人,考察这20名学生的成绩;,把学生按成绩分成优秀,良好,普通三个级别,从其中共抽取100名学生进行考察(已知该校高三学生共1000人,若按成绩分,其中优秀生共150人,良好生共600人,普通生共250人).根据上面的叙述,试回答下列问题:(1)上面三种抽取方式的总体,个体,样本分别是什么?每一种抽取方式抽取的样本中,样本容量分别是多少?(2)上面三种抽取方式各自采用的是何种抽取样本的方法?(3)试分别写出上面三种抽取方式各自抽取样本的步骤.,【解】(1)这三种抽取方式的总体都是指该校高三全体学生本年度的考试成绩,个体都是指高三年级每个学生本年度的考试成绩.其中第一种抽取方式的样本为所抽取的20名学生本年度的考试成绩,样本容量为20;第二种抽取方式的样本为所抽取的20名学生本年度的考试成绩,样本容量为20;第三种抽取方式的样本为所抽取的100名学生本年度的考试成绩,样本容量为100.,(2)三种抽取方式中,第一种采用的是简单随机抽样法;第二种采用的是系统抽样法和简单随机抽样法;第三种采用的是分层抽样法和简单随机抽样法.(3)第一种方式抽样的步骤如下:第一步,用抽签法在这20个班中任意抽取一个班;第二步,从这个班中按学号用随机数表法或抽签法抽取20名学生,考察其考试成绩.第二种方式抽样的步骤如下:第一步,用简单随机抽样法从第一个班中任意抽取一名学生,记其学号为a;第二步,在其余的19个班中,选取学号为a的学生,加上第一个班的一名学生,共计20人.,第三种方式抽样的步骤如下:第一步,分层.因为若按成绩分,其中优秀生共150人,良好生共600人,普通生共250人,所以在抽取样本时,应该把全体学生分成三个层次;第二步,确定各个层次抽取的人数.因为样本容量与总体的个数之比为100:1000=1:10,所以在每个层次中抽取的个体数依次为,即15,60,25;第三步,按层次分别抽取.在优秀生中用简单随机抽样法抽15人;在良好生中用简单随机抽样法抽取60人;在普通生中用简单随机抽样法抽取25人.,(浙江台州)现要完成下列3项抽样调查:从10盒酸奶中抽取3盒进行食品卫生检查科技报告厅有32排,每排有40个座位,有一次报告会恰好坐满了听众,报告会结束后,为了听取听众意见,需要请32位听众进行座谈东方中学共有160名教职工,其中一般教师120名,行政人员16名,后勤人员24名为了了解教职工对学校在校务公开方面的意义,拟抽取一个容量为20的样本较为合理的抽样方法是(),A简单随机抽样系统抽样分层抽样B简单随机抽样分层抽样,系统抽样C系统抽样简单随机抽样分层抽样D分层抽样系统抽样简单随机抽样解析:总体较少,宜用简单随机抽样;已分段,宜用系统抽样;各层间差距较大,宜用分层抽样,故选A.答案:A,一、选择题1在简单随机抽样中,某一个个体被抽中的机会是()A与第n次抽样有关,第一次抽中的机会要大些B与第n次抽样无关,每次抽中的机会都相等C与第n次抽样有关,最后一次抽中的机会大些D该个体被抽中的机会无法确定,答案B解析简单随机抽样中,每个个体被抽中的机会相等,且与先后顺序无关,2一年级有10个班,每个班有50名学生,随机编为1至50号,为了解他们的学生情况,要求每个班学号为30的学生留下来进行问卷调查,这里运用的抽样方法是()A分层抽样B抽签法C随机数表法 D系统抽样法答案D,3一工厂生产了某种产品24000件,它们来自甲、乙、丙3条生产线,现采用分层抽样的方法对这批产品进行抽样检查已知从甲、乙、丙3条生产线依次抽取的个体数恰好组成一个等差数列,则这批产品中乙生产线生产的产品数量是()A12000 B6000C4000 D8000,答案D解析由分层抽样的性质知,这批产品中甲、乙、丙3条生产线生产的新产品数量也成等差数列,再由等差数列性质知,乙生产线生产的产品数量为,4(文)在100个产品中,一等品20个,二等品30个,三等品50个,用分层抽样的方法抽取一个容量20的样本,则二等品中A被抽取到的概率()答案A解析每一个个体被抽到的概率相等,等于,一个单位有职工160人,其中有业务员120人,管理人员24人,后勤服务人员16人为了了解职工的身体健康状况,要从中抽取一定容量的样本现用分层抽样的方法得到业务员的人数为15人,那么这个样本容量为()A19 B20 C21 D22答案B解析由抽样比得,n20,故选B.,