六板块统计统计案例一节随机抽样.ppt
第六板块“统计、统计案例”第一节 随机抽样,巢湖市第一中学许串连,知识结构,简单随机抽样,系统抽样,分层抽样,统计案例,收集数据,整理分析数据,问题提出,1.我们生活在一个数字化时代,时刻都在和数据打交道,例如,产品的合格率,农作物的产量,商品的销售量,电视台的收视率等.这些数据常常是通过抽样调查而获得的,如何从总体中抽取具有代表性的样本,是我们需要研究的课题.,2.要判断一锅汤的味道需要把整锅汤都喝完吗?应该怎样判断?,将锅里的汤“搅拌均匀”,品尝一小勺就知道汤的味道,这是一个简单随机抽样问题,对这种抽样方法,我们从理论上作些分析.,知识梳理,1.简单随机抽样,(1)思想:设一个总体有N个个体,从中 地抽取n(nN)个个体作为样本,如果每次抽取时总体内的各个个体被抽到的,则这种抽样方法叫做简单随机抽样.,逐个不放回,机会都相等,思考1:根据你的理解,简单随机抽样有哪些主要特点?,(4)每个个体被抽到的机会都相等,抽样具 有公平性.,(3)抽取的样本不放回,样本中无重复个体;,(2)样本的抽取是逐个进行的,每次只抽取 一个个体;,(1)总体的个体数有限;,抽签法:第一步:将总体中的所有个体编号,并把号码 写在形状、大小相同的号签上.第二步:将号签放在一个容器中,并搅拌均匀.第三步:每次从中抽取一个号签,连续抽取n 次,就得到一个容量为n的样本.,(2)最常用的两种简单抽样方法-抽签法和随机数法,思考2:你认为抽签法有哪些优点和缺点?,缺点:当总体个数较多时很难搅拌均匀,产生的样本代表性差的可能性很大.,优点:简单易行,当总体个数不多的时候搅拌均匀很容易,个体有均等的机会被抽中,从而能保证样本的代表性.,随机数表法:第一步:将总体中的所有个体编号.第二步:在随机数表中任选一个数作为起始数.第三步:从选定的数开始依次向右(向左,向上,向下)读,将编号范围内的数取出,编 号范围外的数或已抽取的数去掉,直 到取满n个号码为止,就得到一个容量 为n的样本.,随机数法:利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数法,这里仅介绍随机数表法。,1简单随机抽样包括抽签法和随机数表法,它们都是等概率抽样,从而保证了抽样的公平性.,2简单随机抽样有操作简便易行的优点,适用当总体个体之间差异程度较小和数目较少时。抽签法适合于总体容量和样本容量较小时的情况,随机数法适合于总体数较大情况.,小结1:,一个总体中共有200个个体,用简单随机抽样的方法从中抽取一个容量为20的样本,则某一特定个体被抽到的可能性是。,0.1,检测1,2.当总体中的个体数很多时,用简单随机抽样抽取样本,操作上并不方便、快捷.因此,在保证抽样的公平性,不降低样本的代表性的前提下,我们还需要进一步学习其它的抽样方法,以弥补简单随机抽样的不足.,2.系统抽样,(1)思想:将总体分成均衡的n个部分,再按照预先定出的规则,从每一部分中抽取1个个体,即得到容量为n的样本.,(2)步骤:第一步:将总体的N个.第二步:确定,对编号进行分段.第三步:在第1段用 确定起始 个体编号.第四步:按照一定的规则抽取样本.,个体编号,分段间隔k,简单随机抽样,思考3:系统抽样适合在哪种情况下使用?与简单随机抽样比较,哪种抽样方法更使样本具有代表性?,总体中个体数比较多;系统抽样更使样本具有代表性.,典型例题,例1.某校高中三年级的295名学生已经编号为1,2,295,为了了解学生的学习情况,要按1:5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程。,第一步:按照1:5的比例,应该抽取的样本容量为2955=59,我们把259名同学分成59组,每组5人,第三步:采用简单随机抽样的方法,从第一组5名学生中抽出一名学生,不妨设编号为L(1L5),那么抽取的学生编号为L+5K(K=0,1,2,,58),得到59个个体作为样本,第二步:第一组是编号为15的5名学生,第2组是编号为610的5名学生,依次下去,59组是编号为291295的5名学生,如当L=3时的样本编号为3,8,13,288,293,例2从已编号为150的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是()A5,10,15,20,25 B3,13,23,33,43C1,2,3,4,5 D2,4,6,16,32,B,典型例题,2.系统抽样适合于总体的个体数较多的情形,操作上分四个步骤进行,除了剔除余数个体和确定起始号需要随机抽样外,其余样本号码由事先定下的规则自动生成,从而使得系统抽样操作简单、方便.,小结2,1.系统抽样也是等概率抽样,即每个个体被抽到的概率是相等的,从而保证了抽样的公平性.,3.设计科学、合理的抽样方法,其核心问题是保证抽样公平,并且样本具有好的代表性.如果要调查我校高一学生的平均身高,由于男生一般比女生高,故用简单随机抽样或系统抽样,都可能使样本不具有好的代表性.对于此类抽样问题,我们需要一个更好的抽样方法来解决.,3.分层抽样,(1)思想:若总体由 的几部分组成,抽样时,先将总体分成,然后按照,从各层独立地抽取一定数量的个体,再将各层取出的个体合在一起作为样本.,(2)步骤:第一步:计算样本容量与总体的个体数之比.第二步:将总体分成互不交叉的层,按比例确定 各层要抽取的个体数.第三步:用简单随机抽样或系统抽样在各层中抽 取相应数量的个体.第四步:将各层抽取的个体合在一起,就得到所 取样本.,差异明显,互不交叉的层,一定的比例,思考5:在分层抽样中,如果总体的个体数为N,样本容量为n,第i层的个体数为k,则在第i层应抽取的个体数如何计算?,思考6:样本容量与总体的个体数之比是分层抽样的比例常数,按这个比例可以确定各层应抽取的个体数,如果各层应抽取的个体数不都是整数该如何处理?,调节样本容量或剔除个体.,例3:一个地区共有5个乡镇,人口3万人,其中人口比例为3:2:5:2:3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程。,典型例题,(2)按照样本容量的比例随机抽取各乡镇应抽取的样本。3003/15=60(人),3002/15=40(人),3002/15=100(人),3002/15=40(人),3003/15=60(人),因此各乡镇抽取人数分别为:60人、40人、100人、40人、60 人。(3)将300人组到一起,即得到一个样本。,解:因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方法,具体过程如下:(1)将3万人分为5层,其中一个乡镇为一层。,例4:某高中共有900人,其中高一年级300人,高二年级200人,高三年级400人,现采用分层抽样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为()A15,5,25 B15,15,15 C10,5,30 D15,10,20,D,典型例题,小结3,2.分层抽样是按比例分别对各层进行抽样,再将各个子样本合并在一起构成所需样本.其中正确计算各层应抽取的个体数,是分层抽样过程中的重要环节.,1.分层抽样利用了调查者对调查对象事先掌握的各种信息,考虑了保持样本结构与总体结构的一致性,从而使样本更具有代表性,在实际调查中被广泛应用.,3.简单随机抽样是基础,系统抽样与分层抽样是补充和发展,三者相辅相成,对立统一.,简单随机抽样,系统抽样,分层抽样,抽样过程中每个个体被抽取的概率相等,将总体分成均衡几部分,按规则关联抽取,将总体分成几层,按比例分层抽取,用简单随机抽样抽取起始号码,总体中的个体数较少,总体中的个体数较多,总体由差异明显的几部分组成,从总体中逐个不放回抽取,用简单随机抽样或系统抽样对各层抽样,简单随机抽样是系统抽样和分层抽样的基础,例5.某单位有技工18人,技术员12人,工程师6人,要从这些人中抽取一个容量为n的样本;如果采用系统抽样和分层抽样方法抽取时,都不用剔除个体;如果样本容量增加一个,则在采用系统抽样时,需要在总体中先剔除1个个体,求样本容量n,典型例题,1.下列抽取样本的方式是简单随机抽样的有()从无限多个个体中抽取50个个体作为样本;箱子中有100只铅笔,从中选取10只进行试验。在抽样操作时,从中任意拿出一支检测后再放回箱子;从50个个体中一次性抽取5个个体作为样本。A0个 B1个 C2个 D3个,A,课堂练习,2.在一次有奖明信片的100 000个有机会中奖的号码(编号0000099999)中,邮政部门按照随机抽取的方式确定后两位是23的作为中奖号码,这是运用了_抽样方法.,系统,3.某单位有500名职工,其中不到35岁的有125人,35岁49岁的有280人,50岁以上的有95人.为了了解该单位职工与身体状况有关的某项指标,要从中抽取一个容量为100的样本,应该用_抽样法.,分层,4.某公司生产三种型号的轿车,产量分别为1200辆,6000辆和2000辆.为检验该公司的产品质量,现用分层抽样的方法抽取46辆进行检验,这三种型号的轿车依次应抽取_辆.,6、30、10,5.某城区有农民、工人、知识分子家庭共计2004户,其中农民家庭1600户,工人家庭303户,现要从中抽出容量为40的样本,则在整个抽样过程中,可以用到下列抽样方法:简单随机抽样;系统抽样;分层抽样中的()A B C D,D,6.为了解初一学生的身高、体重情况,打算在初一年级10个班的某两个班按男女生比例抽取样本,正确的抽样方法是()A.简单随机抽样 B.分层抽样C.先用抽签法,再用分层抽样D.先用分层抽样,再用随机数法,C,7.某社区有500个家庭,其中高收入家庭125户,中等收入家庭280户,低收入家庭95户,为了调查社会购买力的某项指标,要从中抽取1个容量为100户的样本,记做;某学校高一年级有12名女排运动员,要从中选出3个调查学习负担情况,记做.那么完成上述2项调查应采用的抽样方法是()(A)用简单随机抽样法,用系统抽样法(B)用分层抽样法,用简单随机抽样法(C)用系统抽样法,用分层抽样法(D)用分层抽样法,用系统抽样法,B,8.下列抽样中不是系统抽样的是()A.从标有115号的15个小球中任选3个作为样本,按 从小号到大号排序,随机确定起点i,以后为i+5,i+10(超过15则从1再数起)号入样B.工厂生产的产品,用传送带将产品送入包装车间 前,检验人员从传送带上每隔五分钟抽一件产品检验C.搞某一市场调查,规定在商场门口随机抽一个人进 行询问,直到调查到事先规定的调查人数为止D.电影院调查观众的某一指标,通知每排(每排人数 相等)座位号为14的观众留下来座谈,C,【课堂小结】1.简单随机抽样是一种最简单、最基本的抽样方法,也叫纯随机抽样,就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型。,2当总体中个体较多时,可采用系统抽样的方法进行抽样,系统抽样的步骤:“编号-分段-确定起始的个体号-抽取样本”在确定分段间隔k时应注意:分段间隔k为整数,当不是整数时,应采用等可能剔除的方法剔除部分个体,以获得整数间隔k。,3当总体由差异明显的几部分组成时采用分层抽样方法,应注意以下几点:分层抽样中分多少层、如何分层要视具体情况而定,原则是层内样本的差异要小,各层之间的样本差异要大,且互不重叠。所有层应采用同一抽样比等可能抽样。在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样。分层抽样的优点是:样本具有较强的代表性,谢谢同学们合作!,欢迎专家、同行指导!,