抽样和分层抽样.ppt
抽样方法,问题提出,1.简单随机抽样有哪两种常用方法?其操作步骤分别如何?,第二步,将号签放在一个容器中,并搅拌均匀.,抽签法:,第一步,将总体中的所有个体编号,并把号码写在形状、大小相同的号签上.,第三步,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.,第一步,将总体中的所有个体编号.,第三步,从选定的数开始依次向右(向左、向上、向下)读,将编号范围内的数取出,编号范围外的数去掉,直到取满n个号码为止,就得到一个容量为n的样本.,第二步,在随机数表中任选一个数作为起始数.,随机数表法:,2.当总体中的个体数很多时,用简单随机抽样抽取样本,操作上并不方便、快捷.因此,在保证抽样的公平性,不降低样本的代表性的前提下,我们还需要进一步学习其它的抽样方法,以弥补简单随机抽样的不足.,【探究】某学校为了了解高一年级学生对教师教学的意见,打算从高一年级500名学生中抽取50名进行调查,用简单随机抽样获取样本方便吗?你能否设计其他抽取样本的方法?,我们按照下面的步骤进行抽样:第一步:将这500名学生从1开始进行编号;第二步:确定分段间隔k,对编号进行分段.由于 k=500/50=10,这个间隔可以定为10;第三步:从号码为110的第一个间隔中用简单随机抽样 的方法确定第一个个体编号,假如为6号;第四步:从第6号开始,每隔10个号码抽取一个,得到 6,16,26,36,496.这样就得到一个样本容量为 50的样本.,系统抽样,一.系统抽样的定义:将总体平均分成几部分,然后按照一定的规则,从每一部分抽取一个个体作为样本,这种抽样的方法叫做系统抽样。,【说明】由系统抽样的定义可知系统抽样有以下特征:,(1)当总体容量N较大时,采用系统抽样。,(3)一定的规则通常指的是:在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号。,(2)将总体平均分成几部分指的是将总体分段,分段的间隔要求相等,因此,系统抽样又称等距抽样,这时间隔一般为k.,二、从容量为N的总体中抽取容量为n的样本,用系统抽样的一般步骤为:,(4)按照一定的规则抽取样本,通常是将起始编号L加上间隔k得到第2个个体编号L+K,再加上K得到第3个个体编号L+2K,这样继续下去,直到获取整个样本.,(1)将总体中的N个个体编号.有时可直接利用个体自身所 带的号码,如学号、准考证号、门牌号等;,(2)将编号按间隔k分段(kN).,(3)在第一段用简单随机抽样确定起始个体的编号L(LN,Lk)。,说明(1)分段间隔的确定:,当 是整数时,取k=;,当 不是整数时,可以先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量整除.通常取k=,(2)从系统抽样的步骤可以看出,系统抽样是把一个问题划分成若干部分分块解决,从而把复杂问题简单化,体现了数学转化思想。,思考:下列抽样中不是系统抽样的是()A、从标有115号的15个小球中任选3个作为样本,按从小号到大号排序,随机确定起点i,以后为i+5,i+10(超过15则从1再数起)号入样;B、工厂生产的产品,用传送带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验;C、搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止;D、电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈。,C,系统抽样与简单随机抽样比较,有何优、缺点?点评:(1)系统抽样比简单随机抽样更容易实施,可节约抽样成本;(2)系统抽样的效果会受个体编号的影响,而简单随机抽样的效果不受个体编号的影响;系统抽样所得样本的代表性和具体的编号有关,而简单随机抽样所得样本的代表性与个体的编号无关.如果编号的个体特征随编号的变化呈现一定的周期性,可能会使系统抽样的代表性很差.例如学号按照男生单号女生双号的方法编排,那么,用系统抽样的方法抽取的样本就可能会是全部男生或全部女生.(3)系统抽样比简单随机抽样的应用范围更广.,【例题解析】例1、某校高中三年级的295名学生已经编号为1,2,295,为了了解学生的学习情况,要按1:5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程。,解:样本容量为2955=59.,确定分段间隔k=5,将编号分15,610,291295;,采用简单随机抽样的方法,从第一组5名学生中抽出一名学生,如确定编号为3的学生,依次取出的学生编号为3,8,13,288,293,这样就得到一个样本容量为59的样本.,例2、从编号为150的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是()A5,10,15,20,25 B、3,13,23,33,43 C、1,2,3,4,5 D、2,4,6,16,32,B,例3:从2005个编号中抽取20个号码入样,采用系统抽样的方法,则抽样的间隔为()A99 B、99.5 C100 D、100.5,C,例4:某小礼堂有25排座位,每排20个座位,一次心理学讲座,礼堂中坐满了学生,会后为了了解有关情况,留下座位号是15的所有25名学生进行测试,这里运用的是 抽样方法。,系统,例5.采用系统抽样从个体数为83的总体中抽取一个样本容量为10的样本,那么每个个体入样的可能性为 _.,例6.从2004名学生中选取50名组成参观团,若采用下面的方法选取:先用简单随机抽样从2004人中剔除4人,剩下的2000个再按系统抽样的方法进行,则每人入选的机会()A.不全相等 B.均不相等 C.都相等 D.无法确定,C,系统抽样,088,188,288,388,488,588,688,788,888,988,1.在1000个有机会中奖的号码(编号为000999)中,在公证部门的监督下,按随机抽取的方法确定最后两位数为88的号码为中奖号码,这是运用那种抽样方法确定中奖号码的?依次写出这10个中奖号码。,练习:,2.书59第3题,3.一个总体中有100个个体,随机编号为0,1,2,99,依编号顺序平均分成10个小组,组号分别为1,2,3,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k组抽取的号码个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码是_.,解析:依编号顺序平均分成的10个小组分别为 09,1019,2029,3039,4049,5059,6069,7079,8089,9099.因第7组抽取的号码个位数字应是3,所以抽取的号码是63.,这个样本的号码依次是6,18,29,30,41,52,63,74,85,96这10个号.,63,分层抽样,设计科学、合理的抽样方法,其核心问题是保证抽样公平,并且样本具有好的代表性.如果要调查我校高一学生的平均身高,由于男生一般比女生高,故用简单随机抽样或系统抽样,都可能使样本不具有好的代表性.对于此类抽样问题,我们需要一个更好的抽样方法来解决.,引入,某校高一、高二和高三年级分别有1000,800和700名,为了了解全校学生的视力情况,从中抽取容量为100的样本,你认为应当怎样抽取样本较为合理?,创设情景:,分析:,(2)能否在2500名学生中随机抽取100名学生?为什么?,(3)能否在三个年级中平均抽取?,(1)总体、个体、样本、样本容量分别是什么?,不能,不具有好的代表性,不能,不具有好的代表性,某校高一、高二和高三年级分别有1000,800和700名,为了了解全校学生的视力情况,从中抽取容量为100的样本,你认为应当怎样抽取样本较为合理?,创设情景:,分析:,(4)三个年级中个体有较大差别,应如何提高样本的代表性?,应考虑他们在样本中所占的比例。,(5)如何确定各年级所要抽取的人数?,计算样本容量与总体容量的比值,再按比例分配各年级,得各年级所要抽取的个体数。,某校高一、高二和高三年级分别有1000,800和700名,为了了解全校学生的视力情况,从中抽取容量为100的样本,你认为应当怎样抽取样本较为合理?,解决问题,高一年级占10002500,应取100 10002500=40名;,然后分别在各年级(层)运用系统抽样方法抽取.,高二年级占8002500,应取100 8002500=32名;,高三年级占7002500,应取100 7002500=28名。,解:,上述抽样方法不仅保证了抽样的公平性,而且抽取的样本具有较好的代表性,从而是一种科学、合理的抽样方法,这种抽样方法称为分层抽样.一般地,分层抽样的基本思想是什么?,【注】分层抽样又称类型抽样.应用分层抽样应遵循以下要求:,一、分层抽样的定义.,若总体由差异明显的几部分组成,抽样时,先将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,再将各层取出的个体合在一起作为样本.,(1)分层:将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则。,(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样或系统抽样,每层样本数量与每层个体数量的比与样本容量与总体容量的比相等或相近。,分层抽样的特点:,(1)分层抽样适用于已知总体是由差异明显的几部分组成的总体;,(2)分成的各层互不重叠;,(3)各层抽取的比例都等于样本容量在总体中的比例,即,其中n为样本容量,N为总体容量,二、分层抽样的步骤:,(1)将总体按一定的标准分层;,(2)计算各层的个体数与总体的 个体数的比;,(3)按各层个体数占总体的个 体数的比确定各层应抽取 的样本容量;,(5)综合每层抽样,组成样本.,(4)在每一层进行抽样;(可用简单随机抽样或系统抽样),开始,分 层,计算比,定层抽取容量,抽 样,组样,结束,简单随机抽样、系统抽样、分层抽样的比较,1、分层抽样是当总体由差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点:(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,各层之间的样本差异要大,且互不重叠。(2)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样。,2、分层抽样的优点是:使样本具有较强的代表性,并且抽样过程中可综合选用各种抽样方法,因此分层抽样是一种实用、操作性强、应用比较广泛的抽样方法。,说明:,例1.某高中共有900人,其中高一年级300人,高二年级200人,高三年级400人,现采用分层抽样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为()A.15,5,25 B.15,15,15 C.10,5,30 D.15,10,20,D,数学应用,例2:一个地区共有5个乡镇,人口15万人,其中人口比例为3:2:5:2:3,现从15万人中抽取一个1500人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程。,解:因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方法.,(1)将15万人分为5层,其中一个乡镇为一层.(2)按照样本容量的比例求得各乡镇应抽取的人数分别为300人、200人、500人、200人、300 人.(3)按照各层抽取的人数系统抽取各乡镇应抽取的样本.(4)将1500人组到一起,即得到一个样本。,具体过程如下:,1、下列问题中,采用怎样的抽样方法比较合理:从10台冰箱中抽取3台进行质量检查;某电影院有32排座位,每排有40个座位,座位号为1 40。有一次报告会坐满了听众,会议结束后为听取意见,留下座位号为18的32名听众进行座谈;,某学校有160名教职工,其中教师120名,行政人员16名,后勤人员24名。为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本。,分层抽样,系统抽样,简单随机抽样,反馈练习,192,2、某单位有职工160人,其中业务员有104人,管理人员32人,后勤24人,现用分层抽样从中抽取一容量为20的样本,则抽取管理人员()人A、3 B、4 C、7 D、12,B,4、某大学数学系共有本科生5000人,其中一、二、三、四年级的学生比为4:3:2:1,用分层抽样的方法抽取一个容量为200人的样本,则应抽取三年级的学生为()人。A、80 B、40 C、60 D、20,B,【能力提高】,1.(2004年全国高考天津卷)某工厂生产A、B、C三种不同型号的产品,产品数量之比为2:3:5,现用分层抽样方法抽取一个容量为n的样本,样本中A型产品有16种,那么此样本容量n=_.,80,2、某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体情况,需从他们中抽取一个容量为36的样本,则适合的抽取方法是()A.简单随机抽样 B.系统抽样 C.分层抽样 D.先从老人中剔除1人,然后再分层抽样,D,4.(2004年全国高考湖南卷)某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点,公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为;在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和销后服务等情况,记这项调查为.则完成、这两项调查采用的抽样方法依次是(),A.分层抽样法,系统抽样法,B.分层抽样法,简单随机抽样法,C.系统抽样法,分层抽样法,D.简单随机抽档法,分层抽样法,B,5.某单位有工程师6人,技术员12人,技工18人,要从这些人中抽取一个容量为n的样本;如果采用系统抽样和分层抽样方法抽取,不用剔除个体;如果样本容量增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求得样本容量为_.,分析:总体容量N=36(人),当样本容量为n时,系统抽样间隔为36/nN.,分层抽样的抽样比为n/36,求得工程师、技术员、技工的人数分别为n/6,n/3,n/2,所以n应是6的倍数,36的约数,即n=6,12,18.,当样本容量为n+1时,总体中先剔除1人还有时35人,系统抽样间隔为35/(n+1)N,所以n只能是6.,6,小结一:1.系统抽样的定义;2.系统抽样的一般步骤;3.分段间隔的确定.,小结二:,2.分层抽样是按比例分别对各层进行抽样,再将各个子样本合并在一起构成所需样本.其中正确计算各层应抽取的个体数,是分层抽样过程中的重要环节.,1.分层抽样利用了调查者对调查对象事先掌握的各种信息,考虑了保持样本结构与总体结构的一致性,从而使样本更具有代表性,在实际调查中被广泛应用.,3.简单随机抽样是基础,系统抽样与分层抽样是补充和发展,三者相辅相成,对立统一.,作业:P59练习:2.P第,题,再见!,