分层抽样方法概述ppt课件.ppt
2.1.3分层抽样,复习回顾:,1、简单随机抽样的概念:,2、简单随机抽样的特点:,3、简单随机抽样的常用方法:,机会均等抽样.,不放回抽样;,逐个进行抽取;,抽签法;,随机数表法.,设一个总体含有有限个个体,并记其个体数为N如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的机会相等,就称这样的抽样为简单随机抽样.,某校有学生1200人,为了调查某种情况打算抽取一个样本容量为50的样本,问此样本将如何获得最好?,用系统抽样法如何抽取?简述抽样过程.,解:适宜选用系统抽样,抽样过程如下:随机地将这1200名学生编号为1,2,3,,1200将总体按编号顺序均分成50部分,每部分包括24个个体在第一部分的个体编号1,2,3,24中,利用简单随机抽样抽取一个号码,比如是18以18为起始号码,每间隔24抽取一个号码,这样得到一个容量为50的样本:18,42,66,982,1002,基础训练:,假设某地区有高中生2400人,初中生10900人,小学生11000人,此地教育部门为了了解本地区中小学的近视情况及其形成原因,要从本地区的小学生中抽取1%的学生进行调查,你认为应当怎样抽取样本?,你认为哪些因素影响学生视力?抽样要考虑哪些因素?,一、分层抽样的定义。,一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样。,应用分层抽样应遵循以下要求:(1)分层:将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则。(2)分层抽样为保证每个个体等可能入样需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比相等。,二、分层抽样的步骤:,(1)按某种特征将总体分成互不相交的层(2)计算各层的个体数与总体的个数的比;按比例k=n/N确定每层抽取个体的个数(n/N)*Ni个,对于不能取整的数,求其近似值(调节样本容量,剔除个体) ,各层的抽取数之和应等于样本容量.(3)各层分别按简单随机抽样或系统抽样的方法抽取。(4)综合每层抽样合在一起得到容量为n的样本。,(1)分层抽样法适用于总体中个体差异明显的几部分组成的抽样,每一部分称为层,在每一层中实行简单随机抽样或系统抽样.分层抽样是建立在简单随机抽样或系统抽样的基础上的,这种方法由于它充分地利用了总体己有信息,是一种实用、操作性强的方法,而且更具代表性,在实践的应用更为广泛.,(2)分层抽样的一个重要问题是总体如何分层,分多少层,这要视具体情况而定。总的原则是:层内样本的差异要小,而层与层之间的差异尽可能地大,分层是按总体中个体的明显差异进行分类,否则将失去分层的意义。,注:,(3)分层抽样是等概率抽样,它也是公平的.分层抽样是按各层中个体在总体中所占的比例确定, 用分层抽样从个体数为N的总体中抽取一个容量为n的样本时,在整个抽样过程中每个个体被抽到的概率相等,都等于 ,假设某地区有高中生2400人,初中生10900人,小学生11000人,此地教育部门为了了解本地区中小学的近视情况及其形成原因,要从本地区的小学生中抽取1%的学生进行调查,你认为应当怎样抽取样本?,样本容量与总体个数的比例为1:100,则高中应抽取人数为24001/100=24人,初中应抽取人数为108001/100=108人,小学应抽取人数为111001/100=111人.,假设某地区有高中生2400人,初中生10900人,小学生11000人,此地教育部门为了了解本地区中小学的近视情况及其形成原因,要从本地区的小学生中抽取1%的学生进行调查,你认为应当怎样抽取样本?,样本容量与总体个数的比例为1:100,则高中应抽取人数为24001/100=24人,初中应抽取人数为108001/100=108人,小学应抽取人数为111001/100=111人.,思考:具体在三类学生中抽取样本时(如在10800名初中生中抽取108人),可以用哪种抽样方法进行抽样?,思考:在上述抽样过程中,每个学生被抽到的概率相等吗?,例1、某高中共有900人.其中高一年级300人.高二年级200人.高三年级400人.现采用分层抽样抽取容量为45的样本.那么高一、高二、高三各年级抽取的人数分别为( )A.15,5,25 B.15,15,15C.10,5,30 D15,10,20,练习:分层抽样又称类型抽样,即将相似的个体归入一类(层),然后每层抽取若干个体构成样本,所以分层抽样为保证每个个体等可能入样,必须进行 ( ) A、每层等可能抽样 B、每层不等可能抽样 C、所有层按同一抽样比等可能抽样,D,解:因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层抽样的方法,具体过程如下:(1)将3万人分为5层,其中一个乡镇为一层。 (2)按照样本容量的比例随机抽取各乡镇应抽取的样本。3003/15=60(人),3002/15=100(人), 3002/15=40(人),3002/15=60(人),因此各乡镇抽取人数分别为60人、40人、100人、40人、60 人。(3)将300人组到一起,即得到一个样本。,例2:一个地区共有5个乡镇,人口3万人,其中人口比例为3:2:5:2:3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程。,例3、一个单位的职工有500人,其中不到35岁的有125人,3549岁的有280人,50岁以上的有95人。为了了解该单位职工年龄与身体状况的有关指标,从中抽取100名职工作为样本,应该怎样抽取?,分析:根据总体具有某些特征,它可以分成几个不同的部分:不到35岁;3549岁;50岁以上,把每一部分称为一个层,因此该总体可以分为3个层.由于抽取的样本为100,所以必须确定每一层的比例,在每一个层中实行简单随机抽样。,解:抽取人数与职工总数的比是100:5001:5,则各年龄段(层)的职工人数依次是125:280:9525:56:19,然后分别在各年龄段(层)运用简单随机抽样方法抽取。答:在分层抽样时,不到35岁、3549岁、50岁以上的三个年龄段分别抽取25人、56人和19人。,比较简单随机抽样、系统抽样、分层抽样的优点、缺点及适用范围,类 别,简 单随 机抽 样,系 统抽 样,分 层抽 样,(1)抽样过程中每个个体被抽到的可能性相等(2)每次抽出个体后不再将它放回,即不放回抽样,共同点,各自特点,从总体中逐个抽取,将总体均分成几部分,按预先制定的规则在各部分抽取,将总体分成几层,分层进行抽取,联 系,在起始部分样时采用简随机抽样,分层抽样时采用简单随机抽样或系统抽样,适 用范 围,总体个数较少,总体个数较多,总体由差异明显的几部分组成,(1)分层抽样中,在每一层进行抽样可用 .,简单随机抽样或系统抽样,(2)教育局督学组到学校检查工作,临时在每个班各抽调2人参加座谈;某班期中考试有15人在85分以上,40人在60-84分,1人不及格.现欲从中抽出8人研讨进一步改进教和学;某班元旦聚会,要产生两名“幸运者”.对这三件事,合适的抽样方法为( ),A.分层抽样,分层抽样,简单随机抽样B. 系统抽样,系统抽样,简单随机抽样C. 分层抽样,简单随机抽样,简单随机抽样D. 系统抽样,分层抽样,简单随机抽样,D,3、某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体情况,需从他们中抽取一个容量为36的样本,则适合的抽取方法是 ( )A简单随机抽样 B系统抽样 C分层抽样 D先从老人中剔除1人,然后再分层抽样4、某校有500名学生,其中O型血的有200人,A型血的人有125人,B型血的有125人,AB型血的有50人,为了研究血型与色弱的关系,要从中抽取一个20人的样本,按分层抽样,O型血应抽取的人数为 人,A型血应抽取的人数为 人,B型血应抽取的人数为 人,AB型血应抽取的人数为 人。,5.在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本,有以下三种抽样方法:采用随机抽样法,将零件编号为00,01,02,99,抽签取出20个;采用系统抽样法,将所有零件分成20组,每组5个,然后每组随机抽取1个;采用分层抽样法,从一级品中随机抽取4个,从二级品中随机抽取6个,从三级品中随机抽取10个。则下述判断中正确的是( )A.不论采用何种抽样方法,这100个零件中每个被抽到的可能性均为1/5B. 两种抽样方法,这100个零件中每个被抽到的可能性均为1/5 ;并非如此C. 两种抽样方法,这100个零件中每个被抽到的可能性均为1/5 ;并非如此D.采用不同的抽样方法,这100个零件中每个被抽到的可能性是各不相同的,A,课堂小结,1、分层抽样是当总体由差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点:(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,面层之间的样本差异要大,且互不重叠。(2)为了保证每个个体等可能入样,所有层应采用同一抽样比等可能抽样。(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样。2、分层抽样的优点是:使样本具有较强的代表性,并且抽样过程中可综合选用各种抽样方法,因此分层抽样是一种实用、操作性强、应用比较广泛的抽样方法。,作业:P64习题2.1A组:5,6.,6.一工厂生产了某种产品16 800件,它们来自甲、乙、丙3条生产线。为检查这批产品的质量,决定采用分层抽样的方法进行抽样,已知从甲、乙、丙3条生产线抽取的个体数,组成一个等差数列,则乙生产线生产了_件产品。,5600,二、基础训练:,2.欲从本班77名学生中随机抽取7名学生参加数学的基本知识竞赛,试用随机表法确定这7名学生.,1.中央电视台要从春节联欢晚会的60名热心观众中随机抽出4名幸运观众,试用抽签法为其设计产生这4名幸运观众的过程.,抽签法编号、标签、搅拌、抽取,关键是 “搅拌”后的随机性;随机数表法编号、选数、取号、抽取,其中 取号的方向具有任意性.,评点:,