必修三2.1随机抽样ppt课件.ppt
本 章 引 言,数字化的时代,产品的合格率,农作物的产量,产品的销售量,某地的气温,自然资源,就业状况,电视台的收视率,我国是世界上的第13个贫水国,人均淡水占量排世界第109位,我国土地沙漠化问题非常严重,全国沙漠化土地面积已超过174000平方公里,并以每年3400平方公里的速度扩张。,你知道这些数据是怎么来的吗?,通过调查获得的。,怎么调查?,是对考察对象进行全面调查还是抽样调查?,妈妈:“儿子,帮妈妈买盒火柴去。”妈妈:“这次注意点,上次你买的火柴好多划不着。” 儿子高兴地跑回来。孩子:“妈妈,这次的火柴全划得着,我每根都试过了。”,笑过之后,谈谈你的看法,这个调查具有破坏性,不可能每根试过,不能展开全面调查。,要了解全国高中生的视力情况:,(1)对全国所有的高中生进行视力测试;,(2)对某一所著名中学的高中生进行视力测试;,(3)在全国按东、南、西、北、中分片,每个区域各抽所中学,对这15所中学的全部高中生进行视力测试。,你认为哪种调查方式较适合?,人们在研究某个自然现象或社会现象时,会遇到不方便、不可能或不必要对所有对象作调查的情况,往往采用抽样调查的方法。,属于普查,工作量太大,不方便,没有必要,这种方法缺乏普遍性,不合适。,这种调查具有可操作性及代表性。,同学们觉得在什么时候用普查方式较好?什么时候用抽样调查方式较好呢?,(1)当调查的对象个数较少,调查容易进行时,我们一般采用普查的方式进行。(2)当调查的结果对调查对象具有破坏性时,或者会产生一 定的危害性时,或不大经济可行我们通常采用抽样调查的方式进行调查。(3)当调查对象的个数较多,调查不易进行时,我们常采用抽样调查的方式进行调查。,例如,为了了解一批计算器的寿命,我们能将它们逐一测试吗?很明显,这既不可能也没必要。实践中,由于所考察的总体中的个体数往往很多,而且许多考察带有破坏性,因此,我们通常只考察总体中的一个样本,通过样本来了解总体的情况。,提出问题,进一步,从节约费用的角度考虑,在保证样本估计总体达到一定的精度的前提下,样本中包含的个体数越少越好。,于是,如何设计抽样方法,使抽取的样本能够真正代表总体,就成为我们要关注的一个关键问题。否则,如果样本的代表性不好,那么对总体的判断就会出现错误。因此科学合理地采集样本才能作出客观的统计推断。,那么,怎样从总体中抽取样本呢?如何表示样本数据?如何从样本数据中提取基本信息(样本分布、样本数字特征等),来推断总体的情况呢?这些正是本章要解决的问题。,统计所要解决的问题是如何根据样本来推断总体。首先必须清楚地知道要收集的数据是什么;其次,我们检验样本的目的是为了了解总体的情况;再次,我们要知道如何才能收集到高质量的样本数据。,在抽样调查中要注意什么问题?,思考:,要了解全国高中生的视力情况,第三种调查方法:在全国 按东、西、南、北、中分片, 每个区域各抽3所中学, 对这15所中学的全部高中生15000人进行视力测试。,考察对象是什么?,在统计中,我们把所要考察的对象的全体叫做总体,全国每位高中学生的视力情况。,把组成总体的每一个考察的对象叫做个体,这15000名学生的视力情况又组成一个集体,从总体中取出的一部分个体的集体叫做这个总体的一个样本。,15000,样本中的个体的数目叫做样本的容量。,、如何刻画一批袋装牛奶的质量是否合格?,以下变量都可以作为衡量产品质量的指标:()袋装牛奶的细菌含量;()袋装牛奶的重量;()袋装牛奶的蛋白含量;()袋装牛奶的脂肪含量;()袋装牛奶的钙含量,、怎样检验“一批袋装牛奶的细菌含量是否超标?”是普查还是抽样调查?各有什么优缺点?应该采用哪种方法?,思考与讨论,普查的优点:在普查的过程中不出错的情况下可以得到这批袋装牛奶的真实细菌含量。,普查的弊病:、需要打开每一袋牛奶进行检验,结果使得这批牛奶不能出售,失去了调查这批牛奶的质量的意义;、普查需要大量的人力、物力和财力;、当普查的过程中出现很多数据测量、录入等错误时,也会产生错误的结论。,抽样调查的优点:容易操作,节省人力、物力、财力和时间。,抽样调查的缺点:估计结果有误差。,为什么说一个好的抽样调查胜过一次蹩脚的普查?,品尝一勺汤,就可以知道一锅汤的味道,你知道其中蕴涵的道理吗?,生活中的“数学”,高质量的样本数据来自“搅拌均匀”的总体。如果我们能够设法将总体“搅拌均匀”,那么从中任意抽取一部分个体的样本,它们含有与总体基本相同的信息。,一个著名的案例,在抽样调查中,样本的选择是至关重要的,样本能否代表总体,直接影响着统计结果的可靠性。下面的故事是一次著名的失败的统计调查,被称为抽样中的泰坦尼克事件。它可以帮助我们理解为什么一个好的样本如此重要。,在1936年美国总统选举前,一份颇有名气的杂志的工作人员做了一次民意调查。调查兰顿(当时任堪萨斯州州长)和罗斯福(当时的总统)中谁将当选下一届总统。为了了解公众意向,调查者通过电话簿和车辆登记簿上的名单给一大批人发了调查表(注意在年电话和汽车只有少数富人拥有)。通过分析收回的调查表,显示兰顿非常受欢迎,于是杂志预测兰顿将在选举中获胜。实际上选举结果正好相反,最后罗斯福在选举中获胜,其数据如下:,你认为预期结果出错的原因是什么?,原因是:用于统计推断的样本来自少数富人,只能代表富人的观点,不能代表全体选民的观点(样本不具有代表性)。,像本例中这样容易得到的样本称为方便样本。如果使用“方便样本”,那么得出与事实不符的结论的可能性就会大大增加。,结论:在抽样时不能只图方便。如果只从一些容易得到的个体中抽取样本,那么所得到的样本只是一个“方便样本”,“方便样本”的代表性差,基本这种方便样本得出的结论就会与事实相左。,议一议,中央电视台需要在我市调查“春节联欢晚会”的收视率。(1)每个看电视的人都要被问到吗?(2)对我校学生的调查结果能否作为该节目的收视率?(3)你认为对不同社区、年龄层次、文化背景的人所做调查的结 果会一样吗?,答(1)中央电视台在调查时不可能问到每一个看电视的人。,(2)对一所中学学生的调查结果不能作为该节目的收视率,因为只有中学生,缺乏代表性。,(3)不同社区、年龄层次、文化背景的人所做调查的结果 不一样,因为他们的兴趣、爱好等方面情况相距甚远。,为了了解学生对学校伙食的满意程度,小红访问了名女生;小聪访问了名男生;小明访问了名男生和名女生,其中高一、高二和高三的男生和女生各8名。你认为小红、小聪、小明三人的不同抽样方法那一种最好?为什么?,学习致用,答:小明的方法最好。小明抽得样本既有男生,又有女生,而均匀分布在各年级,这样的抽样较具有代表性,反映的情况具有普遍意义。,1.我们常常根据样本得到结果来推测总体的结果。不同的抽样可能得到不同的结果。,2.为了使结果更具准确性,抽样时,样本的容量要合理,样本的个体要有代表性。,抽样才具有普遍意义,温馨提醒,2.1.1简单随机抽样,思 考,问题一:对一个确定的总体其样本唯一吗?,问题二:如何科学地抽取样本?怎样使抽取 的样本充分地反映总体的情况?,合理、公平,思考:,最常用的简单随机抽样方法有两种-抽签法和随机数法,抽签决定,实 例 一,思考:,随机数表法,随机数表:,制作一个表,其中的每个数都是用随机方法产生的(随机数)。,注:随机抽样并不是随意或随便抽取,因为随意或随便抽取都会带有主观或客观的影响因素.,小结,一般地,设一个总体的个体数为N,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的机会都相等,就称这样的抽样为简单随机抽样。,1.简单随机抽样的概念,样本中个体的个数n称为样本容量,2.简单随机抽样的特点,抽签法,3.简单随机抽样操作办法:,随机数表法,抽签法 编号、制签、搅拌、抽取, 关键是“搅拌”后的随机性;随机数表法编号、选数、取号、抽取, 其中取号位置与方向具有任意性.,4.抽签法与随机数法的优缺点:,1、,2、,下列抽取样本的方式是属于简单随机抽样的是( )从无限多个个体中抽取100个个体作样本;盒子里有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出一个零件进行质量检验后,再把它放回盒子里;从8台电脑中不放回的随机抽取2台进行质量检验(假设8台电脑已编好号,对编号随机抽取) A. B. C. D.以上都不对,3、,4、,5、,简单随机抽样的特征:逐个、不放回抽取且保证每个个体被抽到的可能性相等,而这里只是随机确定了起始张,其他各张牌虽然是逐张起牌,但是各张在谁手里已被确定,所以不是简单随机抽样。,P57 练习 1、 抽样调查的好处是可以节省人力、物力和财力,可能出现的问题是推断的结 果与实际情况之间有误差。例如,当抽取的部分个体不能很好地代表总体时, 我们分析出的结果就会有偏差。,复习:简单随机抽样,一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(nN),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样。,逐个,不放回,当总体中的个体数很多时,用简单随机抽样抽取样本,操作上并不方便、快捷. 因此,在保证抽样的公平性,不降低样本的代表性的前提下,我们还需要进一步学习其它的抽样方法,以弥补简单随机抽样的不足.,2.1.2系统抽样,思考:学校要了解高二学生对学校的意见,需要选取10个学生代表,怎样从众多学生中选出代表才能较好地反映出学生对学校的意见?(假设10班50人=500人),广播:“请高二各班5号同学到报告厅”,1.先编号(学号等)2.将500人分成10个班级3.在一班(就50人了)150号中采用简单随机抽样确定第一个同学编号 (抽出第一个为5)4.取 得到50个同学编号5,55,105,思考2:上述抽样方法称为系统抽样,一般地,怎样理解系统抽样的含义?,当总体中的个体数较多时,将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取一个个体,得到所需要的样本,这样的抽样叫做系统抽样.,个体数较多,均衡,规则,每一,部分抽取一个个体,等距离抽取,问:系统抽样中,每个个体被抽中的概率是否一样?,每个班级中编号都是计算机随机的,所以从第一班开始,每人被抽取(简单随机抽样)的可能性都是1/50,也就是说,在整个系统抽样中,每人被抽取的可能性都是1/50。,与简单随机抽样的可能性是一样的!,系统抽样的特点:,(4)用系统抽样抽取样本时,每个个体被抽到的可能性是相等的;,(1)系统抽样适用于总体中个体数较多的情况;,(5)系统抽样是不放回抽样。,(3)一定的规则通常指的是:在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号。,思考3:用系统抽样从总体中抽取样本时,首先要做的工作是什么?,将总体中的所有个体编号.,思考2:如果用系统抽样从605件产品中抽取60件进行质量检查,由于605件产品不能均衡分成60部分,对此应如何处理?,先从总体中随机剔除5个个体,再均衡分成60部分.,系统抽样的步骤:,1)采用随机方式将总体中N个个体编号.有时可直接利用个体自身所带的号码.2)确定分段间隔k,对编号进行分段,将整个的编号按一定的间隔(设为K)分段,(N为总体中的个体数,n为样本容量)3)在第1段中用简单随机抽样确定起始个体编号. 4)按照一定规则抽取样本。通常将编号为 的个体抽出。,编号,分段,抽取起始个体号,加间隔获取其他个体,k,是整数时, ; 不是整数时,从N中剔除一些个体,使得其为整数为止.,系统抽样的步骤:,编号分段抽取第一个个体号加间隔抽取 其他个体,例:从某厂生产的802辆轿车中随机抽取80辆测试 某项功能,请合理选择抽样方法,并写出过程。,1.将802辆轿车编号,号码是001,002,802;,2.用随机数表法随机抽取2个号码,(如016,378,将编号为016,378的2辆轿车剔除);,3.将剩下的800辆轿车重新编号,号码为1,2, ,800,4.并分成80段,间隔为80080=10=k;,5.在第一段1,2, , 10这十个编号中用简单随机抽样(如抽签法)抽出一个(如数5)作为起始号码;,6.由第5号开始,把5,15, 25, 795共80个号码取出,这80个号码所对应的轿车组成样本。,讨论:在这整个抽样过程中每个个体被抽取的可能性是否相等?,1、总体中的每个个体被剔除的可能是相等的 ,,2、也就是每个个体不被剔除的概率相等 ;,3、采用系统抽样时每个个体被抽取的概率都是 ;,4、在整个抽样过程中每个个体被抽取的概率仍相等,都是 。,所以,若Nn不为整数,可以先用随机数表法剔除几个个体,在重新使用系统抽样,练习:1、下列抽样中不是系统抽样的是 ( )A、从标有115号的15个小球中任选3个作为样本,按从小号到大号排序,随机确定起点i,以后为i+5, i+10(超过15则从1再数起)号入样;B、工厂生产的产品,用传送带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验;C、搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止;D、电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈。,C,3、从2004名学生中选取50名组成参观团,若采用下面的方法选取:先用简单随机抽样从2004人中剔除4人,剩下的2000个再按系统抽样的方法进行,则每人入选的机会( ) A.不全相等 B.均不相等 C.都相等 D.无法确定,C,B,2、,思考:系统抽样与简单随机抽样比较,有何优、缺点?,1、系统抽样比简单随机抽样更容易实施;,2、系统抽样的效果会受个体编号的影响,而简单随机抽样的效果不受个体编号的影响;,3、系统抽样比简单随机抽样的应用范围广。,2.1.3分层抽样,3、分层抽样的实施步骤:,(2)根据总体中的个体数N与样本容量n确定抽样比:k=,(3)确定各层应该抽取的个体数。各层的抽取数 之和应等于样本容量。对于不能取整的数,求其近似值。,(4)按(3)中确定的数目在各层中随机抽取个体,合在一起得到容量为n的样本.,(1) 根据已有信息,将总体分成互不相交的层;,例、一个单位的职工有500人,其中不到35岁的有125人,3549岁的有280人,50岁以上的有95人。为了了解该单位职工年龄与身体状况的有关指标,从中抽取100名职工作为样本,应该怎样抽取?,分析:这总体具有某些特征,它可以分成几个不同的部分:不到35岁;3549岁;50岁以上,把每一部分称为一个层,因此该总体可以分为3个层。由于抽取的样本为100,所以必须确定每一层的比例,在每一个层中实行简单随机抽样。,解:抽取人数与职工总数的比是100:5001:5,则各年龄段(层)的职工人数依次是125:280:9525:56:19,然后分别在各年龄段(层)运用简单随机抽样方法抽取。,c,4三种抽样方法的比较,50人,1、,练习:,2、,3、,