用样本的频率分布估计.ppt
2.2 用样本估计总体2.2.1用样本的频率分布估计总体分布,第二章统计,学习导航学习目标重点难点重点:应用频率分布直方图估计总体的分布难点:准确理解频率分布直方图中纵、横轴的意义.,1.频率分布表与频率分布直方图(1)相关概念频数与频率将一批数据按要求分成若干个组,数据分布在各个小组的个数,叫做该组的_,每组频数除以全体数据总数的商,频数,叫做该组的_,频率反映数据在每组中所占比例的大小.样本的频率分布根据随机所抽样本的大小,分别计算数据分布在各个小组的频率,这些频率的分布规律(取值情况),就叫做_.,频率,样本的频率分布,为了能直观地显示样本的频率分布情况,通常我们会将样本的分组情况、数据分布在各个小组的频数以及计算所得的相应频率列在一张表中,叫做_.用样本的频率分布估计总体的分布从一个总体得到一个包含大量数据的样本时,很难从一个个的数字中直接看出样本所包含的信息.,样本频率分布表,如果把这些数据形成频率分布表或频率分布直方图,就可以比较清楚地看出样本数据的特征,从而估计总体的分布情况.(2)频率分布直方图在频率分布直方图中,纵轴表示_,数据落在各小组内的频率用_表示,各小长方形面积的总和等于_.,频率/组距,各小长方形的面积,1,求一组数据的频率分布的步骤a.求极差.b.决定组距与组数.c.将数据分组.d.列频率分布表.画频率分布直方图为了将频率分布表中的结果直观形象地表示出来,常画出频率分布直方图.,频率分布直方图的绘制方法与步骤:,做一做1.已知样本10,8,6,10,8,13,11,10,12,7,8,9,11,9,11,12,9,10,11,12,那么频率为0.2的范围为()A.5.57.5B.7.59.5C.9.511.5 D.11.513.5,解析:选D.列频率分布表如下:由上表得频率为0.2的范围为11.513.5,故选D.,2.频率分布折线图与总体密度曲线(1)频率分布折线图连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线一般地,当总体中的个体数较多时,抽样时样本容量就不能太小.可以想象,随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为_,如图所示.,总体密度曲线,做一做2.对于样本频率分布折线图与总体密度曲线的关系,下列说法中正确的是()A.频率分布折线图与总体密度曲线无关B.频率分布折线图就是总体密度曲线C.样本容量很大的频率分布折线图就是总体密度曲线,D.如果样本容量无限增大,分组的组距无限减小,那么频率分布折线图就会无限接近于总体密度曲线解析:选D.总体密度曲线通常都是用样本频率分布估计出来的.如果样本容量无限增大,分组的组距无限减小,那么频率分布折线图就会无限接近于一条光滑曲线,这条光滑曲线就是总体密度曲线.,3.茎叶图茎叶图也是用来表示数据的一种图,其画法如下:(1)将两个数据分为“茎”(高位)和“叶”(低位)两部分.(2)将最小茎和最大茎之间的数按大小次序排成一列.(3)将各个数据的“叶”按大小次序写在其茎右(左)侧.,做一做,A.5 B.6C.7 D.8解析:选D.1777(180181170173178179)178,x8,题型一频率分布表、频率分布直方图及折线图(本题满分12分)美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.,下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48,(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图;(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.,【解】(1)以4为组距,列表如下:,画频率分布直方图及频率分布折线图如下:4分8分,(2)从频率分布表中可以看出,将近60%的美国总统就任时的年龄在50岁至60岁之间,45岁以下以及65岁以上就任的总统所占的比例相对较小.12分,名师微博纵轴是,不是频率,你知道吗?,(2)组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,使数据的分布规律能较清楚地呈现出来,组数太多或太少,都会影响我们了解数据的分布情况,若样本容量不超过100,按照数据的多少常分为512组,一般样本容量越大,所分组数越多.,变式训练从高三学生中抽取50名学生参加数学 竞赛,成绩 的分组及各组的 频率如下(单位:分):40,50),2;50,60),3;60,70),10;70,80),15;80,90),12;90,100,8.(1)列出样本的频率分布表;(2)画出频率分布直方图;,(3)估计成绩在60,90)分的学生比例.,解:(1)频率分布表如下,(2)频率分布直方图如图所示.(3)成绩在60,90)分的学生比例即学生成绩在60,90)分的频率:0.20.30.2474%.,题型二茎叶图 某中学高二(2)班甲、乙两名同学自上高中以来 每场数学考试成 绩情况如下:甲的得分:95,81,75,91,86,89,71,65,76,88,94,110,107;乙的得分:83,86,93,99,88,103,98,114,98,79,101.,画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较,说明甲、乙两人谁发挥比较稳定.,【解】甲、乙两人数学成绩的茎叶图如图所示:,从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是98;甲同学的得分情况除一个特殊得分外,也大致对称,中位数是88.因此乙同学发挥比较稳定,总体得分情况比甲同学好.,【名师点评】绘制茎叶图的关键是分清茎和叶.一般地说,如果数据是整数(至少为两位数)的,除个位数字以外的其它数字为“茎”,个位数字为“叶”;如果是小数的,通常把整数部分作为“茎”,小数部分作为“叶”.解题时要根据数据特点合理选择茎和叶.,变式训练2.(2010高考福建卷)若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是()91.5和91.5B.91.5和92C.91和91.5 D.92和92,题型三频率分布直方图的应用 为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为24171593,第二小组频数为12.,(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110次以上(含110次)为达标,试估计该校全体高一学生的达标率是多少?,【名师点评】频率分布直方图也反映了各个范围内取值的可能性,利用样本在这一范围内的频率,可近似估计总体在这一范围内的可能性.,互动探究3.在本例中,一分钟跳绳次数在120以下(含120次)的人数是多少?,1.在育才中学举行的电脑知识竞赛中,将九年级两个班参赛的学生成绩(得分均为整数)进行整理后分成五组,绘制频率分布直方图.已知图中从左到右的第一、三、四、五小组的频率分别是0.30,0.15,0.10,0.05,组距为10,则第二小组的小长方形的高为(),A.0.04 B.0.40C.10 D.0.025解析:选A.各小组的频率之和为1.00,第一、三、四、五小组的频率分别是0.30,0.15,0.10,0.05.第二小组的频率为:1.00(0.300.150.100.05)0.40.,2.甲、乙两组数据用茎叶图表示如图,中间一列的数字表示该数据的十位数,两边的数字表示该数据的个位数,则甲组数据的平均数是_,乙组数据的中位数是_.,答案:2423,3.某制造商3月生产了一批乒乓球,随机抽样100个进行检查,测得每 个球的直径(单位:mm),将数据分组如下表:,补充完成频率分布表(结果保留两位小数),并在上图中画出频率分布直方图.,解:频率分布表如下:,频率分布直方图如下:,方法技巧茎叶图的制作步骤(1)将数据分为“茎”、“叶”两部分;(2)将最大“茎”与最小“茎”之间的数字按大小顺序排成一列,茎相同者共用一个茎,再画上竖线作为分界线;(3)将各个数据的“叶”在分界线的一侧对应茎处同行列出.,失误防范 1.频率分布直方图中的纵轴不是频率,而是频率/组距.2.因为小矩形的面积组距频率/组距频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.,