数学《用样本的频率分布估计总体分布》课件.ppt
用样本估计总体,用样本估计总体(两种):一种是:用样本的频率分布估计总体的分布。另一种是:用样本的数字特征(平均数标准差等)估计总体的数字特征。,用样本的频率分布估计总体分布一 频率分布图和频率分布直方图频率分布折线图 和总体密度曲线三 茎叶图(stem-and-leaf display),2.2.1 用样本的频率分布估计总体分布,我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费。如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?,探究:,你认为,为了较为合理地确定出这个标准,需要做哪些工作?,我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费。如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?,探究:,采用抽样调查的方式获得样本数据分析样本数据来估计全市居民用水量的分布情况,下表给出100位居民的月均用水量表,分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息。表格则是通过改变数据的构成形式,为我们提供解释数据的新方式,讨论:如何分析数据?,根据这些数据你能得出用水量其他信息吗?,为此我们要对这些数据进行整理与分析,一频率分布的概念:频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布,二画频率分布直方图其一般步骤为:(1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布直方图,第一步:求极差:(数据组中最大值与最小值的差距),最大值=4.3 最小值=0.2 所以极差=4.3-0.2=4.1,第二步:决定组距与组数:(强调取整),当样本容量不超过100时,按照数据的多少,常分成512组.为方便组距的选择应力求“取整”.本题如果组距为0.5(t).则,第三步:将数据分组:(给出组的界限),所以将数据分成9组较合适.,0,0.5),0.5,1),1,1.5),4,4.5)共9组.,第四步:列频率分布表.,组距=0.5,0.04,0.08,0.08,0.16,0.3,0.15,0.44,0.22,0.25,0.5,1,2.00,0.02,0.04,0.04,0.08,0.1,0.3,0.15,0.05,第五步:画出频率分布直方图.,频率/组距,月均用水量/t,(组距=0.5),小长方形的面积=?,小长方形的面积总和=?,月均用水量最多的在哪个区间?,请大家阅读第68页,直方图有哪些优点和缺点?,频率分布直方图的特征:从频率分布直方图可以清楚的看出数据分布的总体趋势。从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。,思考:1.频率分布表与频率分布直方图的区别?,频率分布表列出的是在各个不同区间内取值的频率。频率分布直方图是用小长方形面积的大小来表示在各个区间内取值的频率。,2.如果当地政府希望使85%以上的居民每月的用水量不超出标准,根据频率分布表2-2和频率分布直方图2.2-1,你能对制定月用水量标准提出建议吗?,3.将组距确定为1,作出教材P66页 居民月均用水量的频率分布直方图,4.谈谈两种组距下,你对图的印象?同一个样本数据,绘制出来的分布图是唯一的吗?,(同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断),练 习,1.有一个容量为50的样本数据分组的频数如下,12.5,15.5)3,15.5,18.5)8,18.5,21.5)9,21.5,24.5)11,24.5,27.5)10,27.5,30.5)5,30.5,33.5)4,(1)列出样本的频率分布表;,(2)画出频率分布直方图;,(3)根据频率分布直方图估计,数据落在15.5,24.5)的百分比是多少?,解:组距为3,分组 频数 频率 频率/组距,12.5,15.5)3,15.5,18.5)8,18.5,21.5)9,21.5,24.5)11,24.5,27.5)10,27.5,30.5)5,30.5,33.5)4,0.060.160.180.220.200.100.08,0.0200.0530.0600.0730.0670.0330.027,频率分布直方图如下:,0.010,0.020,0.030,0.040,0.050,12.5,15.5,0.060,0.070,1、求极差(即一组数据中最大值与最小值的差)知道这组数据的变动范围4.3-0.2=4.1,2、决定组距与组数(将数据分组),3、将数据分组(8.2取整,分为9组),小结:画频率分布直方图的步骤,4、列出频率分布表.(填写频率/组距一栏),5、画出频率分布直方图。,组距:指每个小组的两个端点的距离,组距组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组。,注意,(2)纵坐标为:,2、一个容量为20的样本数据.分组后.组距与频数如下:(0,20 2;(20,30 3,(30,40 4;(40,50 5;(50,60 4;(60,70 2。则样本在(,50上的频率为:,,7/10,(2002,江西),4为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁18岁的男生体重(kg),得到频率分布直方图如下:,C,0.03,0.05,0.07,54.5,58.5,62.5,66.5,70.5,74.5,根据上图可得这100名学生中体重在56.5,64.5的学生人数是()A.20 B.30 C.40 D.50,2400,2700,3000,3300,3600,3900,X 体重,y,0.001,3、观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿体重(2700,3000)的频率为:;,0.3,A,A.0.27,78B.0.27,83C.2.7,78D.2.7,83,6、某射手对100个靶各射击5次,记下命中数,设计结果如下:,1、列出频率分布表;2、画出分布频率条形图;3、求命中不少于3次的概率。,(2003,东北),频率分布折线图和茎叶图,01234,8,0 5,0 5 7,1 1 5,3,【问题】某赛季甲、乙两名篮球运动员每场 比赛的得分情况如下:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.,【问题】某赛季甲、乙两名篮球运动员每场 比赛的得分情况如下:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.,甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.,