用样本频率分布估计总体分布.ppt
《用样本频率分布估计总体分布.ppt》由会员分享,可在线阅读,更多相关《用样本频率分布估计总体分布.ppt(50页珍藏版)》请在三一办公上搜索。
1、2.2.1 用样本的频率分布估计总体分布,我们用简单随机抽样、系统抽样、分层抽样的方法收集样本数据后,就可以通过样本研究总体。,用样本估计总体的两种情况:用样本的频率分布估计总体分布用样本的数字特征(平均数、标准差等)估计总体的数字特征,复习回顾,频数:不分组时,数据中某个数据出现的次数 分组时,一个组内的数据的个数,频率:,极差:最大数-最小数,频率分布表:,知识探究(一):频率分布表,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.,问题1:如果希望大部分居民的日常生活 不受影响,那么标准a
2、定为多少比较合理?,问题2:为了较为合理的确定标准a,需要做 哪些工作?,通过抽样调查,获得100位居民2007年的月均用水量如下表(单位:t):,3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.63.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.43.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.83.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.33.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8
3、 0.7 2.02.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.32.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.42.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2,问题3:这些数字告诉了我们什么信息?,我们可以看出,样本数据中的最大值4.3和最小值,其他数据在0.24.3之间,分析数据的基本方法:用图画出来 用表格重新排列,1、借助于图:频率分布直方图、频率分布折线图、茎叶图两个目的从数据中提取信息 利用图形传递信息,2、借助于表
4、格:频率分布表两个目的 改变数据的排列方式提供解释数据的新方式,第二步:确定组距,组数组距=每个小组两个端点的差.组数=极差组距(取整数),探究一 频率分布表,(4.10.5=8.2将8.2取整,组数=9,组距=0.5,思考1:上述100个数据的最小值和最大值分别是多少?,第一步:求极差,思考2:分成多少组合适?,如果将上述100个数据按组距为0.5进行分组,那么这些数据共分为多少组?,极差:4.3-0.2=4.1,512组,第四步:列频率 分布表,探究一 频率分布表,思考3:各组数据的取值范围如何设定?,第三步:确定端点,将数据分组 各组均为左开右闭区间,最后一个闭区间,思考4:如何统计各族
5、中的频数、频率?,0,0.5),0.5,1),1,1.5),4,4.5.,分 组 频数 频率 频率/组距 0,0.5)4 0.04 0.08 0.5,1)8 0.08 0.16 1,1.5)15 0.15 0.30 1.5,2)22 0.22 0.44 2,2.5)25 0.25 0.50 2.5,3)14 0.14 0.28 3,3.5)6 0.06 0.12 3.5,4)4 0.04 0.08 4,4.5 2 0.02 0.04 合计 100 1.00 2,探究(二):画频率分布直方图,第一步:画直角坐标系:x轴为数据单位,y轴为频率/组距,第二步:在x轴上均匀标出各组分点,在y轴上标出单
6、位长度,第三步:以组距为宽,各组的频率/组距为高,分别画出各组对应的长方形,问题1:频率分布直方图中各小长方形的宽度和高度在数量上有何特点?,宽度:组距,2 频率分布直方图的意义,问题2:频率分布直方图中各小长方形的面积表示什么?各小长方形的面积之和为多少?,各小长方形的面积=各小组的频率,各小长方形的面积之和=1,宽度:组距,3 分析例题:频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来.你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?,(1)居民月均用水量的分布是“山峰”状的,而且是“单峰”的;,(
7、2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;,(3)居民月均用水量的分布有一定的对称性等.,思考:对一组给定的样本数据,频率分布直方图的外观形状与哪些因素有关?在居民月均用水量样本中,你能以1为组距画频率分布直方图吗?,与分组数(或组距)及坐标系的单位长度有关.,1、求极差(即一组数据中最大值与最小值的差)知道这组数据的变动范围4.3-0.2=4.1,2、决定组距与组数(将数据分组),3、将数据分组(8.2取整,分为9组),画频率分布直方图的步骤,4、列出频率分布表.(填写频率/组距一栏),5、画出频率分布直方图。,组距:指每个小组的两个端点的距离,组距
8、组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组。,小结,理论迁移,例1 某地区为了了解知识分子的年龄结构,随机抽样50名,其年龄分别如下:42,38,29,36,41,43,54,43,34,44,40,59,39,42,44,50,37,44,45,29,48,45,53,48,37,28,46,50,37,44,42,39,51,52,62,47,59,46,45,67,53,49,65,47,54,63,57,43,46,58.(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计年龄在3252岁的知识分子所占的比例约是多少.,(1)极差为67-28=39,取
9、组距为5,分为8组.,分 组 频数 频率 频率/组距 27,32)3 0.06 0.012 32,37)3 0.06 0.012 37,42)9 0.18 0.036 42,47)16 0.32 0.064 47,52)7 0.14 0.028 52,57)5 0.10 0.020 57,62)4 0.08 0.016 62,67)3 0.06 0.012 合 计 50 1.00 0.200,样本频率分布表:,(2)样本频率分布直方图:,(3)因为0.06+0.18+0.32+0.14=0.7,故年龄在3252岁的知识分子约占70%.,例2:为了了解高一学生的体能情况,某校抽取部分学生进行一分
10、钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.第二小组的频率是多少?样本容量是多少?若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?,练习巩固,1 有一个容量为50的样本数据的分组及各组的频数如下:12.5,15.5)3 24.5,27.5)1015.5,18.5)8 27.5,30.5)518.5,21.5)9 30.5,33.5)421.5,24.5)11列出样本的频率分布表和画出频率分布直方图;根据样本的频率分布估计,小于30.5的数据约占多少?,解:组距为3
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 样本 频率 分布 估计 总体
链接地址:https://www.31ppt.com/p-5020681.html