《用样本频率分布估计总体分布PPT.ppt》由会员分享,可在线阅读,更多相关《用样本频率分布估计总体分布PPT.ppt(34页珍藏版)》请在三一办公上搜索。
1、,怀 天 下,求 真 知,学 做 人,2.2.1 用样本的频率分布估计总体分布,频率分布,样本中所有数据(或数据组)的频数和样本容量的比,叫做该数据的频率。,频率分布的表示形式有:样本频率分布表样本频率分布图 样本频率分布条形图 样本频率分布直方图样本频率分布折线图,所有数据(或数据组)的频数的分布变化规律叫做样本的频率分布。,1、抛掷硬币的大量重复试验的结果:,频率分布条形图,频率分布表:,注意:各长方形长条的宽度要相同。,相邻长条的间距要适当。,结论:当试验次数无限增大时,两种试验结果的频率大致相等。,长方形长条的高度表示取各值的频率。,例1.为检测某种产品的质量,抽取了一个容量为30的样
2、本,检测结果为一级品5件,二级品8件,三级品13件,次品4件(1)列出样本的频率分布表;(2)画出表示样本频率分布的条形图;(3)根据上述结果,估计此种产品为二级品或三级品的概率约是多少,(3)此种产品为二级品或三级品的概率约为0.270.430.7,知识探究(一):频率分布表,【问题】我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.通过抽样调查,获得100位居民2013年的月均用水量如下表(单位:t):,3.1 2.5 2.0 2.0 1.
3、5 1.0 1.6 1.8 1.9 1.63.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.43.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.83.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.33.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.02.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.32.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.5 2.
4、6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.42.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2,显然:这个例子与前面抛掷硬币的问题是不同的,这里的总体可以在一个实数区间取值,称为连续型总体。样本的频率分布表示形式有:频率分布表和频率分布直方图,1.极差:样本数据中的最大值和最小值的差称为极差,2.确定组距,组数:.如果将上述100个数据按组距为0.5进行分组,那么这些数据共分为多少组?,0.24.3,()0.5=8.2,画频率分布直方图的步骤,3 将数据分组,决定分点:以组距为0.5进行分组,上述100个数据共分为9组,各组数据的取值范围可以如
5、何设定?,4 画频率分布表:如何统计上述100个数据在各组中的频数?如何计算样本数据在各组中的频率?你能将这些数据用表格反映出来吗?,0,0.5),0.5,1),1,1.5),4,4.5.,分 组 频数累计 频数 频率 0,0.5)4 0.04 0.5,1)正 8 0.08 1,1.5)正 正 正 15 0.15 1.5,2)正 正 正 正 22 0.22 2,2.5)正 正 正 正 正 25 0.25 2.5,3)正 正 14 0.14 3,3.5)正 一 6 0.06 3.5,4)4 0.04 4,4.5 2 0.02 合计 100 1.00,知识探究(二):频率分布直方图,5 画频率分布
6、直方图 为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:,上图称为频率分布直方图,其中横轴表示月均用水量,纵轴表示频率/组距.频率分布直方图中各小长方形的宽度和高度在数量上有何特点?,宽度:组距,2 图形的意义,图形的意义:频率分布直方图中各小长方形的面积表示什么?各小长方形的面积之和为多少?,各小长方形的面积=频率,各小长方形的面积之和=1,宽度:组距,频率分布的条形图和频率分布直方图的区别,两者是不同的概念;,横轴:两者表示内容相同,思考:频率分布条形图和频率分布直方图是两个相同的概念吗?有什么区别?,纵轴:两者表示的内容不相同,频率分布条形图的纵
7、轴(长方形的高)表示频率,频率分布直方图的纵轴(长方形的高)表示频率与组距的比值,,其相应组距上的频率等于该组距上长方形的面积。,3 分析例题:频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来.你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?,(1)居民月均用水量的分布是“山峰”状的,而且是“单峰”的;,(2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;,(3)居民月均用水量的分布有一定的对称性等.,频率分布直方图如下:,连接频率分布直方图中各小长方形上端的中点,得到
8、频率分布折线图,利用样本频分布对总体分布进行相应估计,(2)样本容量越大,这种估计越精确。,(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?,总体密度曲线,月均用水量/t,a,b,(图中阴影部分的面积,表示总体在某个区间(a,b)内取值的百分比)。,当样本容量无限增大,分组的组距无限缩小,那么频率分布折线图就会无限接近一条光滑曲线总体密度曲线,总体密度曲线,用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。,总体密
9、度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.,总体密度曲线,1、求极差(即一组数据中最大值与最小值的差)知道这组数据的变动范围4.3-0.2=4.1,2、决定组距与组数(将数据分组),3、将数据分组(8.2取整,分为9组),画频率分布直方图的步骤,4、列出频率分布表.(填写频率/组距一栏),5、画出频率分布直方图。,组距:指每个小组的两个端点的距离,组距组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组。,小结,1、一个容量为20的样本数据.分组后.组距与频数如下:(0,20 2;(20,30 3,(30,40 4;(40,50
10、5;(50,60 4;(60,70 2。则样本在(,50上的频率为:,,7/10,2为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁18岁的男生体重(kg),得到频率分布直方图如下:,C,0.03,0.05,0.07,54.5,58.5,62.5,66.5,70.5,74.5,根据上图可得这100名学生中体重在56.5,64.5的学生人数是()A.20 B.30 C.40 D.50,2400,2700,3000,3300,3600,3900,X 体重,y,0.001,3、观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿体重(2700,3000)的频率为:;,0
11、.3,4.为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得数据整理后,画出频率分布直方图如图,已知图中从左到右前三个小组的频率分别是0.1,0.3,0.4,第一小组的频数为5.,(1)求第四小组的频率;(2)问参加这次测试的学生人数是多少?(3)问在这次测试中,学生跳绳次数的中位数落在第几小组内?,【解】(1)第四小组的频率1(0.10.30.4)0.2.(2)n第一小组的频数第一小组的频率50.150.(3)因为0.1505,0.35015,0.45020,0.25010.即第一、第二、第三、第四小组的频数分别为5,15,20,10.所以学生跳绳次数的中位数落在第三小
12、组内,解本题的关键是准确掌握频率、频数、样本容量(数据总数)之间的关系及中位数的概念,变式训练为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,绘制出频率分布直方图(如图所示),图中从左到右各小矩形的面积之比为241715102,第二小组频数为12.,1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该校全体高一学生的达标率是多少?,解:(1)第二小组的频率是100.0080.08,样本容量是120.08150.(2)达标率为(0.0340.0300.0200.004)100.0881088%.,茎叶图,01234
13、,8,0 5,0 5 7,1 1 5,3,甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.,当样本数据较少时,用茎叶图表示数据的效果较好,练习:某中学高一(2)班甲,乙两名同学自高中以来每场数学考试成绩情况如下:甲的得分:95,81,75,91,86,89,71,65,76,88,94乙的得分:83,86,93,99,88,96,98,98,79,85,97画出两人数学成绩茎叶图,请根据茎叶图对两人的成绩进行比较。,表示样本分布的方法:(1)频率分布表优点是在数量表示上比较确切,缺点是不够直观、形象,分析数据分布的总体态势不太方便(2)频率分布图(包括直方图和条形图)优点:易表示大量数据,直观地表明分布地 情况;缺点:丢失一些信息。(3)频率分布折线图优点是它反映了数据的变化趋势(4)茎叶图优点:(1)保留了原始数据,没有损失样本信息;(2)数据可以随时记录、添加或修改.缺点:只能处理样本容量较小数据,小结,1.频率分布表,表示样本的分布的方法:,2.频率分布直方图,样本频率分布中,当样本容量无限增大,组距无限缩小,4.样本频率分布直方图接近于一条光滑曲线总体密度曲线,反映了总体分布。,3.频率分布折线图,5.茎叶图,
链接地址:https://www.31ppt.com/p-5798095.html