用样本的数字特征估计总体的数字特征公开.ppt
(一)众数、中位数、平均数,2.2.2 用样本的数字特征估计总体的数字特征,1.复习众数、中位数、平均数的相关概念。2.会通过频率分布直方图估计众数、中位数和平均数。3.了解三种数字特征的相互比较。,学习目标:,(一)回忆旧知:众数、中位数、平均数的概念,中位数:将一组数据按从大到小或者从小到大的顺序排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.,众数:在一组数据中,出现次数最多的数据叫做这组数据的众数,平均数:一组数据的算术平均数,即,甲在一次射击比赛中的得分如下:(单位:环).7,8,6,8,6,5,9,10,7,5,则他得分的平均数是_,中位数是 众数是_,2.某次数学试卷得分抽样中得到:90分的有3个人,80分的有10人,70分的有5人,60分的有2人,则这次抽样的平均分为_.,7.1,77分,7,5,6,7,8,热身练习:,(二)探究新知:,请同学们思考并探讨如何根据已知的频率分布直方图估计样本数据的众数、中位数和平均数。,众数、中位数、平均数与频率分布直方图的关系,6,在上一节调查的100位居民的月均用水量的问题中,观察频率分布直方图思考,你认为众数会落在哪个小矩形内?由此估计总体的众数是什么?,众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。,(1)如何在频率分布直方图中估计众数,2.25t,7,在频率分布直方图中,每个小矩形的面积表示什么?中位数左右两侧的直方图的面积应有什么关系?,(2)如何在频率分布直方图中估计中位数,在样本中,有50的个体小于或等于中位数,也有50的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。即中位数是把直方图分成两个面积相等部分的平行于纵轴的直线横坐标,0.5,2.5,2,1.5,1,4,3.5,3,4.5,频率组距,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,前四个小矩形的面积和=0.49,后四个小矩形的面积和=0.26,2.02,请大家计算频率分布直方图中中位数的估计值,思考以下问题:2.02这个中位数的估计值,与样本的中位数值2.0不一样,你能解释其中原因吗?,答:因为样本数据的频率分布直方图,只是直观地表明分布的形状,但是从直方图本身得不出原始的数据内容,直方图已经损失一些样本信息。所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数值不一致.,10,平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。,通过下图计算出居民月用水量的平均数的估计值:,zxxkw,(3)如何在频率分布直方图中估计平均数,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,如何通过频率分布直方图估计众数、中位数和平均数?(1)众数是最高矩形底边的中点;(2)中位数左边和右边的直方图的面积应相等,由此可以估计中位数的值;(3)平均数等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.,请同学们在书上找出划下来并记忆下面的内容:,12,变式训练:已知一组数据的频率分布直方图如下,求众数、中位数、平均数。,90,0.030,频率/组距,频率/组距,频率/组距,解:由频率分布直方图可知,众数为65,中位数为65,平均数为550.3+650.4+750.15+850.1+950.05=67,zxxkw,阅读三种数字特征的优缺点的比较,应该采用平均数来表示每一个国家项目的平均金额,因为它能反映所有项目的信息.但平均数会受到极端数据2200万元的影响,所以大多数项目投资金额都和平均数相差比较大.,课本P74 练习,(三)练习巩固:,2.小明是班里的优秀学生,他的历次数学成绩分别是 96,98,95,93,但最近一次的考试成绩只有 45 分,原因是他带病参加考试.那么,在期末评价时,计算他的平均分是 85.4,故只能评他一个“良好”,这种评价是否合理呢?,分析:尽管平均分是反映一组数据平均水平的重要特征,但任何一个数的改变都会引起它的变化,而中位数则不受某些极端值的影响,本题的中位数为 95,较为合理地反映了小明的数学水平,因而应用中位数衡量小明的数学成绩.,解:不合理.小明 5 次的考试成绩,从小到大排列为45,93,95,96,98,中位数是 95,应评定为“优秀”,(四)小结:,1.复习了众数、中位数、平均数的相关概念。2.重点学习了通过频率分布直方图估计众数、中位数和平均数。3.了解了三种数字特征的优缺点。,由于一些数据丢失,试利用频率分布直方图求:(小数点后保留一位)(1)这50名学生成绩的众数与中位数(2)这50名学生的平均成绩,(五)作业:,前三个小矩形面积的和为0.3.而第四个小矩形面积为0.03100.3,0.30.30.5,中位数应位于第四个小矩形内设其底边为x,高为0.03,令0.03x0.2得x6.7,故中位数应为706.776.7.,(2)平均成绩为45(0.00410)55(0.00610)65(0.0210)75(0.0310)85(0.02110)95(0.01610)74,综上,(1)众数是75,中位数约为76.7;(2)平均成绩约为74.,谢谢指导!,方差与标准差,(二),情境一;,甲.乙两名射击队员,在进行的十次射击中成绩分别是:甲:10;9;8;10;8;8;10;10;9.5;7.5乙:9;9;8,5;9;9;9.5;9.5;8.5;8.5;9.5,试问二人谁发挥的水平较稳定?,分析:甲的平均成绩是9环.乙的平均成绩也是9环.,一.实例引入,情境二:,某农场种植了甲、乙两种玉米苗,从中各抽取了10株,分别测得它们的株高如下:(单位cm),甲:31 32 35 37 33 30 32 31 30 29,乙:53 16 54 13 66 16 13 11 16 62,问:,哪种玉米苗长得高?,哪种玉米苗长得齐?,怎么办呢?,甲,37(最大值),29(最小值),8,乙,66(最大值),11(最小值),55,极 差,甲:31 32 35 37 33 30 32 31 30 29,乙:53 16 54 13 66 16 13 11 16 62,极差:,一组数据的最大值与最小值的差,极差越大,数据越分散,越不稳定,极差越小,数据越集中,越稳定,极差体现了数据的离散程度,离散程度,为了对两人射击水平的稳定程度,玉米生长的高度差异以及钢筋质量优劣做个合理的评价,这里我们引入了一个新的概念,方差和标准差.,设一组样本数据,其平均数为,则,称s2为这个样本的方差,,称为这个样本的标准差,分别称为样本方差、样本标准差,它的算术平方根,x1,x2,xn,样本中各数据与样本平均数的差的平方和的平均数叫做样本方差;样本方差的算术平方根叫做样本标准差。样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或样本标准差越大,样本数据的波动就越大。,例1.计算数据89,93,88,91,94,90,88,87的方差和标准差。(标准差结果精确到0.1),解:,.,所以这组数据的方差为5.5,标准差为2.3.见课本76-77页,练习:若甲、乙两队比赛情况如下,下列说法哪些 说法是不正确的:,1、平均来说,甲的技术比乙的技术好;2、乙比甲技术更稳定;3、甲队有时表现差,有时表现好;4、乙队很少不失球。,全对,例2:甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm),试根据这组数据估计哪一种水稻品种的产量比较稳定,解:,1、在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为_;,2、已知数据 的方差为2,则求数据 的方差。,9.5,0.016,三.当堂反馈,思考一下:,如果数据,的平均数为,,方差为,(1)新数据,的平均数为,,方差仍为,(2)新数据,的平均数为,,方差为,(3)新数据,的平均数为,,方差为,,则,方差的运算性质:,