数学必修三《用样本估计总体》ppt课件.ppt
用样本估计总体,我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费. 那么标准a定为多少比较合理呢?,提出问题,3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.63.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.43.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.83.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.33.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.02.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.32.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.42.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2,通过抽样调查,获得100位居民2007年的月均用水量如下表(单位:t):,【思考】上述100个数据中的最大值和最小值分别是什么?由此说明样本数据的变化范围是什么?,【思考】上述100个数据中的最大值和最小值分别是什么?由此说明样本数据的变化范围是什么?,【思考】样本数据中的最大值和最小值的差称为极差.如果将上述100个数据按组距为0.5进行分组,那么这些数据共分为多少组?,0.24.3,(4.30.2)0.5=8.2,【思考】以组距为0.5进行分组,上述100个数据共分为9组,各组数据的取值范围可以如何设定?,0,0.5),0.5,1),1,1.5),4,4.5.,【思考】如何统计上述100个数据在各组中的频数?如何计算样本数据在各组中的频率?你能将这些数据用表格反映出来吗?,0.04,0.08,0.15,0.220.250.140.060.040.021.00,【思考】上表称为样本数据的频率分布表,由此可以推测该市全体居民月均用水量分布的大致情况,给市政府确定居民月用水量标准提供参考依据,这里体现了一种什么统计思想?,用样本的频率分布估计总体分布.,思考6:如果市政府希望85%左右的居民每月的用水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准(即a的取值)有何建议?,88%的居民月用水量在3t以下,可建议取a=3.,频率分布表,【思考】一般地,列出一组样本数据的频率分布表可以分哪几个步骤进行?,第一步:求极差;,第二步:决定组距与组数;,第三步:确定分点,将数据分组(区间通常为左闭右开,最后为闭区间);,第四步:列频率分布表.,【思考】为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:,月均用水量/t,频率组距,0.50.40.30.20.1,0.5 1 1.5 2 2.5 3 3.5 4 4.5,O,小长方形的面积表示什么?,所有小长方形的面积和?,小长方形的面积表示该组的频率,所有小长方形的面积和1,频率分布直方图中小长方形的高?,频率/组距,频率分布直方图,【思考】样本数据的频率分布直方图是根据频率分布表画出来的,一般地,频率分布直方图的作图步骤如何?,第一步:画平面直角坐标系.,第二步:在横轴上均匀标出各组分点,在纵轴上标出单位长度.,第三步: 以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长方形.,例1:有一个容量为50的样本数据的分组及各组的频数如下:12.5, 15.5) 3 24.5, 27.5) 1015.5, 18.5) 8 27.5, 30.5) 518.5, 21.5) 9 30.5, 33.5) 421.5, 24.5) 11列出样本的频率分布表和画出频率分布直方图;根据样本的频率分布估计,小于30.5的数据约占多少?,众数、中位数、平均数,中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数,众数:在一组数据中,出现次数最多的数据叫做这组数据的众数,平均数: 一组数据的算术平均数,即x=,例2: 在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如下表所示,求这些运动员成绩众数,中位数与平均数 ?,众数、中位数、平均数与频率分布直方图的关系,1、众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。 2、在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。下图中蓝色实线代表居民月均用水量的中位数的估计值,此数据值为2.03t. 3、平均数是频率分布直方图的“重心”.是直方图的平衡点.如黄色实线,0.1,0.2,0.3,0.4,0.5,O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t),三种数字特征的优缺点,1、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征.,2、中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。,3、平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。,极差、方差、标准差,极差:是指一组数据中最大数据与最小数据的差.方差:是各个数据与平均数之差的平方的平均数,即,例4:从甲、乙两人手工制作的圆形产品中,各自随机抽取6件,测得其直径(单位:cm)如下:甲:9.00,9.20,9.00,8.50,9.10,9.20乙:8.90,9.60,9.50,8.50,8.60,8.90由以上数据估计两人的技术稳定性,结论是( )A.甲优于乙 B.乙优于甲C.两人没有区别 D.无法判断,【说明】1、甲的平均数是(9.00+9.20+9.00+8.50+9.10+9.20)/6=9.00 乙的平均数是(8.90+9.60+9.50+8.50+8.60+8.90)/6=9.002.甲的方差是(0+0.04+0.04)/6=0.057 乙的方差是(0.01+0.36+0.01)/6=0.173因为甲的方差乙的方差,答案:A,