湘教版九年级数学上册第5章用样本推断总体课件.ppt
用样本推断总体,第5章,5.1.1总体平均数与方差的估计5.2.1统计的简单应用5.2.2统计的简单应用,总体平均数与方差的估计,5.1,返回,阅读下面的报道,回答问题.,从上述报道可见,北京市统计局进行2012年度人口调查采用的是什么调查方式?,我们在研究某个总体时,一般用数据表示总体中每个个体的某种数量特性,所有这些数据组成一个总体,而样本则是从总体中抽取的部分数据,因此,样本蕴含着总体的许多信息,这使得我们有可能通过样本的某些特性去推断总体的相应特性.,从总体中抽取样本,然后通过对样本的分析,去推断总体的情况,这是统计的基本思想.用样本平均数、样本方差分别去估计总体平均数、总体方差就是这一思想的一个体现.实践和理论都表明:对于简单随机样本,在大多数情况下,当样本容量足够大时,这种估计是合理的.,(1)如何估计某城市所有家庭一年内平均丢弃的塑料 袋个数?,(2)在检查甲、乙两种棉花的纤维长度时,如何估计 哪种棉花的纤维长度比较整齐?,可以进行简单随机抽样,然后用样本去推断总体.,某农科院在某地区选择了自然条件相同的两个试验区,用相同的管理技术试种甲、乙两个品种的水稻各100亩.如何确定哪个品种的水稻在该地区更有推广价值呢?,为了选择合适的稻种,我们需要关心这两种水稻的平均产量及产量的稳定性(即方差).于是,待水稻成熟后,各自从这100亩水稻随机抽取10亩水稻,记录它们的亩产量(样本),数据如下表所示:,可以求出,这10亩甲、乙品种的水稻的平均产量分别为:,由于这10亩水稻是简单随机抽取的,因此可以分别用这10亩水稻的平均产量去估计这两种水稻大面积种植后的平均产量.,由于在试验区这两种水稻的平均产量相差很小,从而我们可以估计出大面积种植这两种水稻后的平均产量也应相差很小,所以,单从平均产量这一角度来考虑,我们还不能确定哪种水稻更有推广价值.因此,我们还需考虑这两种水稻产量的稳定性.,利用计算器,我们可计算出这10亩甲、乙品种水稻产量的方差分别为129.6,59.09.由于59.09129.6,即 ,因此我们可以估计种植乙种水稻的产量要比种植甲种水稻的产量稳定.从而我们可以得出:在该地区,种植乙种水稻更有推广价值.,例 一台机床生产一种直径为40mm的圆柱形零件,在正常生产时,生产的零件的直径的方差应不超过0.01.如果超过0.01,则机床应检修调整.,举例,下表是某日8:309:30及10:0011:00两个时段中各随机抽取10个零件量出的直径的数值(单位:mm):,试判断在这两个时段内机床生产是否正常.,在10:0011:00这段时间内生产的零件中, 随机抽取的10个零件的直径的平均数 、 方差 分别为:,由于随机抽取的8:309:30这段时间内生产的10个零件的直径的方差为0.03,远远超过0.01的界限,因此我们可以推断在这段时间内该机床生产不正常. 类似地,我们可以推断在10:0011:00这段时间内该机床生产正常.,时间(min),试据此估计小明从起床至到达教室所需的平均时间.,时间(min),试根据以上数据判断哪台包装机包装糖果的质量比较稳定.,解,所以可以估计出甲包装机包装糖果的质量比较稳定.,例,某校为了了解九年级学生的体能情况,随机抽查了其中的30名学生,测试了1分钟仰卧起坐的次数,并绘制成如下图所示的频数分布直方图,请根据图示计算,仰卧起坐次数在1520次之间的频率是( ). A.0.1 B.0.17 C.0.33 D.0.4,A,结 束,统计的简单应用,5.2,返回,在日常生活中, 我们经常遇到各种各样的“率”: 一个国家的森林覆盖率、一个省的婴儿出生率、一个电视栏目的收视率、一种产品的合格率等等. 那么这些“率”到底能够说明什么呢?,从统计的观点看, 一个“率” 就是总体中具有某些特性的个体在总体中所占的百分比.,可以通过简单随机抽样,先计算出样本的“率” ,再用样本的“率”去估计总体相应的“率”.,当要考察的总体所含个体数量较多时,“率” 的计算就比较复杂,有什么方法来对“率” 作出合理的估计吗?,举例,例1 某工厂生产了一批产品,从中随机抽取1000件来检查,发现有10件次品. 试估计这批产品的次品率.,解: 从而这批产品的次品率为1%.,某地为提倡节约用水, 准备实行“阶梯水价计费” 方式,用户月用水量不超出基本月用水量的部分享受基本价格,超出基本月用水量的部分实行加价收费. 为更好地决策,自来水公司随机抽取了部分用户的月用水量数据,并将这些数据绘制成了 所示的统计图(每组数据包括右端点但不包括左端点).如果自来水公司将基本月用水量定为每户每月12 t, 那么该地20 万用户中约有多少用户能够全部享受基本价格?,问题1:从这幅用户的月用水量频数直方图,你能知道总共随机抽取了多少用户来绘制统计图吗?,答:可以从统计图得知,总共有10+20+36+25+9=100(户)被随机抽取绘制了统计图。,问题2:随机抽取的用户中有多少用户每月用水量在基本月用水量以下?,答:由于将基本月用水量定为每户每月12 t,而被抽取的100户用户中,有66户(10 + 20 + 36)没有超出基本月用水量。,问题3:被抽取的用户中,能够全部享受基本价格的用户的“率”是多少?,问题4:该地20 万用户中约有多少用户能够全部享受基本价格?,举例,例2 下表给出了某校500 名12 岁男孩中用随机抽样得出的100 人的身高h的分组数据(单位:cm):,(1) 列出样本频率分布表(2) 估计该校500名12岁男孩中身高小于134cm的人数.,举例,解 () 根据题意, 可得如下样本频率分布表.,举例,(2) 由上表可知,身高小于134 cm 的男孩出现的频率为0.04 + 0.07 +0.08 = 0.19,500 0.19 = 95(人),答:估计该校500名12岁男孩中身高小于134 cm的人数约为 95人.,1. 某市教育局为了解该市5 万名九年级学生的身体素质情况,随机抽取了1000 名九年级学生进行检测. 已知被检测学生的身体素质达标率为95%,请据此估计该市九年级学生中身体素质达标的学生人数.,解:,答:该市九年级学生中身体素质达标的学生人数为47500人。,(人),2. 为了让学生了解环保知识,增强环保意识,某市在中学生中举举行了一次“环保知识竞赛”,共有19000 名中学生参加了这次竞赛为了解本次竞赛成绩情况,从中随机抽取了500名学生的成绩x(得分均为整数,满分为100分)进行统计后得到下表请根据表格解答下列问题:(1) 补全表格;(2) 假设成绩在71 分至90 分之间(含71 分,90 分)的学生为二等奖,请据此估计该市获得二等奖的学生人数.,统计的简单应用,5.2,返回,李奶奶在小区开了一家便利店,供应, ,个品种的食物由于不同品种的食物的保质期不同,因此, 有些品种因滞销而变质,造成浪费,有些品种因脱销而给居民带来不便. 面对这种情况,李奶奶很着急请你想办法帮助李奶奶解决这一问题.,(1) 调查和收集资料,随机统计两周中5个品种食物的每天销售量(结果如下表):,问题:需要统计多长时间内5种食物的销售量才具有参考意义呢?,(2)分周统计每个品种的销售情况,(3) 分析统计结果.,问题:根据上述每个品种的周销售情况,你有什么发现?各个品种的销售稳定吗?,从上面的统计表中可以发现每个品种每周的销售量虽然有时多,有时少,但变化不大. 这说明这个小区的需求量是很稳定的,但不同品种的销售量有很大区别,故只需按适当的比例进货,就能既不会因滞销造成浪费,也不会因脱销而给居民带来不便,因为309.5:257.5:292:190:149.530:25:30:20:15 =6:5:6:4:3 ,于是,可以建议李奶奶按6:5:6:4:3 的比例购进A、B、C、D、E这种食物。,(4) 确定进货方案按照适当的比例购进商品时,需考虑销售量时有波动的影响,因此应先计算各品种的周平均销量(结果如下表).,根据上面一题的讨论,总结一下,利用样本来推断总体的过程是怎样的?,总体,简单随机样本,分析数据,整理数据,推断,确定样本容量,通过科学调查,在取得真实可靠的数据后,我们可以运用正确的统计方法来推断总体,除此之外,还可以利用已有的统计数据来对事物在未来一段时间内的发展趋势做出判断和预测,为正确的决策提供服务.,下表是20062011年全国城镇居民人均可支配收入(单位:元)统计表:,(1) 根据上表数据,以年份为横坐标,以人均可支配收入为纵坐标, 建立直角坐标系,并在该坐标系中描出坐标(年份,人均可支配收入);(2) 试用直线表示全国城镇居民人均可支配收入在近几年内的发展趋势.,按上述要求建立直角坐标系后,描出这些数据,可得图如下:,由上图, 我们可以预测: 在近几年内全国城镇居民人均可支配收入将是逐年递增的.,1. 用样本推断总体是统计中的一种重要思想.在抽样调查时,由于我们只抽取部分数据组成样本,而总体平均数和总体方差是未知的,因此我们希望寻找一个好的抽取样本的方法,使得样本能够代表总体,能客观地反映实际情况. 一般情况下,我们可以采用简单随机抽样的方法得到简单随机样本,然后用简单随机样本的样本平均数、样本方差分别去估计总体平均数、总体方差. 在大多数情况下,当样本容量够大时,这种估计是比较合理的.,2. 在现实生活中,有许多数据是与时间有关的,因此这些数据会呈现一定的发展趋势,这启发我们用一条直线来表示发展趋势. 通过分析趋势图我们可以感受随机现象的变化趋势,感悟一些随机现象的规律性.,1. 某工厂需要,三种原料用于生产,为了合理进料以维持正常生产,工厂随机统计了两周中每天原料消耗(单位:t)的情况:,试根据上述资料确定每次进料时, 三种原料的进料比例,以使工厂尽量少发生原料过多囤积或短缺的现象,解:(1)分周统计每种 原料的消耗量:,(2)从上面的统计表中,可以发现每种原料每周的消耗量变化并不大,说明原料的消耗量是比较稳定的,但不同原料的消耗量有很大区别,因此需要按照适当的比例进原料,以使工厂尽量少发生原料过多囤积或短缺的现象,(3)各原料的日平均消耗量:,因为27.29:14.14:14.432:1:1,因此可以按照2:1:1这个比例确定A、B、C三种原料的进料比例。,2. 下表是我国20062010年第一产业在国民生产总值中的比例数据:,(1) 请根据表中数据, 建立直角坐标系, 并描出坐标(年份, 第一产业在国民生产总值中的比例);(2) 试用直线表示第一产业在我国国民生产总值中的比例在近几年内的发展趋势.,解:从趋势上看,第一产业在我国国民生产总值中的比例是逐年下降的。,例 以下是根据北京市国民经济和社会发展统计公报中的相关数据绘制统计图的一部分,请根据以上信息解答下列问题:(1)2008年北京市私人轿车拥有是多少万辆(结果保留三个有效数字)?(2)补全条形统计图;,如果按照小明的统计数据,请你通过计算估计,2010年北京市仅排量为1.6L的这类私人轿车(假设每辆车平均一行行驶1万千米)的碳排放总量约为多少万吨?,(3)汽车数量增多除造成交通拥堵外,还增加了碳排放量,为了了解汽车碳排放量的情况,小明同学通过网络了解到汽车的碳排放量与汽车排量有关如:一辆排量为1.6L的轿车,如果一年行驶1万千米,这一年,它碳排放量约为2.7吨于是他调查了他所居住小区的150辆私人轿车,不同排量的轿车数量如下表所示,解:(1)146(1+19%)=173.74174(万辆), 所以2008年北京市私人轿车拥有量约是174万辆。,(2)补全条形统计图如下:,, 所以估计2010年北京市仅排量为1.6L的这类私人轿车的碳排放总量约为372.6万吨。,(3),1. 用样本推断总体的过程是怎样的?,答:可以采用简单随机抽样的方法得到简单随机样本,然后用简单随机样本的样本平均数、样本方差分别去估计总体平均数、总体方差. 在大多数情况下, 当样本容量够大时, 这种估计是比较合理的.,答:比如我们需要总结全国居民拥有个人轿车的数量发展趋势,可以在查到近5年市民拥有个人轿车数量的统计数据,然后根据数据在以时间为横坐标,轿车数量为纵坐标的平面直角坐标系中描出坐标,再用一条直线来表示发展趋势,通过分析这个趋势图可以预测未来居民拥有轿车数量的变化趋势。,2. 如何通过样本来预测总体在未来一段时间内的发展趋势?,样本平均数,总体在未来一段时间的发展水平,简单随机样本,总体平均值,总体,预测,随机抽样,估计,样本方差,样本的某种“率”,样本的频数、频率分布,总体方差,总体相应的“率”,总体的频数、频率分布,总体在未来一段时间的发展趋势,控制,3、如何用样本推断总体?,