新教材人教A数学必修二ppt课件:9.2.1&9.2.2总体取值规律的估计-总体百分位数的估计.ppt
9.2用样本估计总体9.2.1总体取值规律的估计9.2.2总体百分位数的估计,1.频率分布直方图的画法,【思考】用图、表整理数据有哪些好处?提示:用表格整理数据是通过改变数据的组织方式,为数据的解释提供新方式.用图表示数据不仅有利于从数据中提取信息,还可以利用图形传递信息.,2.总体取值规律的估计(1)从频率分布表可看出,样本观测数据落在各个小组的比例大小,例如哪组最多,哪组最少,集中在较高值或较低值等.,(2)从频率分布直方图可看出,样本的观测数据分布对称情况,左右高低情况,数据集中情况,从左到右的变化趋势等.,【思考】频率分布直方图的组数对数据分析有何影响?,提示:当组数少、组距大时,容易从中看出数据整体的分布特点,但由于无法看出每组内的数据分布情况,损失了较多的原始数据信息;当组数多、组距小时,保留了较多的原始数据信息,但由于小长方形较多,有时图形会变得非常不规则,不容易看出总体数据的分布特点.,3.其他统计图表不同的统计图在表示数据上有不同的特点.(1)扇形图主要用于直观描述各类数据占总数的比例.(2)条形图和直方图主要用于直观描述不同类别或分组数据的频数和频率.,(3)折线图主要用于描述数据随时间的变化趋势.不同的统计图适用的数据类型也不同.条形图适用于描述离散型的数据,直方图适用描述连续型数据.,【思考】选择恰当的统计图表分析样本数据有何好处?提示:选择恰当的统计图对数据进行可视化描述,能通过图形直观地发现样本数据的分布情况,进而估计总体的分布规律.,4.总体百分位数的估计一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.可以通过下面的步骤计算一组n个数据的第p百分位数:,第1步,按从小到大排列原始数据.第2步,计算i=np%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.,5.第25,50,75百分位数,把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数,第75百分位数也称为第三四分位数或上四分位数.,【思考】第25百分位数和第75百分位数有何异同?提示:第25百分位数是第一四分位数,第75百分位数是第三四分位数.,【素养小测】1.思维辨析(对的打“”,错的打“”)(1)决定组距和组数时,组数越多越好.()(2)频率分布直方图的纵坐标是频率.()(3)频率分布直方图中各小矩形的面积之和可以不为1.(),提示:(1).应根据数据的多少合理确定组数,不是说组数越多越好.(2).频率分布直方图的纵坐标是频率/组距.(3).各小矩形的面积之和一定为1.,2.100辆汽车通过某一段公路时的时速的频率分布直方图如图所示,则时速在60,70)的汽车大约有()A.30辆B.40辆C.60辆D.80辆,【解析】选B.0.0410100=40(辆).,3.一个容量为200的样本的频率分布直方图如图所示,则样本数据落在5,9)内的频率和频数分别为_.,【解析】由图可知,落在5,9)内的频率为0.05(9-5)=0.2,频数为2000.2=40.答案:0.2,40,类型一频率分布直方图的画法【典例】为了了解学校高一年级男生的身高情况,选取一个容量为60的样本(60名男生的身高),分组情况如下(单位:cm):,(1)求出表中a,m的值.(2)画出频率分布直方图.,【思维引】(1)利用频数和等于60求m值,进而求a.(2)根据题中数据及表格数据画频率分布直方图.,【解析】(1)由题意得:6+21+27+m=60,所以m=6.a=0.45,所以a=0.45.(2)作出频率分布直方图如图所示.,【内化悟】画频率分布直方图的关键是什么?提示:确定组距.,【类题通】绘制频率分布直方图的注意事项(1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照.,(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据越多,分组越多.(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点.,(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内,以“正”字确定各个小组内数据的个数.(5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率.提醒:每个小长方形的面积=组距=频率.,【习练破】已知某池塘养殖着鲤鱼和鲫鱼,为了估计这两种鱼的数量,养殖者从池塘中捕出这两种鱼各1 000条,给每条鱼做上不影响其存活的标记,然后放回池塘,待完全混合后,再每次从池塘中随机地捕出1 000条鱼,记录下其中有记号的鱼的数目,立即放回池塘中.这样的记录做了10次,并将记录获取的数据制作成如图所示的茎叶图.,(1)根据茎叶图计算有记号的鲤鱼和鲫鱼数目的平均数,并估计池塘中的鲤鱼和鲫鱼的数量;,(2)为了估计池塘中鱼的总质量,现按照(1)中的比例对100条鱼进行称重,根据称重鱼的质量介于0,4.5(单位:千克)之间,将测量结果按如下方式分成九组:第一组0,0.5),第二组0.5,1),第九组4,4.5.如图是按上述分组方法得到的频率分布直方图的一部分.,估计池塘中鱼的质量在3千克以上(含3千克)的条数;若第三组鱼的条数比第二组多7条、第四组鱼的条数比第三组多7条,请将频率分布直方图补充完整;在的条件下估计池塘中鱼的质量的众数及池塘中鱼的总质量.,【解析】(1)根据茎叶图可知,鲤鱼与鲫鱼的平均数目分别为80,20.由题意知,池塘中鱼的总数目为1 000=20 000(条),则估计鲤鱼数目为20 000=16 000(条),鲫鱼数目为20 000-16 000=4 000(条).,(2)根据题意,结合直方图可知,池塘中鱼的质量在3千克以上(含3千克)的条数约为20 000(0.12+0.08+0.04)0.5=2 400.设第二组鱼的条数为x,则第三、四组鱼的条数分别为x+7,x+14,则有x+x+7+x+14=1001-(0.08+0.50+0.28+0.12+0.08+0.04)0.5,解得x=8,故第二、三、四组的频率分别为0.08,0.15,0.22,它们在频率分布直方图中的小矩形的高度分别为0.16,0.30,0.44,据此可将频率分布直方图补充完整(如图所示).,众数为2.25千克,平均数为0.250.04+0.750.08+1.250.15+1.750.22+2.250.25+2.750.14+3.250.06+3.750.04+4.250.02=2.02(千克),所以鱼的总质量为2.0220 000=40 400(千克).,类型二频率分布直方图的应用【典例】某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩(总分为100分)分成6组加以统计,6组的分数分别是40,50),50,60),60,70),70,80),80,90),90,100,得到如图所示的频率分布直方图.已知高一年级学生中不及格(低于60分)的人数,比优秀(不低于90分)的人数多60人,则高一年级共有学生世纪金榜导学号()A.300人B.600人C.200人D.700人,【思维引】设出总人数,利用频率分布直方图分别表示出不及格、优秀的人数,相减等于60即可.【解析】选B.设高一年级共有学生n人,则n(0.005+0.015)10-n0.01010=60,解得n=600.,【内化悟】利用频率分布直方图进行计算的依据是什么?提示:组距=频率.,【类题通】由频率分布直方图进行相关计算时,需掌握下列关系式.(1)组距=频率.(2)=频率,此关系式的变形为:=样本量,样本量频率=频数.,【习练破】为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形的面积之比为24171593,第二小组的频数为12.,(1)第二小组的频率是多少?样本量是多少?(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少?,【解析】(1)频率分布直方图是以面积的形式反映数据落在各小组内的频率大小的,因此第二小组的频率为=0.08.又因为第二小组的频率=,所以样本量=150.,(2)由频率分布直方图可估计,该校高一年级学生的达标率为:100%=88%.,【加练固】为调查我校学生的用电情况,学校后勤部门组织抽取了100间学生宿舍某月用电量调查,发现每间宿舍用电量都在50度到350度之间,其频率分布直方图如图所示.,(1)为降低能源损耗,节约用电,学校规定:每间宿舍每月用电量不超过200度时,按每度0.5元收取费用;超过200度,超过部分按每度1元收取费用.以t表示某宿舍的用电量(单位:度),以y表示该宿舍的用电费用(单位:元),求y与t的函数关系式.(2)求图中月用电量在(200,250度的宿舍有多少间.,【解析】(1)根据题意,得:当0t200时,用电费用为y=0.5t;当t200时,用电费用为y=2000.5+(t-200)1=t-100;综上:宿舍的用电费用为y=,(2)因为月用电量在(200,250度的频率为50 x=1-(0.006 0+0.003 6+0.002 4+0.002 4+0.001 2)50=1-0.015 650=0.22,所以月用电量在(200,250度的宿舍有1000.22=22(间).,类型三其他统计图【典例】某校高一某班的某次数学测试成绩(满分为100分)如下56,58,62,63,63,65,66,68,69,71,72,72,73,74,75,76,77,78,79,95,98其中80,90)内的成绩缺失.,频率分布直方图也受到了不同程度的破坏,但可见部分如图,据此解答下列问题:,(1)求分数在50,60)内的频率及全班人数.(2)求分数在80,90)之间的频数,并计算频率分布直方图中80,90)间的矩形的高.世纪金榜导学号,【思维引】(1)由题意可得分数在50,60)内的频数,由频率分布直方图,可得分数在50,60)内的频率,进而根据频率=解得全班人数.(2)分数在80,90)之间的频数,可由全班人数减去之外的频数.频率分布直方图中矩形的高为,求出80,90)这组的频率,然后除以组距.,【解析】(1)分数在50,60)的频率为0.00810=0.08.由题意知,分数在50,60)之间的频数为2,所以全班人数为=25.(2)分数在80,90)之间的频数为25-2-7-10-2=4,频率分布直方图中80,90)间的矩形的高为 10=0.016.,【类题通】条形统计图、扇形统计图和折线统计图的区别与联系,【习练破】(2017全国卷)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.,根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月份D.各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳,【解析】选A.由题图可知,2014年8月到9月的月接待游客量在减少,则A选项错误,故选A.,类型四百分位数【典例】某经销商从外地一水殖厂购进一批小龙虾,并随机抽取40只进行统计,按重量分类统计结果如图:,(1)估计这批小龙虾重量的第10百分位数与第90百分位数.(2)该经销商将这批小龙虾分成三个等级,如表:试估计这批小龙虾划为几等品比较合理?世纪金榜导学号,【思维引】第(1)问,将数据按从小到大排列,即自左到右,分别求出第10百分位数与第90百分位数,第(2)问用样本估计总体.,【解析】(1)因为4010%=4,所以第10百分位数为第4项与第5项的平均数,在5,15)范围内约为=10,因为4090%=36,所以第90百分位数为第36项与第37项的平均数,在35,55范围内,约为=45,所以估计这批小龙虾重量的第10百分位数为10,第90百分位数为45.,(2)由(1)知,将这批小龙虾重量集中在10,45范围内,所以划为二等品比较合理.,【内化悟】计算第p百分位数的关键是什么?提示:计算i=np%并分析不同情况下即i为整数或非整数时第p百分位数的计算.,【类题通】计算一组n个数据的第p百分位数的步骤:第1步,按从小到大排列原始数据.第2步,计算i=np%.,第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.,【习练破】贵阳轨道交通1号线2018年12月1日开通运营,某机车某时刻从下麦西站驶往贵阳北站的过程中,10个车站上车的人数统计如下:70,60,60,50,60,40,40,30,30,10,则这组数据的第25百分位数、第50百分位数的和为()A.70B.65C.75D.90,【解析】选C.数据70,60,60,60,50,40,40,30,30,10是从大到小排列的,因为1025%=2.5,按从小到大排列后,第25百分位数是第3项,即30;易知,第50百分位数是=45,所以第25百分位数、第50百分位数的和为75.,【加练固】为了了解甲、乙两个工厂生产的轮胎的宽度是否达标,分别从两厂随机各选取了10个轮胎,将每个轮胎的宽度(单位:mm)记录下来并绘制出如下的折线图:,分别求甲、乙两厂样本轮胎宽度的第10百分位数与第90百分位数,根据两厂的轮胎宽度的波动情况(波动越小,轮胎质量越好),判断这两个工厂哪个厂的轮胎相对更好?,【解析】甲厂这批轮胎宽度的数据为195,194,196,193,194,197,196,195,193,197,从小到大排列为193,193,194,194,195,195,196,196,197,197,又因为1010%=1,1090%=9,所以第10百分位数为第1项与第2项的平均数,即193;第90百分位数为第9项与第10项的平均数,即197.同理,乙厂这批轮胎宽度的数据从小到大排列为192,192,193,193,194,195,195,195,195,196.第10百分位数为192,第90百分位数为195.5.,因为197-193=4,195.5-192=3.5,乙厂的波动更小,用样本估计总体,所以乙厂的轮胎相对更好.,