学案4用样本估计总体与变量间的相关关系.ppt
《学案4用样本估计总体与变量间的相关关系.ppt》由会员分享,可在线阅读,更多相关《学案4用样本估计总体与变量间的相关关系.ppt(59页珍藏版)》请在三一办公上搜索。
1、2013年高考,试题难度仍以中低档题为主.对总体分布的估计、线性回归很可能在选择、填空题中考查.对于频率分布直方图,求线性回归方程以及回归分析、独立性检验与假设检验等,由于计算量大,因此考解答题的可能性不大,但也不排除给出数据、公式,以选择题形式考查.,1.用样本的频率分布估计总体分布(1)频率分布表与频率分布直方图 频率分布表和频率分布直方图,是从各个小组数据在样本容量中所占 的角度,来表示数据分布规律,它可以使我们看到整个样本数据的频率分布情况.,比例大小,(2)频率分布折线图 连接频率分布直方图中各小长方形,就得到频率分布折线图.(3)总体密度曲线 总体密度曲线反映了总体在各个范围内取值
2、的百分比,它能给我们提供更加精细的信息.(4)茎叶图 2.用样本的数字特征估计总体的数字特征(1)众数、中位数、平均数,上端的中点,众数:在样本数据中,频率分布最大值所对应的样本 数 据;中位数:样本数据中,累积频率为0.5时所对应的样本数据值(累积频率:样本数据小于某一数值的频率叫做该数值点的累积频率);平均数:样本数据的算术平均数,即x=.(2)标准差的计算公式:s=.3.从散点图上看,点散布在 就称这种相关关系为正相关,如果点散布在,从左下角到右上角的区域内,从左上角到右下,角的区域内,就称这种相关关系为负相关.,4.如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之
3、间具有,这条直线叫做回归直线,回归直线方程常记作.5.对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn),用最小二乘法,求回归直线系数a,b的公式为 b=,a=.其中,x=,y=.,线性相关关系,通过求Q=的最小值而得出回归直线的方法,即求回归直线,使得样本 数 据的点到它的距离的平方和最小,这一方法叫做最小二乘法.,(y1-bx1-a)2+(y2-bx2-a)2+(yn-bxn-a)2,考点1 绘制频率分布直方图,某市2011年4月1日4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88
4、,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.,(1)完成频率分布表;(2)作出频率分布直方图;(3)根据国家标准,污染指数在050之间时,空气质量为优;在51100之间时,为良;在101150之间时,为轻微污染;在151200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.,(1)频率分布表:,(2)频率分布直方图如图所示.,(3)答对下述两条中的一条即可:该市一个月中空气污染指数有2天处于优的水平,占当月天数的;有26天处于良的水平,占当月天数的;处于优或良的天数为28,占当月天数的
5、.说明该市空气质量基本良好.轻微污染有2天,占当月天数的;污染指数在80以上的接近轻微污染的天数15,加上处于轻微污染的天数17,占当月天数的,超过50%;说明该市空气质量有待进一步改善.,【评析】(1)列频率分布表时要注意区分频数、频率的意义.(2)画频率分布直方图时要注意纵、横坐标代表的意义及单位.(3)通过本题可以掌握总体分布估计的各种常见步骤和方法.(4)解决总体分布估计问题的一般步骤如下:先确定分组的组数;分别计算各组的频数及频率(频率=);画出频率分布直方图,并作出相应的估计.,频数,总数,对某电子元件进行寿命追踪调查,情况如下:寿命(h)100,200)200,300)300,4
6、00)400,500)500,600)个数(个)2030804030(1)列出频率分布表;(2)画出频率分布直方图;(3)估计电子元件寿命在100,400)以内的概率;(4)估计电子元件寿命在400 h以上的概率.,【解析】(1)样本频率分布表如下:(2)频率分布直方图如图,(3)由频率分布表可以看出,寿命在100,400)内的电子元件出现的频率为0.65,所以我们估计电子元件寿命在100,400)内的概率为0.65.(4)由频率分布表可知,寿命在400 h以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400 h以上的概率为0.35.,考点2 频率分布直方图的
7、应用,为了解学生身高情况,某校以10%的比例对全校700名学生按性别进行分层抽样调查,测得身高情况的统计图如图:,(1)估计该校男生的人数;(2)估计该校学生身高在170185 cm之间的概率;(3)从样本中身高在180190 cm之间的男生中任选2人,求至少有1人身高在185190 cm之间的概率.,【分析】在频率直方图中,频率等于矩形的面积,每一小组的频率等于这小组的频数与样本容量的商.,【解析】(1)样本中男生人数为40,由分层抽样比例为10%估计全校男生人数为400.(2)由统计图知,样本中身高在170185 cm之间的学生有14+13+4+3+1=35(人),样本容量为70,所以样本
8、中学生身高在170185 cm之间的频率f=0.5.故由f估计该校学生身高在170185 cm之间的概率p=0.5.(3)样本中身高在180185 cm之间的男生有4人,设其编号为,样本中身高在185190 cm之间的男生有2人,设其编号为.从上述6人中任选2人的树状图为:,故从样本中身高在180190 cm之间的男生中任选2人的所有可能结果数为15,至少有1人身高在185190 cm之间的可能结果数为9.因此,所求概率p2=.,评析解决该类问题时应正确理解图表中各个量的意义,识图掌握信息是解决该类问题的关键.频率分布指的是一个样本数据在各个小范围内所占比例的大小,一般用频率分布直方图反映样本
9、的频率分布.其中,频率分 布直方图中纵轴表示,频率=;频率分布直方图中,各小长方形的面积之和为1,因此在频率分布直方图中,组距是一个固定值,所以长方形高的比也就是频率之比;频率分布表和频率分布直方 图是一组数据频率分布的两种形式,前者准确,后者直观;众数为最高矩形的中点;中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标.,频率,组距,频数,样本容量,根据中华人民共和国道路交通安全法规定:车辆驾驶员血液酒精浓度在2080 mg/100 mL(不含80)之间,属于酒后驾车;血液酒精浓度在80 mg/100 mL(含80)以上时,属醉酒驾车.据法制晚报报道,近两周全国查处酒后驾车和
10、醉酒驾车共28 800人,如图是对这28 800人血液中酒精含量进行检测所得结果的频率分布直方图,则属于醉酒驾车的人数约为()A.2 160人 B.2 880人C.4 320人 D.8 640人,C(依题意血液酒精浓度超过80 mg/100 mL的频率为0.00510+0.0110=0.15,因此属于醉酒驾车的人数为28 8000.15=4 320(人).故应选C.),甲、乙两台机床同时加工直径为10mm的零件,为了检验产品的质量,从产品中各随机抽取6件进行测量,测得数据如下(单位:mm)甲:99,100,98,100,100,103乙:99,100,102,99,100,100(1)分别计算
11、上述两组数据的平均数和方差;(2)根据(1)的计算结果,说明哪一台机床加工的这种零件 更符合要求.,考点 用样本的数字特征估计总体的数字特征,【评析】两个机床加工零件的平均数相等,平均数描述了数据的平均水平,要说明哪一台机床加工的零件更符合要求,可再用方差来判断.平均数和标准差超过了规定界限时,说明这批产品质量与生产要求有较大偏差.,甲、乙两种冬小麦试验品种连续x年的平均单位面积产量如下:,试根据这组数据,估计哪一种小麦品种产量较稳定.,甲品种的样本平均数为10,样本方差为(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)25=0.02;乙品种的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 样本 估计 总体 变量 相关 关系

链接地址:https://www.31ppt.com/p-5634953.html