成对数据的统计分析 第1课时 成对数据的统计相关性.docx
8.1成对数据的统计相关性(2课时,单元教学设计)柴化安(安徽省寿县第一中学)1教学内容和内容解析1.1 内容第1课时:变量的相关关系,主要包括变量的相关关系,散点图,正相关、负相关和线性相关等.第2课时:样本相关系数,主要包括如何构造相关系数以及相关系数的特性.1.2 内容解析本节课是人教A版选择性必修第三册第八章”成对数据的统计分析”中8.1的内容,是必修课程中统计知识的进一步延伸.通过必修课程的学习,学生初步建立了用样本估计总体的思想.本节课主要结合典型案例,利用成对样本数据的统计相关性,研究两个变量之间的统计相关性.对于成对样本数据研究两个变量的相关关系.根据先直观描述后定量刻画的统计中研究问题的一般思路,本节课先由成对样本数据的散点图宜观推断变量之间的相关关系,再构造统计量相关系数,让学生感受由直观想法到严格数学表达的逐步转化过程.利用从特殊到一般的研究方法,掌握样本相关系数绝对值的大小可以刻画样本相关程度的强弱,进一步推断两个变量之间相关的正负性和线性相关程度的强弱,为后面利用一元回归模型刻画两个数值变量的相关关系,并利用估计得到的回归方程进行预测奠定基础,也为后面通过抽样数据推断分类变量的独立性,构建Z2统计量做了思想方法上的铺垫.2目标和目标解析2.1 目标(1)通过实例,了解变量的相关关系,会区别变量之间的函数关系和变量之间的相关关系.(2)利用给出的数据画散点图,通过散点图判断两个变量间的正相关、负相关以及线性相关.(3)结合实例,了解样本相关系数的统计含义,了解样本相关系数与“标准化”处理后的成对数据量分量向量夹角的关系.通过实例,会通过相关系数比较多组成对数据的相关性.2.2 目标解析(1)通过实例,让学生认识到变量的相关关系是普遍的关系,理解学习变量的相关关系的必要性.通过“提出问题抽样调查画散点图作出推断”的方式,先直观描述再定量刻画,利用散点图判断两个变量间是否具有相关关系.(2)通过数据研究问题,用成对样本数据呈现的统计相关性去估计变量之间的相关性,散点图知识初步阶段,散点图无法定量刻画成对样本数据相关程度的强弱,因此要构造新的统计量.在构造样本相关系数的过程中,先初步建立刻画相关性的数学表达式,再逐步优化表达式,即对数据所做的“中心化”和“标准化”等处理,这些处理是统计学中常用的处理数据的方法,是一种重要的“标准化”思想,渗透了理性思维和科学精神.3教学问题诊断分析(1)问题诊断学生在在人教A版数学必修第二册的“统计”中的学习中,对于用样本估计总体的统计思想有一定的了解,基于数据观察、直观表示及统计特征的刻画等相关知识和方法,研究了刻画单个变量特征的基本量,如均值、方差、中位数、众数等.这为本节课研究两个变量间的关系相关程度的强弱奠定了一定的基础.本节课结合现实生活中的具体实例,以样本估计总体为主要思想,在成对样本数据散点图的基础上,定量研究成对样本数据的线性相关的强弱.(2)学生可能存在的困难学生经过函数的学习,对于两个变量之间的确定性关系先入为主,对学生相关关系的理解可能产生负迁移.在构造样本相关系数的过程中,对“中心化”和“标准化”处理的理解可能存在困难;在优化公式表达式的过程中,对公式烦琐的化简过程和符号表示的理解存在一定困难;对探究样本相关系数大小与相关性强弱的关系存在困难.(3)教学难点是通过散点图判断成对数据的相关性和样本相关系数的构造.4教学支持条件分析借助EXCeI等软件等制作课件,并进行数据处理,增强学生对数据分析的兴趣,提高教学效果.5课时教学设计1第一课时5.1 教学内容变量的相关关系,主要包括变量的相关关系,散点图,正相关、负相关和线性相关等.5.2 教学目标(1)通过实例,了解变量的相关关系,会区别变量之间的函数关系和变量之间的相关关系.(2)理解两个变量间的正相关、负相关以及线性相关的概念.(3)利用给出的数据画散点图,通过散点图判断两个变量的相关性.5.3 教学重点与难点教学重点:通过散点图判断成对数据的相关性.教学难点:理解函数关系、相关关系和因果关系的区别.5.4 教学过程设计5.4.1问题引领,导入新课问题L什么是数学?具体地,数学的研究对象是什么?师生活动:普通高中数学课程标准(2017年版)在论述数学课程性质时,开宗明义:数学是研究数量关系和空间形式的一门科学.这也是19世纪革命导师恩格斯对数学的定义.设计意图:既让学生从宏观上了解数学的研究对象,又引入本章主要研究“数量关系”中两个变量的相关关系.引导语:法国数学家笛卡尔创立了解析几何学,并在数学中引入“变量”,完成了数学史上一项划时代的变革.在数学必修第二册中,我们学习了单个变量的观察数据的直观表示和统计特征的刻画等知识和方法.例如,用直方图描述样本数据的分布规律,用均值刻画样本数据的集中趋势,用方差刻画样本数据的离散程度等.除了对单个变量研究,我们还需要了解两个或两个以上变量之间的关系,本章我们主要研究两个变量之间的关系.关于两个变量之间我们以前学习过有什么关系?师生活动:函数关系.追问1,“函数”是我们数学研究的重要内容,请同学们举出两个变量具有函数关系的例子.师生活动:正方形的面积y和边长X之间的关系就是函数关系:j=x2.设计意图:由“数量关系”到“函数关系”,为引出除了函数关系还有其它关系做铺垫.追问2:两个变量除了函数关系,是否还有其它关系?请同学们举例说明.师生活动:梳理数学的研究对象:p平AE几何空间形式。卜一立体几何T*就几何数关系师生活动:两个变量除了函数关系还有其它关系.例如,教育部门为了掌握学生身体健康状况,需要了解身高变量和体重变量之间的关系;医疗卫生部门要制定预防青少年近视的措施,需要了解有哪些因素会影响视力,以及这些因素是如何影响视力的;寿县一中需要了解性别因素是否对学生体育锻炼的经常性有影响等.为此,我们需要进一步学习通过样本推断变量之间关系的知识和方法.5. 4.2实例归纳,形成概念问题2:一个人的体重与他的身高有关系吗?师生活动:我们知道,一个人的体重与他的身高有关系,一般而言,个子高的人往往体重值较大,个子矮的人往往体重值较小,但身高并不是决定体重的唯一因素,例如生活中的饮食习惯、体育锻炼、睡眠时间以及遗传因素等也是影响体重的重要因素.像这样,两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.追问:请同学们举出两个变量具有相关关系的事例.师生活动:可以从遗传、商业、环境、农业等领域举例.1 .子女身高y与父亲身高X之间的关系.一般来说,父亲的个子高,其子女的个子也会比较高;父亲个子矮,其子女的个子也会比较矮,但影响子女身高的因素,除父亲身高外还有其他因素,例如母亲身高、饮食结构、体育锻炼等,因此父亲身高又不能完全决定子女身高.2 .商品销售收人y与广告支出%之间的关系.一般来说,广告支出越多,商品销售收入越高,但广告支出并不是决定商品销售收入的唯一因素,商品销售收入还与商品质量、居民收入等因素有关.3 .空气污染指数y与汽车保有量X之间的关系.一般来说,汽车保有量增加,空气污染指数会上升,但汽车保有量并不是造成空气污染的唯一因素,气象条件、工业生产排放、居民生活和取暖、垃圾焚烧等都是影响空气污染指数的因素.4 .粮食亩产量y与施肥量X之间的关系.在一定范围内,施肥量越大,粮食亩产量就越高,但施肥量并不是决定粮食亩产量的唯一因索,粮食亩产量还要受到土壤质量、降水量、田间管理水平等因素的影响.设计意图:通过列举丰富的案例,让学生感受到相关关系在现实中大量存在,体现研究变量之间相关关系的必要性.实际上,在复杂的现实世界里,相比确定性关系,不确定的相关关系是更常见的一种关系.在教学中,教师可以让学生再列举一些学生熟悉背景的变量之间的相关关系,进一步丰富案例的情境,让学生感受相关关系的普遍性.同时,要求学生对所列举的案例,解释其变量之间具有相关关系的原因,深化学生对相关关系概念的理解.问题3:如何判断两个变量有相关关系?引语:相关关系是相对于函数关系而言的,相关关系是一种不确定性关系,具体如何判断呢?师生活动:不能用函数去描述变量的相关关系,可以根据经验作出推断,上面案例中变量之间的相关关系主要是根据经验判断得出的.“经验之中有规律”.但仅凭经验推断乂有不足.例如,不同经验的人对同一情形可能会得到不同结论,不是所有的情形都有经验可循等.回忆数学必修第二册中的“统计”的研究方法:”用数据说话”.“用数据说话“,就是用真实的数据说出真实、规律性的话.当然,数据本来不会说话,但是,面对不同的人会发出不同的声音,这取决于人的知识和能力.在数学必修第二册中,我们学习了样本数据的统计特征(集中趋势参数、离散程度参数)的刻画方法,并根据样本数据的统计特征估计总体的相应特征.现在,我们需要借助数据说话,即通过样本数据分析,从数据中提取信息,并构建适当的模型,再利用模型进行估计或推断.探究:在对人体的脂肪的含量和年龄之间关系的研究中,科研人员获得了一些年龄和脂肪含量的简单随机样本数据,如表所示,表中每个编号下的年龄和脂肪含量数据都是对同一个体的观测结果,它们构成了成对数据.编号1234567891011121314年龄/岁2327394145495053545657586061脂肪含量%9.517.821.225.927.526.328.229.630.231.430.833.535.234.6根据以上数据,你能推断人体的脂肪含量与年龄之间存在怎样的关系吗?问题4:如何研究这个问题?师生活动:“一图胜千言”,读图时代就是借助图形说明问题.我们可以作“散点图”,1520 25 30 35 40 45 50 55 60 65 年龄/岁用图形展示成对样本数据的变化特征.追问:如何作散点图?师生活动:用横轴表示一个变量,用纵轴表示另一个变量,每个成对样本数据都可用直角坐标系中的点表示出来,由这些点组成了统计图,我们就称为散点图.通常可以用Excel软件画散点图.问题5:如何通过散点图,说明两个变量的相关关系?师生活动:由散点图可以发现,这些散点大致落在一条从左下角到右上角的直线附近,表明随年龄值的增加,相应的脂肪含量值呈现增高的趋势.这样,由成对样本数据的分布规律,我们可以推断脂肪含量变量和年龄变量之间存在着相关关系.如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关.当一个变量的值增加时,另一个变量的相应值也呈现减少的趋势,称这两个变量负相关.从散点图上看,根据样本数据所作得散点图中,若点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们称之为正相关;根据样本数据所作得散点图中,若点散布在从左上角到右下角的区域,对于两个变量的这种相关关系,我们称之为负相关.散点图是描述成对数据之间关系的一种直观方法.一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.5.4.3巩固练习,熟练掌握yO2 4 6 8 IO 12 14 x(1)8642O2 4 6 8 10 1214 X(2)y12 1086 421、说出下图两个变量是否具有相关性.86420O2468IO1214X(3)说明:一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.2、有数据显示,我国人均汽车拥有量与人均寿命数据,存在高度正相关关系.是不是因为人们拥有的汽车数量多导致他们长寿,还是因为人们长寿导致他们拥有的汽车数量多?师生活动:函数关系是一种确定的关系,也是一种因果关系,而相关关系是一种不确定性关系,两个变量之间的相关性往往受其他潜在变量的影响,不一定是因果关系.人均拥有汽车数量多与人们生活水平高有关,生活水平还与健身意识强、医疗条件改善等有关,这些又与长寿有关.这些潜在变量可能都有相同的变化趋势,但却不一定有相互因果关系.小结:函数关系与相关关系的异同点:相同点:二者都是指两个变量间的关系.不同点:函数关系是一种确定性关系,体现的是因果关系;而相关关系是一种非确定性关系,体现的不一定是因果关系,可能是伴随关系.3、观察下面四幅图中,哪些图可以推断两个变量是相关的?哪些图表示的成对数据的相关性较强.设计说明:仅凭经验不能判断变量的相关性,要用“散点图”进行直观判断.但只有散点图还是不够的,我们还要从定量的角度刻画成对数据的线性相关程度,这是下节课的任务.5.4.4归纳小结,提升能力学生先梳理,老师完善形成思维导图并说明本章的主要内容.师生活动:两个变量X和y具有相关关系的判断方法:(1)经验法:借助积累的经验进行分析判断散点图法;(2)通过散点图,观察它们的分布是否存在一定规律,直观地判断.如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.本节课结合典型实例,利用成对样本数据的统计相关性研究两个变量之统计相关性,采用直观的方法,观察相关关系的类型、方向和强弱.接下来,我们依然以样本估计总体为主要思想,一方面构造统计量定量刻画线性相关关系的密切程度,再建立一元线性回归模型,进行预测;另一方面,为了回答一定范围内的两种现象或性质之间是否存在关联性或相互影响的问题,我们先将它抽象为两个分类变量的独立性问题,利用2义2列联表表示数据,采用假设检验的方法进行推断.这些问题涵盖了参数估计和假设检验两种基本推断方法,并蕴含着丰富的统计思想和方法,能有效提高学生数据分析素养.5. 4.5布置作业,训练反馈教科书95-96页练习第1、2、3题;教科书103页习题8.1第1题.5.5目标检测设计1、对变量X,有观测数据(%,K)(i=l,2,,10),得散点图如图(1);对变量”,U有观测数据(/J(i=1,2,,10),得散点图如图(2).由这两个散点图可以判断()a.变量X与y正相关,与P正相关vtUB.变量X与y正相关,与y负相关25.502040.c.变量X与y负相关,与y正相关.M10ZUD.变量X与y负相关,与U负相关5,.l0,O1234567*O12345672、教材第103页习题8.1第4题某地区的环境条件适合天鹅栖息繁衍.有人发现了一个有趣的现象,该地区有5个村庄,其中3个村庄附近栖息的天鹅较多,婴儿出生率也较高;2个村庄附近栖息的天鹅较少,婴儿的出生率也较低.有人认为婴儿出生率和天鹅数之间存在相关关系,并得出一个结论:天鹅能够带来孩子.你同意这个结论吗?为什么?3、有数据表明,冰淇淋的销量和啤酒的销量正相关.如果在世界杯期间,随着啤酒销量上涨,厂家增加冰激凌产量,这样合理吗?说明:我们都知道冰淇淋的销量和啤酒的销量是随气温变化而出现相关的,天气热的时候大家都喜欢吃冰激凌喝啤酒,但冰激凌与啤酒之间并没有因果关系.如果贸然套用相关性,在世界杯期间,随着啤酒销量上涨,厂家增加冰激凌产量,那就可能造成损失了。