《变量的相关性》PPT课件.ppt
第2讲,变量的相关性,1变量间的相关关系(1)散点图将样本中 n 个数据点xi,yi)(i1,2,n)描在平面直角坐标系中,表示两个变量关系的一组数据的图形叫做散点图(2)正相关、负相关散点图中各点散布的位置是从左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也由小变大,这种关,系称为_;,正相关,散点图中各点散布的位置是从左上角到右下角的区域,即一个变量的值由小变大时,另一个变量的值却由大变小,这种关,系称为_,负相关,2两个变量的线性相关(1)线性相关关系观察散点图的特征,如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线,样本点的中心,(3)最小二乘法,这一方法叫做最小二乘法,(4)线性相关强度的检验叫做 y 与 x 的相关系数,简称相关系数,即求回归直线,使得样本数据的点到它的距离的平方和_,,最小,r 具有以下性质:|r|1,并且|r|越接近 1,线性相关程度越强;|r|越接近 0,线性相关程度越弱r0 表明两变量正相关,r0.75 时,认为两个变量有很_的线性相关关系(5)相关指数,R2 越接近 1,模型的拟合效果,相关指数 R21越好,强,D,1下列两个变量之间的关系哪个不是函数关系()A角度和它的余弦值B正方形边长和面积C正 n 边形的边数和它的内角和D人的年龄和身高,2有关线性回归的说法,不正确的是(,),D,A相关关系的两个变量是非确定关系B散点图能直观地反映数据的相关程度C回归直线最能代表线性相关的两个变量之间的关系D散点图中的点越集中,两个变量的相关性越强,4(2011 辽宁)调查某地若干户家庭的年收入 x(单位:万元)和年饮食支出 y(单位:万元),调查显示年收入 x 与年饮食支出 y具有线性相关关系,并由调查数据得到 y 对 x 的回归直线方程:0.254x0.321.由回归直线方程可知,家庭年收入每增加 1 万元,年饮食支,出平均增加_万元,A,0.254,5(2011 年广东中山三模)已知 x,y 之间的一组数据如下:,考点1,散点图与相关关系的判断,例1:在 7 块并排、形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,得到如下表所示的一组数据(单位:kg):(1)将上述数据制成散点图;(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增加吗?,解析:(1)散点图如图D42.,图D42,(2)从图中可以发现数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,当施化肥量由小变大时,水稻产量由小变大,但水稻产量只是在一定范围内随着化肥的施用量的增加而增大,若在散点图中点的分布有一个集中的大致趋势,所有点看上去都在一条直线附近波动,就可以说变量间是线性相关的且根据散点图还可以判断是正相关还是负相关,【互动探究】1对变量 x,y 有观测数据(xi,yi)(i1,2,10),得散点图 1525(1);对变量 u,v 有观测数据(ui,vi)(i1,2,10),,),得散点图 1525(2).由这两个散点图可以判断(1)(2)图 1525,A变量 x 与 y 正相关,u 与 v 正相关B变量 x 与 y 正相关,u 与 v 负相关C变量 x 与 y 负相关,u 与 v 正相关D变量 x 与 y 负相关,u 与 v 负相关,答案:C,考点2 利用回归直线方程对总体进行估计,例2:下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量 x(吨)与相应的生产能耗 y(吨标准煤)的几组对照数据:,(1)请画出上表数据的散点图;,(2)请根据上表提供的数据,用最小二乘法求出 y 关于 x 的线,(3)已知该厂技改前 100 吨甲产品的生产能耗为 90 吨标准煤试根据(2)求出的线性回归方程,预测生产 100 吨甲产品的生产能耗比技改前降低多少吨标准煤(参考数值:32.5435464.566.5)?,解题思路:(1)将表中的各对数据在平面直角坐标系中描点,,得到散点图,(2)按要求写出回归方程的步骤和公式,写出回归方程,解析:(1)图略,(3)根据回归方程的预测,现在生产 100 吨产品消耗的标准煤的数量为:0.71000.3570.35(吨),故耗能减少了 9070.3519.65(吨),最小二乘法估计的一般方法:,作出散点图,判断是否线性相关;,根据方程进行估计,【互动探究】2为考虑广告费用 x 与销售额 y 之间的关系,抽取了 5 家餐厅,得到如下数据:现要使销售额达到 60 万元,则需广告费用为_(保留两,位有效数字),15 万元,易错、易混、易漏例题:(2011 江西)为了解儿子身高与其父亲身高的关系,随机抽取 5 对父子身高数据如下:则 y 对 x 的线性回归方程为(),答案:C,1相关关系与函数关系不同,函数关系中的两个变量间是一种确定关系,相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系两个变量具有相关关系是回归分析的前提,2回归分析是处理变量相关关系的一种数学方法主要解决:(1)确定特定量之间是否有相关关系,如果有就找出它们之间贴近的数学表达式;(2)根据一组观察值,预测变量的取值及判断变量取值的变化趋势;(3)求出回归直线方程,1回归分析是对具有相关关系的两个变量进行统计分析的思想方法,只有散点图大致分布在一条直线附近时,求出的回归直线方程才有意义忽视这一条件,求出的直线方程是毫无意义的,