回归分析的基本思想及其初步应用(优质课)ppt课件.ppt
2022/11/20,郑平正 制作,3.1回归分析的基本思想及其初步应用(一),高二数学 选修2-3,城阳一中 毛世勤,2022/11/20,郑平正 制作,问题1:正方形的面积y与正方形的边长x之间 的函数关系是,问题2:某水田水稻产量y与施肥量x之间是否 -有一个确定性的关系?,例如:在 7 块并排、形状大小相同的试验田上 进行施肥量对水稻产量影响的试验,得到如下所示的一组数据:,复习、变量之间的两种关系,2022/11/20,郑平正 制作,自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.,1、定义:,1):相关关系是一种不确定性关系;,注,新课,2022/11/20,郑平正 制作,2、现实生活中存在着大量的相关关系. 如:人的身高与年龄; 产品的成本与生产数量; 商品的销售额与广告费; 家庭的支出与收入.等等,2022/11/20,郑平正 制作,回归直线方程:,称为样本点的中心.,对两个变量进行的线性分析叫做线性回归分析.,2022/11/20,郑平正 制作,相关系数,1.计算公式2相关系数的性质(1)|r|1(2)|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小,2022/11/20,郑平正 制作,负相关,正相关,(一)回顾:数学线性回归分析的步骤 :,温故知新,1、画散点图,4、用回归直线方程进行预报,3、求回归直线方程,2、求,课前检测: 假设关于某设备的使用年限x和所支出的维修费用 y(万元),有如下的统计资料。,(1)画散点图并求回归方程 ;()估计使用年限为10年时,维修费用是多少?,使用年限为10年时,维修费用是:12.38万元,2008年5月,中共中央国务院关于加强青少年体育、增强青少年体质的意见指出城市超重和肥胖青少年的比例明显增加.“身高标准体重”该指标对于学生形成正确的身体形态观具有非常直观的教育作用. “身高标准体重”从何而来?我们怎样去研究?,创设情境:,例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。,求根据女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重。,问题呈现:女大学生的身高与体重,解; 1.由于问题中要求根据身高预报体重,因此选取身高为解释变量x,体重为预报变量y,3.回归方程:,2. 散点图;,探究:身高为172cm的女大学生的体重一定是60.316kg吗?如果不是,你能解析一下原因吗?,答:身高为172cm的女大学生的体重不一定是60.316kg,但一般可以认为她的体重接近于60.316kg。,例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。,女大学生的身高与体重,解; 1.由于问题中要求根据身高预报体重,因此选取身高为自变量x,体重为因变量y,3.回归方程:,2. 散点图;,2022/11/20,郑平正 制作,2022/11/20,郑平正 制作,2022/11/20,郑平正 制作,2022/11/20,郑平正 制作,2022/11/20,郑平正 制作,2022/11/20,郑平正 制作,思考:如何发现数据中的错误?如何衡量模型的拟合效果?,可以通过残差发现原始数据中的可疑数据,判断所建立模型的拟合效果. 表3-2列出了女大学生身高和体重的原始数据以及相应的残差数据.,表3-2,2022/11/20,郑平正 制作,2022/11/20,郑平正 制作,从图3.1-3中可以看出,第1个样本点和第6个样本点的残差比较大,需要确认在采集这两个样本点的过程中是否有人为的错误.如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型拟合数据;如果数据采集没有错误,则需要寻找其他的原因.另外,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适.这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.,如何衡量预报的精度?,显然,R2的值越大,说明残差平方和越小,也就是说模型拟合效果越好。,如果某组数据可能采取几种不同回归方程进行回归分析,则可以通过比较R2的值来做出选择,即选取R2较大的模型作为这组数据的模型。,2022/11/20,郑平正 制作,2022/11/20,郑平正 制作,2022/11/20,郑平正 制作,学以致用:,1、在对两个变量,进行线性回归分析时有下列步骤:对所求出的回归方程作出解释,收集数据(,)求线性回归方程,求相关系数,根据所搜集的数据绘制散点图如果根据可靠性要求能够作出变量,具有线性相关结论,则在下列操作顺序中正确的是(),2022/11/20,郑平正 制作,2. 有下列说法:在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适.用相关指数R2来刻画回归的效果, R2值越大,说明模型的拟合效果越好.比较两个模型的拟合效果,可以比较相关系数的大小,相关系数越大的模型,拟合效果越好.其中正确命题的个数是()A.0B.1C.2D.3,C,学以致用:,3、对于相关指数,下列说法正确的是(),、的取植越小,模型拟合效果越好、的取值可以是任意大,且取值越大拟合效果越好、的取值越接近,模型拟合效果越好、以上答案都不对,学以致用:,4、甲、乙、丙,丁四位同学各自对,两变量的线性相关性做实验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:,则哪位同学的实验结果体现,两变量有更强的线性相关性甲乙丙丁,2022/11/20,郑平正 制作,D,2022/11/20,郑平正 制作,6.一位母亲记录了儿子39岁的身高,由此建立的身高与年龄的回归模型为y=7.19x+73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是( ) A.身高一定是145.83 cm B.身高在145.83 cm以上 C.身高在145.83 cm以下 D.身高在145.83 cm左右,D,2022/11/20,郑平正 制作,7. 在研究身高和体重的关系时,求得相关指数 _,可以叙述为“身高解释了64%的体重变化,而随机误差贡献了剩余的36%”,所以身高对体重的效应比随机误差的效应大得多.,学以致用:,()则y对x的线性回归方程是()相应于各样本点的残差(i=1,2,3,4)分别是,残差平方和是,课堂总结:,1、线性回归分析的步骤2、回归模型的建立3、随机误差的研究,知识小节:,数学思想小结:,1、最小二乘法思想2、函数与方程的思想3、数形结合,