选修2 3.3.1回归分析的基本思想及其初步应用ppt课件.ppt
《选修2 3.3.1回归分析的基本思想及其初步应用ppt课件.ppt》由会员分享,可在线阅读,更多相关《选修2 3.3.1回归分析的基本思想及其初步应用ppt课件.ppt(66页珍藏版)》请在三一办公上搜索。
1、3.1 回归分析的基本思想及其初步应用,高二数学 选修2-3 第三章 统计案例,2022/11/25,1,v:pzyandong,问题1:正方形的面积y与正方形的边长x之间的函数关系是,y = x2,问题2:某水田水稻产量y与施肥量x之间是否有一个确定性的关系?,变量之间的两种关系,2022/11/25,2,v:pzyandong,10 20 30 40 50,500450400350300,施化肥量,水稻产量,2022/11/25,3,v:pzyandong,自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.,定义:,(1)相关关系是一种不确定性关系;,(2)对具
2、有相关关系的两个变量进行统计分析的方法叫回归分析.,2022/11/25,4,v:pzyandong,现实生活中存在着大量的相关关系 如:人的身高与年龄; 产品的成本与生产数量; 商品的销售额与广告费; 家庭的支出与收入,等等.,探究1:水稻产量y与施肥量x之间大致有何规律?,2022/11/25,5,v:pzyandong,10 20 30 40 50,500450400350300,发现:图中各点,大致分布在某条直线附近.,探究2:在这些点附近可画不止一条直线,哪条直线最能代表x与y之间的关系呢?,散点图,施化肥量,水稻产量,2022/11/25,6,v:pzyandong,最小二乘估计下
3、的线性回归方程:,回归直线必过样本点的中心,2022/11/25,7,v:pzyandong,例1 从某大学中随机选出8名女大学生,其身高和体重数据如下表所示,解:由于问题中要求根据身高预报体重,因此选取身高为自变量x,体重为因变量y.作散点图,2022/11/25,8,v:pzyandong,由散点图可知,身高和体重有比较好的线性相关关系,设回归直线方程为y=bx+a,由系数公式得,所以回归方程为,求根据女大学生的身高预报体重的回归方程,并预报一名身高为172的女大学生的体重.,0.84917285.71260.316(kg),探究 身高为172cm的女大学生的体重一定是60.316kg吗?
4、如果不是,你能解析一下原因吗?,2022/11/25,9,v:pzyandong,1.确定变量;,2.作散点图,判断相关关系;,3.设回归方程;,4.求回归方程;,5.根据回归方程作出预报.,解答步骤:,2022/11/25,10,v:pzyandong,对于一组具有线性相关的数据,其回归直线方程为,线性回归模型,(x1, y1), (x2, y2), (xn, yn),y=bx+a,y=bx+a+e,2022/11/25,11,v:pzyandong,其中a和b为模型的未知参数,e称为随机误差.,线性回归模型,2022/11/25,12,v:pzyandong,线性回归模型,其中,a和b是模
5、型的未知参数.,通常e为随机变量,称为随机误差.,2022/11/25,13,v:pzyandong,当变量x取xi(i=1,2,n)时,回归方程的i与实际收集到的yi之间的偏差是yii=yi(bxi+a),2022/11/25,14,v:pzyandong,残差,数据点和它在回归直线上相应位置的差异 i=yii 称为相应于点(xi,yi)的残差。,例:编号为6的女大学生,计算随机误差的效应(残差),残差平方和,把每一个残差所得的值平方后加起来,用数学符号表示为:,称为残差平方和,2022/11/25,15,v:pzyandong,下图列出了女大学生身高和体重的原始数据以及相应的残差数据。,残
6、差分析与残差图的定义:,2022/11/25,16,v:pzyandong,残差图的制作及作用。 若模型选择的正确,残差图中的点应该分布在以横轴为心的带形区域;对于远离横轴的点,要特别注意。,身高与体重残差图,几点说明: 第一个样本点和第6个样本点的残差比较大,需要确认在采集过程中是否有人为的错误。 另外,残差点比较均匀地落在水平的带状区域中,说明选用的模型计较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高。,2022/11/25,17,v:pzyandong,显然,R2的值越大,说明残差平方和越小,也就是说模型拟合效果越好。,R2越接近1,表示回归的效果越好(因
7、为R2越接近1,表示解析变量和预报变量的线性相关性越强)。,如果某组数据可能采取几种不同回归方程进行回归分析,则可以通过比较R2的值来做出选择,即选取R2较大的模型作为这组数据的模型。,总的来说:相关指数R2是度量模型拟合效果的一种指标。在线性模型中,它代表自变量刻画预报变量的能力。,2022/11/25,18,v:pzyandong,R2,1.反映回归直线的拟合程度2.取值范围在 0 , 1 之间3. R2 1,说明回归方程拟合的越好;R20,说明回归方程拟合的越差,的含义,2022/11/25,19,v:pzyandong,练习1 在一段时间内,某中商品的价格x元和需求量y件之间的一组数据
8、为:,求出y对的回归直线方程,并说明拟合效果的好坏。,解:,2022/11/25,20,v:pzyandong,练习1 在一段时间内,某中商品的价格x元和需求量Y件之间的一组数据为:,求出Y对的回归直线方程,并说明拟合效果的好坏。,列出残差表为,0.994,因而,拟合效果较好。,0,0.3,-0.4,-0.1,0.2,4.6,2.6,-0.4,-2.4,-4.4,2022/11/25,21,v:pzyandong,案例2 一只红铃虫的产卵数y和温度x有关。现收集了7组观测数据列于表中:,(1)试建立产卵数y与温度x之间的回归方程;并预测温度为28oC时产卵数目。(2)你所建立的模型中温度在多大
9、程度上解释了产卵数的变化?,非线性回归问题,2022/11/25,22,v:pzyandong,假设线性回归方程为 :=bx+a,选 模 型,由计算器得:线性回归方程为y=19.87x-463.73相关指数R2=r20.8642=0.7464,估计参数,解:选取气温为解释变量x,产卵数为预报变量y。,所以,一元线性模型中温度解释了74.64%的产卵数变化。,探索新知,方案1,分析和预测,当x=28时,y =19.8728-463.73 93,一元线性模型,2022/11/25,23,v:pzyandong,方案2,选用y=bx2+a ,还是y=bx2+cx+a ?如何求a、b ?,二次函数模型
10、,2022/11/25,24,v:pzyandong,方案2解答,平方变换:令t=x2,产卵数y和温度x之间二次函数模型y=bx2+a就转化为产卵数y和温度的平方t之间线性回归模型y=bt+a,作散点图,并由计算器得:y和t之间的线性回归方程为y=0.367t-202.543,相关指数R2=0.802,将t=x2代入线性回归方程得: y=0.367x2 -202.543当x=28时,y=0.367282-202.5485,且R2=0.802,所以,二次函数模型中温度解释了80.2%的产卵数变化。,2022/11/25,25,v:pzyandong,产卵数,气温,指数函数模型,方案3,2022/
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 选修2 3.3.1回归分析的基本思想及其初步应用ppt课件 选修 3.3 回归 分析 基本 思想 及其 初步 应用 ppt 课件
链接地址:https://www.31ppt.com/p-1445369.html