2020年高二网课ppt课件回归分析的基本思想及初步应用.ppt
3.1,回归分析的基本思想及其初步应用,数学,选修,2-,3,第三章,统计案例,问题,1,:现实生活中两个变量间的关系有哪些呢?,函数关系,是一种确定性关系,相关关系,是一种非确定性关系,回归分析,是对具有相关关系的两个变量进行统计分析的一种常用方法,.,一、复习回顾,两个变量的关系,不相关,相关关系,函数关系,线性相关,非线性相关,正相关(增),负相关(减),问题,2,:研究两个变量是否线性相关的的基本步骤是什么?,问题,3,:求线性回归直线的基本方法是什么?,画散点图,求回归直线方程,用回归直线方程进行预报,最小二乘法,求,2,2,2,1,1,2,2,?,?,?,?,?,?,(,),(,),(,),n,n,y,bx,a,y,bx,a,y,bx,a,?,?,?,?,?,?,?,?,?,?,L,的最小值,2,1,?,(,),n,i,i,i,Q,y,y,?,?,?,?,一、复习回顾,),(,1,1,y,x,),(,2,2,y,x,),(,i,i,y,x,i,i,y,y,?,y,x,?,?,?,y,bx,a,?,?,?,?,?,?,2,1,?,?,n,i,i,i,a,b,Q,y,x,?,?,?,?,?,?,?,?,?,?,?,是使,取得最小值的,的值,?,?,?,?,?,?,?,?,2,1,?,?,?,?,?,?,?,?,?,n,i,i,i,x,y,x,y,x,y,Q,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,2,1,2,2,n,i,i,i,i,i,y,x,y,x,y,x,y,x,y,x,y,x,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,2,1,1,2,2,(,),(,),n,n,i,i,i,i,i,i,y,x,y,x,y,x,y,x,y,x,n,y,x,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,一、复习回顾,1,(,),(,),n,i,i,i,y,x,y,x,y,x,?,?,?,?,?,?,?,?,?,?,?,?,Q,?,?,?,?,?,?,?,?,?,?,?,?,?,?,n,i,i,i,x,y,x,y,x,y,1,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,n,i,i,n,i,i,x,y,n,x,y,x,y,1,1,?,?,?,?,?,?,?,?,?,?,0,?,?,?,?,?,?,?,x,y,n,x,n,y,n,x,y,?,?,?,?,一、复习回顾,?,?,?,?,?,?,2,2,1,n,i,i,i,Q,y,x,y,x,n,y,x,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,2,1,2,1,1,2,2,2,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,x,y,n,y,y,y,y,x,x,x,x,n,i,i,n,i,i,i,n,i,i,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,n,i,i,n,i,i,n,i,i,i,n,i,i,n,i,i,i,n,i,i,y,y,x,x,y,y,x,x,x,x,y,y,x,x,x,x,x,y,n,1,2,1,2,2,1,2,1,2,1,1,2,2,?,?,?,与,?,?,无关,0,一、复习回顾,?,?,?,?,?,?,?,?,?,?,?,?,?,n,i,i,n,i,i,i,x,x,y,y,x,x,1,2,1,?,x,y,?,?,?,?,?,a,?,?,b,?,?,?,?,?,2,1,n,i,i,i,Q,y,x,?,?,?,?,?,?,?,?,?,?,?,?,取得最小值的,的值,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,0,0,2,1,2,1,1,2,2,n,i,i,n,i,i,i,n,i,i,x,x,y,y,x,x,x,x,x,y,n,?,?,?,满足:,一、复习回顾,利用最小二乘法求回归直线的方程:,一、复习回顾,对于一组具有线性相关关系的数据,?,?,?,?,?,?,1,1,2,2,n,n,x,y,x,y,x,y,?,,,设回归直线为,?,?,?,y,bx,a,?,?,,则:,1,1,2,2,2,1,1,(,)(,),?,(,),n,n,i,i,i,i,i,i,n,n,i,i,i,i,x,x,y,y,x,y,nx,y,b,x,x,x,nx,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,,,?,?,a,y,bx,?,?,其中,1,1,1,1,n,n,i,i,i,i,x,x,y,y,n,n,?,?,?,?,?,?,,回归直线必经过样本中心点,?,?,x,y,?,?,?,?,?,?,?,1,1,2,2,2,2,2,2,1,1,1,1,(,)(,),n,n,i,i,i,i,i,i,n,n,n,n,i,i,i,i,i,i,i,i,x,x,y,y,x,y,nx,y,r,x,x,y,y,x,nx,y,ny,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,r,0,时,,表明两个变量,正相关;,r,0,时,,表明两个变量,负相关,相关系数,r,衡量两个变量间线性相关关系强弱的方法,r,的绝对值越接近,1,,,表明两个变量的线性相关性越强;,r,的绝对值越接近,0,,,表明两个变量之间几乎不存在线性相关关系,当,|,r|,0.75,时,,认为两个变量,有很强的线性,相关关系,如何刻画两个变量线性相关关系的强弱?,?,0,b,?,?,0,b,?,一、复习回顾,观察散点图或计算相关系数,?,练一练,【解析】由题设知,这组样本数据完全负相关,故其相关系数为,1,,故选,A,A,1,、在一组样本数据(,x,1,,,y,1,),,,(,x,2,,,y,2,),,,(,x,n,,,y,n,),(,n,2,,,x,1,,,x,2,,,x,n,不全相等),的散点图中,若所有样本点(,x,i,,,y,i,),(,i,=1,,,2,,,n,)都在直线,1,1,2,y,x,?,?,?,上,则这组,样本数据的样本相关系数为,A,?,1,B,0,C,1,2,D,1,?,练一练,2,、,某饮料店的日销售收入,y,(单位:百元)与当天平均气温,x,(单位,C,?,)之间有下列,数据:,x,2,?,1,?,0,1,2,y,5,4,2,2,1,甲、乙、丙、丁四位同学对上述数据进行了研究,分别得到了,x,与,y,之间的四个线性回归,方程,其中正确的是,A,?,2.8,y,x,?,?,?,B,?,3,y,x,?,?,?,C,?,1.2,2.6,y,x,?,?,?,D,?,2,2.7,y,x,?,?,A,?,练一练,3,、某班五名学生的数学和物理成绩如下表:,学生,学生成绩,A,B,C,D,E,数学成绩(分),89,77,74,67,63,物理成绩(分),78,66,71,64,61,(,1,)画出散点图;,(,2,)求物理成绩,y,对数学成绩,x,的回归直线方程;,(精确到,0.1,),(,3,)利用(,2,)中的回归方程,分析该班数学成绩,63,分到,89,分的学生物理成绩的变化情,况,并预测该班一名数学成绩是,96,分的学生的物理成绩,解:,(,1,)散点图如图所示:,(,2,)由已知得:,89,77,74,67,63,74,5,x,?,?,?,?,?,?,,,78,66,71,64,61,68,5,y,?,?,?,?,?,?,,,5,2,1,(,),225,9,0,49,121,404,i,i,x,x,?,?,?,?,?,?,?,?,?,5,1,(,)(,),15,10,3,(,2),0,3,(,7),(,4),(,11),(,7),249,i,i,i,x,x,y,y,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,249,?,0.6,404,b,?,?,?,,,?,?,68,0.6,74,23.6,a,y,bx,?,?,?,?,?,?,所以物理成绩,y,对数学成绩,x,的回归直线方程为,?,0.6,23.6,y,x,?,?,(,3,)由(,2,)知,?,0.6,0,b,?,?,,,该班数学成绩,63,分到,89,分的学生物理成绩随数学成绩的增,加而增加,且数学成绩每增加一分,物理成绩平均增加,0.6,分;,将,96,x,?,代入回归方程,?,0.6,23.6,y,x,?,?,,得,?,81.2,81,y,?,?,,所以可预测该班一名数学成,绩是,96,分的学生的物理成绩为,81,分,思考:该班学生的数学成绩为,96,分时,其物理成绩一定,是,81,分吗?,?,?,?,?,?,?,?,1,2,2,1,1,249,0.93,178,404,n,i,i,i,n,n,i,i,i,i,x,x,y,y,r,x,x,y,y,?,?,?,?,?,?,?,?,?,?,?,?,?,?,二、讲授新课,残差分析,1,线性回归模型与随机误差,2,(,),0,(,),0,y,bx,a,e,E,e,D,e,?,?,?,?,?,?,?,?,?,?,称为,线性回归模型,,其中,e,是,y,与,bx,a,?,之间的,误差,,通常,e,为,随机变量,,称为,随机误差,,在回归模型中,,x,称为,解释变量,,,y,称为,预报变量,用线性回归模型近似真实模型,(真实模型是客观存在的,通常我们并不知道真实,模型是什么),所引起的误差,例如可能存在非线性的函数能更好地描述,y,与,x,的关系,,但现在却用线性函数来表述,结果会产生误差;,忽略了其它因素对变量,y,的影响,例如在描述身高和体重的关系的模型中,体重不,仅受身高的影响,还会受遗传因素、饮食习惯、成长环境等其它因素的影响,它们,的影响都体现在随机误差中;,观测误差,例如测量工具或测量技术等原因,导致,y,的观测值产生误差,产生随机误差的主要因素:,对于样本点(,x,1,,,y,1,),,,(,x,2,,,y,2,),,,(,x,n,,,y,n,),,它们的随机误差,?,?,?,?,(,),1,2,i,i,i,i,i,e,y,y,y,bx,a,i,n,?,?,?,?,?,?,?,,,?,i,e,称为相应于点,?,?,i,i,x,y,的,残差,.,我们把,2,2,2,1,1,1,?,?,?,?,(,),(,(,),n,n,n,i,i,i,i,i,i,i,i,e,y,y,y,bx,a,?,?,?,?,?,?,?,?,?,?,?,叫做,残差平方和,.,2,残差分析,(1),残差,残差,=,真实值预报值;,残差平方和越小,回归方程的拟合效果越好,编号,1,2,3,4,5,6,7,8,身高,/cm,165,165,157,170,175,165,155,170,体重,/kg,48,57,50,54,64,61,43,58,残差,_,-6.373,2.627,2.419,-4.618,1.137,6.627,-2.883,0.382,?,e,女大学生身高体重原始数据和相应的残差数据表,2,残差分析,(2),残差表:,计算样本点对应的残差,可列出残差表,?,0.849,85.712,y,x,?,?,如:女大学生的身高的回归方程为:,(3),残差图:,可利用图形来分析残差特性作图时以,纵坐标为残差,,,横坐标为样本的编号,,也可用其他测量值,以编号为横坐标的残差图,-8,-6,-4,-2,0,2,4,6,8,0,1,2,3,4,5,6,7,8,9,10,编号,残差,2,残差分析,初步判断回归方程的拟合,效果如残差比较,均匀,地落,在水平的,带状区域,中,说明,选用的模型比较合适,带状,区域宽度越窄,,,模型拟合效,果越好,回归方程的预报精,度越高;,可以通过残差图发现原始,数据中的,可疑数据,残差图的作用:,(4),利用相关指数,R,2,来刻画回归的效果,?,?,?,?,2,2,1,1,?,1,n,i,i,i,n,i,i,y,y,R,y,y,?,?,?,?,?,?,?,?,2,残差分析,残差平方和,总偏差平方和,R,2,越大,,表示残差平方和,越小,,即模型的拟合效果,越好,,,R,2,越小,,表示残差平方和,越大,,即模型的拟,合效果,越差,,即,R,2,越接近于,1,,表示回归的效果越好,;,在,含有一个解释变量的线性回归,模型中,恰好有,R,2,等于,r,2,;,在线性回归模型中,,R,2,表示解释变量对于预报变量的贡献率,如,R,2,=0.64,,,说明解释变量对预报变量,的贡献率为,64%,,即解释变量解释了,64%,的预报变量的变化,或者说预报变量的差异有,64%,是由解释,变量引起的,而随机误差则解释了,36%,的预报变量的变化,也就是预报变量另外,36%,的差异是由随机,误差引起的;,如果某组数据可能采取几种不同回归方程进行回归分析,则可以通过比较,R,2,的值来做出选择,,即选取,R,2,较大的模型作为这组数据的模型,贡献率,R,2,贡献率,1,R,2,例、,一只红铃虫的产卵数,y,和温度,x,有关现收集了,7,组观测数据列于表中:,试建立产卵数,y,与温度,x,之间的回归方程;并预测温度为,28,o,C,时的产卵数目,温度,x,o,C,21,23,25,27,29,32,35,产卵数,y,/,个,7,11,21,24,66,115,325,3,非线性回归模型,0,50,100,150,200,250,300,350,20,22,24,26,28,30,32,34,36,温度,产,卵,数,解:作散点图:,从散点图中可以看出产卵数和,温度之间的关系并不能用线性,回归模型来很好地近似这些,散点更像是集中在一条指数曲,线或二次曲线的附近,选变量,解:选取气温为解释变量,x,,产卵数,为预报变量,y,画散点图,假设线性回归方程为,:,?=bx+a,选,模,型,分析和预测,当,x,=28,时,,y=,19.87,28-,463.73 93,估计参数,由计算器得:线性回归方程为,y,=,19.87,x,-463.73,相关指数,R,2,=,r,2,0.864,2,=0.7464,所以,可,预测温度为,28,o,C,时产卵数目为,93,个,0,50,100,150,200,250,300,350,0,3,6,9,12,15,18,21,24,27,30,33,36,39,当,x,=28,时,,y,=,19.87,28-,463.73 93,方,法,一,:,一,次,函,数,模,型,3,非线性回归模型,思考:,x,=29,时,,y,=66,,,9366?,模型好不好?,问题,2,如何求,c,1,、,c,2,?,y=c,1,x,2,+c,2,变换,y=c,1,t+c,2,非线性关系,线性关系,问题,3,令,t,=x,2,问题,选用,y,=,c,1,x,2,+,c,2,,还是,y,=,c,1,x,2,+,cx,+,c,2,?,-200,-100,0,100,200,300,400,-40,-30,-20,-10,0,10,20,30,40,产卵数,气,温,方,法,二,:,二,次,函,数,模,型,3,非线性回归模型,解:,平方变换:,令,t=x,2,,产卵数,y,和温度,x,之间二次函数模型,y=bx,2,+a,就转化为,产卵数,y,和温度的平方,t,之间线性回归模型,y=bt+a,温度,21,23,25,27,29,32,35,温度的平方,t,441,529,625,729,841,1024,1225,产卵数,y,/,个,7,11,21,24,66,115,325,作散点图,并由计算器算得:,y,和,t,之间的线性回归方程为,y=,0.367,t,202.543,,,将,t=x,2,代入线性回归方程得:,y=,0.367,x,2,-202.54,,,当,x,=28,时,,,y,=0.367,28,2,202.54,85,,,且相关指数,R,2,=0.802,,,所以,可预测温度,为,28,o,C,时产卵数目为,85,个,产卵数y/个,0,50,100,150,200,250,300,350,0,150,300,450,600,750,900,1050,1200,1350,t,3,非线性回归模型,0.7464,问题,变换,y=bx+a,非线性关系,线性关系,2,1,c,x,y,c,e,?,问题,如何选取指数函数的底,?,产卵数,-50,0,50,100,150,200,250,300,350,400,450,-10,-5,0,5,10,15,20,25,30,35,40,气,温,两边取对数,方,法,三,:,指,数,函,数,模,型,3,非线性回归模型,温度,x,o,C,21,23,25,27,29,32,35,z=lgy,0.85,1.04,1.32,1.38,1.82,2.06,2.51,产卵数,y,/,个,7,11,21,24,66,115,325,0,0.4,0.8,1.2,1.6,2,2.4,2.8,0,3,6,9,12,15,18,21,24,27,30,33,36,39,x,z,当,x,=28,时,,y,44,,所以,可预测温度为,28,o,C,时,产卵数目为,44,个,由计算器算得:,z,关于,x,的线性回归方程为:,z,=0.272,x,-3.849,,所以有,且相关指数,R,2,0.98,,,0.272,3.849,x,y,e,?,?,解:对数变换:在,中两边取自然对数得:,令,,,则,就转,换为,z=bx+a,4,4,3,3,3,4,4,3,ln,ln(,),ln,ln,ln,ln,ln,c,x,c,x,y,c,e,c,e,c,c,x,e,c,x,c,?,?,?,?,?,?,?,4,3,c,x,y,c,e,?,3,4,ln,ln,z,y,a,c,b,c,?,?,?,4,3,c,x,y,c,e,?,3,非线性回归模型,0.802,函数模型,相关指数,R,2,线性回归模型,0.7464,二次函数模型,0.802,指数函数模型,0.98,(,1,),由上表显而易见,,,指数函数模型最好!,思考:最好的模,型是哪个,?,-100,0,100,200,300,400,0,5,10,15,20,25,30,35,40,产,卵,数,线性模型,-200,-100,0,100,200,300,400,-40,-30,-20,-10,0,10,20,30,40,产卵数,气,温,二次函数模型,-50,0,50,100,150,200,250,300,350,400,450,-10,-5,0,5,10,15,20,25,30,35,40,产卵数,气,温,指数函数模型,3,非线性回归模型,x,21,23,25,27,29,32,35,y,7,11,21,24,66,115,325,0.557,-0.101,1.875,-8.950,9.230,-13.381,34.675,47.696,19.400,-5.832,-41.000,-40.104,-58.265,77.968,故指数函数模型的拟合效果比二次函数的模拟效果好,.,3,非线性回归模型,(1),0.272,3.849,(2),2,?,?,0.367,202.543.,x,y,e,y,x,?,?,?,?,(,2,)另外由计算可得:,则回归方程的残差计算公式分别为:,(1),(1),0.272,3.849,(2),(2),2,?,?,1,2,.,7;,?,?,0.367,202.543,1,2,.,7.,x,i,i,i,i,i,i,i,i,e,y,y,y,e,i,e,y,y,y,x,i,?,?,?,?,?,?,?,?,?,?,?,?,(1),?,e,(2),?,e,计算可得残差表:,(1),(2),?,?,1550.538,15448.431,Q,Q,?,?,?,计算可得残差平方和为:,总结:,1,、比较两个模型拟合效果的方法,?,?,?,?,?,?,?,?,?,?,1,2,?,?,1,?,?,?,?,;,y,f,x,a,y,g,x,b,a,b,a,b,?,?,分别建立对应于两个模型的回归方程,与,其中,和,分别是参数,和,的估计值,?,?,2,2,1,2,2,;,R,R,分别计算两个模型的残差平方和或相关指数,和,(,3,)比较两个模型的残差平方和或相关指数大小,残差平方和越小或,相关指数,R,2,越大的模型拟合效果越好,.,3,非线性回归模型,注:画出残差图,通过观察残差图是否有异常(如个别数据对应的残差,过大、残差呈现不随机的规律、残差不是落在水平的带状区域等),也,可以初步判断数据是否有误或模型是否合适,总结:,2,、非线性回归问题的处理方法,(2),求回归方程的步骤:,确定研究对象:明确哪个变量是解释变量,x,,哪个变量是预报变量,y,;,根据原始数据,(,x,y,),画出散点图;,根据散点图,选择恰当的拟合函数;,求线性回归方程(若是非线性回归模型,作,恰当的变换,将其转化成线性函数,);,在的基础上通过相应的变换,即可得非线性回归方程,3,非线性回归模型,(1),两个变量不呈线性相关关系,不能直接利用线性回归方程建立两个变量的关系,,可以通过,变换的方法转化为线性回归模型,(1),二次函数型:,2,y,bx,a,?,?,,,可令,2,t,x,?,,,原方程可化为,y,bt,a,?,?,;,(2),指数型函数:,bx,y,ae,?,,可以两边同时取以,e,的对数,,可得,ln,ln,y,bx,a,?,?,,再令,ln,z,y,?,,,ln,a,a,?,?,,,原方程可化为,z,bx,a,?,?,?,;,(3),反比例函数,:,b,y,a,x,?,?,可令,1,t,x,?,原方程可化为,y,a,bt,?,?,;,3,非线性回归模型,总结:,3,、非线性相关问题中常见的几种线性变换,三、应用举例,例,1,、有下列数据:,x,1,2,3,y,3,5.99,12.01,下列四个函数中,模拟效果最好的是,A,1,3,2,x,y,?,?,?,B,2,log,y,x,?,C,3,y,x,?,D,2,y,x,?,A,【解析】将,1,2,3,x,?,分别代入四个函数中,易得选项,A,中函数对应的残差平方和,3,2,1,?,(,),i,i,i,y,y,?,?,?,最小,所以正确答案为,A,三、应用举例,【解析】由残差的定义可得:,?,?,?,?,1,(,1,),4,(,2,),b,a,b,a,?,?,?,?,?,?,?,,解得:,?,3,b,?,例,3,、设某产品的广告费用,x,(万元)与销售额,y,(万元)具有线性相关关系,根据一组,样本数据,(,)(,1,2,),i,i,x,y,i,n,?,L,,用最小二乘法建立的回归方程为,?,9.4,9.1,y,x,?,?,,则下列,说法:,相关系数,0,r,?,;,若该产品的广告费用增加,1,万元,,则销售额约增加,9.4,万元;,若该产品的广告费用为,6,万元时,则其销售额为,65.5,万元;,若由该组样本数据计算出,的相关系数,0.8,r,?,,则说明该产品的销售额的差异有,20%,是由随机误差引起的,其中正确的个数为(,),A,1,B,2,C,3,D,4,3,B,例,2,、已知一系列样本点,(,)(,1,2,),i,i,x,y,i,n,?,L,的线性回归方程为,?,?,?,y,bx,a,?,?,,若样本点,(1,1),与,(2,4),的残差相同,则,?,b,?,三、应用举例,例,4,、,(,2015,19,)某公司为确定下一年度投入某种产品的宣传费,需,了解年宣传费,x,(单位:千元)对年销售量,y,(单位:,t,)和年利润,z,(单位:千元)的影响,对近,8,年的年宣传费,i,x,和年销售量,i,y,(,i,=1,,,2,,,,,8,)数据作了初步处理,得到下面的散点图及一些统计量的值,x,y,w,8,2,1,(,),i,i,x,x,?,?,?,8,2,1,(,),i,i,w,w,?,?,?,8,1,(,)(,),i,i,i,x,x,y,y,?,?,?,?,8,1,(,)(,),i,i,i,w,w,y,y,?,?,?,?,46.6,563,6.8,289.8,1.6,1469,108.8,表中,i,i,w,x,?,,,w,=,1,8,8,1,i,i,w,?,?,(,1,),根据散点图判断,,y,a,bx,?,?,与,y,c,d,x,?,?,哪一个适宜作为年销售量,y,关于年宣传费,x,的回归方程类,型?(给出判断即可,不必说明理由),(,2,)根据(,1,)的判断结果及表中数据,建立,y,关于,x,的回归方程;,(,3,)已知这种产品的年利率,z,与,x,、,y,的关系为,0.2,z,y,x,?,?,根据(,2,)的结果回答下列问题:,()年宣传费,x,=49,时,年销售量及年利润的预报值是多少?,()年宣传费,x,为何值时,年利率的预报值最大?,三、应用举例,【解析】,(,1,)由散点图可以判断,,y,c,d,x,?,?,适宜作为年销售量,y,关于年宣传费,x,的回归方程类型,(,2,)令,w,x,?,,先建立,y,关于,w,的线性回归方程,由于:,?,?,?,?,?,8,1,8,2,1,108.8,?,68,1.6,i,i,i,i,i,w,w,y,y,d,w,w,?,?,?,?,?,?,?,?,?,?,,,?,?,563,68,6.8,100.6,c,y,dw,?,?,?,?,?,?,,,所以,y,关于,w,的回归方程为,?,100.6,68,y,w,?,?,,因此,y,关于,x,的回归方程为,?,100.6,68,.,y,x,?,?,(,3,),(,i,)由(,2,)知,当,49,x,?,时,年销售量,y,的预报值,?,100.6,68,49=576.6,y,?,?,,年利润,z,的预报值,?,576.6,0.2,49,66.32.,z,?,?,?,?,(,ii,)根据(,2,)的结果知,年利润,z,的预报值,?,0.2(100.6,68,),13.6,20.12.,z,x,x,x,x,?,?,?,?,?,?,?,所以当,13.6,6.8,2,x,?,?,,即,46.24,x,?,时,,?,z,取得最大值,故年宣传费为,46.24,千元时,年利润的预报值最大,回归分析的基本思想知识结构图,问题背景分析,线性回归模型,两个变量线性相关,最小二乘法,两个变量非线性相关,非线性回归模型,残差分析,散点图,应用,2,R,转化,