线性回归方程课件.ppt
线性回归方程,2022年11月30日星期三,问题提出,1.函数是研究两个变量之间的依存关系的一种数量形式.对于两个变量,如果当一个变量的取值一定时,另一个变量的取值被惟一确定,则这两个变量之间的关系就是一个函数关系.,2.在中学校园里,有这样一种说法:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着某种关系,我们把数学成绩和物理成绩看成是两个变量,那么这两个变量之间的关系是函数关系吗?,3.我们不能通过一个人的数学成绩是多少就准确地断定其物理成绩能达到多少,学习兴趣、学习时间、教学水平等,也是影响物理成绩的一些因素,但这两个变量是有一定关系的,它们之间是一种不确定性的关系.类似于这样的两个变量之间的关系,有必要从理论上作些探讨,如果能通过数学成绩对物理成绩进行合理估计,将有着非常重要的现实意义.,知识探究(一):变量之间的相关关系,思考1:考察下列问题中两个变量之间的关系:(1)商品销售收入与广告支出经费;(2)粮食产量与施肥量;(3)人体内的脂肪含量与年龄. 这些问题中两个变量之间的关系是函数关系吗?,思考2:“名师出高徒”可以解释为教师的水平越高,学生的水平就越高,那么学生的学业成绩与教师的教学水平之间的关系是函数关系吗?你能举出类似的描述生活中两个变量之间的这种关系的成语吗?,思考3:上述两个变量之间的关系是一种非确定性关系,称之为相关关系,那么相关关系的含义如何?,自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系.,1、球的体积和球的半径具有( ) A 函数关系 B 相关关系 C 不确定关系 D 无任何关系,2、下列两个变量之间的关系不是 函数关系的是 ( ) A 角的度数和正弦值 B 速度一定时,距离和时间的关系 C 正方体的棱长和体积 D 日照时间和水稻的亩产量,A,D,练:,知识探究(二):散点图,【问题】在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据:,其中各年龄对应的脂肪数据是这个年龄人群脂肪含量的样本平均数.,思考1:对某一个人来说,他的体内脂肪含量不一定随年龄增长而增加或减少,但是如果把很多个体放在一起,就可能表现出一定的规律性.观察上表中的数据,大体上看,随着年龄的增加,人体脂肪含量怎样变化?,思考2:为了确定年龄和人体脂肪含量之间的更明确的关系,我们需要对数据进行分析,通过作图可以对两个变量之间的关系有一个直观的印象.以x轴表示年龄,y轴表示脂肪含量,你能在直角坐标系中描出样本数据对应的图形吗?,思考3:上图叫做散点图,你能描述一下散点图的含义吗?,在平面直角坐标系中,表示具有相关关系的两个变量的一组数据图形,称为散点图.,思考4:观察散点图的大致趋势,人的年龄的与人体脂肪含量具有什么相关关系?,思考5:在上面的散点图中,这些点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.一般地,如果两个变量成正相关,那么这两个变量的变化趋势如何?,思考6:如果两个变量成负相关,从整体上看这两个变量的变化趋势如何?其散点图有什么特点?,一个变量随另一个变量的变大而变小,散点图中的点散布在从左上角到右下角的区域.,一般情况下两个变量之间的相关关系成正相关或负相关,类似于函数的单调性.,知识探究(一):回归直线,思考1:一组样本数据的平均数是样本数据的中心,那么散点图中样本点的中心如何确定?它一定是散点图中的点吗?,思考2:在各种各样的散点图中,有些散点图中的点是杂乱分布的,有些散点图中的点的分布有一定的规律性,年龄和人体脂肪含量的样本数据的散点图中的点的分布有什么特点?,这些点大致分布在一条直线附近.,思考3:如果散点图中的点的分布,从整体上看大致在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做回归直线.对具有线性相关关系的两个变量,其回归直线一定通过样本点的中心吗?,思考4:对一组具有线性相关关系的样本数据,你认为其回归直线是一条还是几条?,思考5:在样本数据的散点图中,能否用直尺准确画出回归直线?借助计算机怎样画出回归直线?,知识探究(二):回归方程,在直角坐标系中,任何一条直线都有相应的方程,回归直线的方程称为回归方程.对一组具有线性相关关系的样本数据,如果能够求出它的回归方程,那么我们就可以比较具体、清楚地了解两个相关变量的内在联系,并根据回归方程对总体进行估计.,思考1:回归直线与散点图中各点的位置应具有怎样的关系?,整体上最接近,思考2:对于求回归直线方程,你有哪些想法?,可以用 或 , 其中 .,思考3:对一组具有线性相关关系的样本数据:(x1,y1),(x2,y2),(xn,yn),设其回归方程为 可以用哪些数量关系来刻画各样本点与回归直线的接近程度?,思考4:为了从整体上反映n个样本数据与回归直线的接近程度,你认为选用哪个数量关系来刻画比较合适?,思考5:根据有关数学原理分析,当 时,总体偏差 为最小,这样就得到了回归方程,这种求回归方程的方法叫做最小二乘法.回归方程中,a,b的几何意义分别是什么?,思考6:利用计算器或计算机可求得年龄和人体脂肪含量的样本数据的回归方程为 ,由此我们可以根据一个人个年龄预测其体内脂肪含量的百分比的回归值.若某人37岁,则其体内脂肪含量的百分比约为多少?,20.9%,某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对照表:,如果某天的气温是-50C,你能根据这些数据预测这天小卖部卖出热茶的杯数吗?,实例探究,为了了解热茶销量与气温的大致关系,我们以横坐标x表示气温,纵坐标y表示热茶销量,建立直角坐标系.将表中数据构成的6个数对表示的点在坐标系内标出,得到下图。,你发现这些点有什么规律?,今后我们称这样的图为散点图(scatterplot).,建构数学,所以,我们用类似于估计平均数时的思想,考虑离差的平方和,把a看作常数,那么Q是关于b的二次函数,当 Q取最小值,同理把b看作常数,那么Q是关于a的二次函数,当 Q取最小值,解得,当x=-5时,热茶销量约为66杯,线性回归方程:一般地,设有n个观察数据如下:,当a,b使,仿照前面的算法,可得线性回归方程 的回归系数a,b为,2.三点(3,10),(7,20),(11,24)的线性回归方程是 ( ),D,11.69,二、求线性回归方程,例2:观察两相关变量得如下表:,求两变量间的回归方程,解1:,列表:,计算得:,小结:求线性回归直线方程的步骤:第一步:列表 ;第二步:计算 ;第三步:代入公式计算b,a的值;第四步:写出直线方程。,阅读课本P73例1,EXCEL作散点图,利用线性回归方程解题步骤:,1、先画出所给数据对应的散点图;,2、观察散点,如果在一条直线附近,则说明所给量具有线性相关关系,3、根据公式求出线性回归方程,并解决其他问题。,()如果x=3,e=1,分别求两个模型中y的值;,()分别说明以上两个模型是确定性模型还是随机模型,模型:y=6+4x;模型:y=6+4x+e.,解 (1)模型:y=6+4x=6+43=18;,模型:y=6+4x+e=6+43+1=19.,(2)模型中相同的x值一定得到相同的y值.所以是确定性模型;模型中相同的x值,因 不同,且 为误差项是随机的,所以模型2是随机性模型.,C,线性相关与线性回归方程,45,写在最后,成功的基础在于好的学习习惯The foundation of success lies in good habits,谢谢聆听 学习就是为了达到一定目的而努力去干, 是为一个目标去战胜各种困难的过程,这个过程会充满压力、痛苦和挫折,Learning Is To Achieve A Certain Goal And Work Hard, Is A Process To Overcome Various Difficulties For A Goal,