《回归分析北师大版.ppt》由会员分享,可在线阅读,更多相关《回归分析北师大版.ppt(61页珍藏版)》请在三一办公上搜索。
1、3.1.1 回归分析,回归分析的基本思想及其初步应用,1、两个变量的关系,不相关,相关关系,函数关系,线性相关,非线性相关,问题1:现实生活中两个变量间的关系有哪些呢?,相关关系:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系。,回顾复习,思考:相关关系与函数关系有怎样的不同?,函数关系中的两个变量间是一种确定性关系相关关系是一种非确定性关系,函数关系是一种理想的关系模型 相关关系在现实生活中大量存在,是更一般的情况,问题2:对于线性相关的两个变量用什么方法来刻划之间的关系呢?,2、最小二乘估计,最小二乘估计下的线性回归方程:,ybx a,其中,,,ybx a
2、,最小二乘估计下的线性回归方程:,回归直线必过样本点的中心,3、解线性相关问题的基本步骤:,画散点图,求线性相关方程,预报、决策,例某医院用光电比色计检验尿汞时,得尿汞含量(毫克/升)与消光系数如下表:,(1)作散点图;(2)如果y与x之间具有线性相关关系,求线性回归方程,解:(1)散点图如图,1(2011辽宁高考)调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的线性回归方程:y0.254x0.321.由线性回归方程可知,家庭年收入每增加1万元,年饮食支出平均增加_万元解析:以x1代x,得y0.2
3、54(x1)0.321,与y0.254x0.321相减可得,年饮食支出平均增加0.254万元答案:0.254,2(2011江西高考)为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:,答案:C,1.2 相关系数,复习回顾,用线性回归方程进行回归分析:,(1)画散点图;,(2)求回归系数:,(3)写回归直线方程,并用方程进行预测说明.,任何数据,不管它们的线性相关关系如何,都可以用最小二乘法求出线性回归方程,为使建立的线性回归方程有意义,在利用最小二乘法求线性回归方程之前,先要对变量间的线性相关关系作个判断,通常可以作散点图。但在某些情况下,从散点图中不容易判断变量间的线性关系,
4、另外,如果数据量较大时,画散点图比较麻烦,此时我们有没有其他方法来刻画变量之间的线性相关关系呢?,新课探究,为解决这个问题,我们可通过计算线性相关系数r,来判断变量间相关程度的大小,计算公式为:,新课探究,的最小值为:,据前面的分析,回归系数 使得误差,由 知,即,则,新课探究,值越大,误差 越小,则变量的线性相关程度就越高;值越接近于0,越大,线性相关程度就越低。,当 时,两变量的值总体上呈现同时增加的趋势,则称两变量正相关;当 时,一变量增加,另一变量有减小的趋势,则称两变量负相关;当 时,则称两变量线性不相关。,相关系数r的性质,新课探究,相关系数,1.计算公式2相关系数的性质(1)|r
5、|1;(2)|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小问题:达到怎样程度,x、y线性相关呢?它们的相关程度怎样呢?,负相关,正相关,思考交流,对于课本P73给出的例题,变量的线性相关系数r如何求?,我们知道,相关系数的计算公式为:,要求r,只需求出相关的量:,由数据表,经过计算,可知(P77):,这能说明什么?,这说明肱骨 和股骨 有较强的线性相关程度。,计算下表变量的线性相关系数r。,并观察,通过计算可以发现什么?,由表可知:,你发现什么了?,r=0,则变量间并不存在线性相关关系。即此时建立线性回归方程是没有意义的。,实际上,从散点图上我们也可以验证这一点:,易看出,几个
6、样本点都落在同一个半圆上,而不是条状分布,此时建立线性回归方程无任何意义,这与相关系数r的计算结果相一致。,样本点的分布如何?,许多先进国家对驾驶员的培训,大多采用室内模拟教学和训练,而后再进行实地训练并考试,这种方法可以大大节约训练的费用。问题是这种方法有效吗?下表是12名学员的模拟驾驶成绩x与实际考试成绩y的记录(单位:分):,试问:两者的相关性如何?请画出散点图,并求出y与x间的线性相关系数.,动手做一做,解答:可求出r=0.9871,说明实际考试成绩y与模拟驾驶成绩x有较强的线性相关程度.,拓展思考,相关系数r越大,变量间的线性关系就越强,那么r的值究竟大到什么程度就认为线性关系较强?
7、,相关系数,正相关;负相关通常,r-1,-0.75负相关很强;r0.75,1正相关很强;r-0.75,-0.3负相关一般;r0.3,0.75正相关一般;r-0.25,0.25相关性较弱;,相关关系的测度(相关系数取值及其意义),r,小结,线性相关系数r:,,其中。,4对四对变量y和x进行线性相关检验,已知n是观测值组数,r是相关系数,且已知:n7,r0.953 3;n15,r0.301 2;n17,r0.499 1;n3,r0.995 0.则变量y和x线性相关程度最高的两组是()A和 B和C和 D和解析:相关系数r的绝对值越大,变量x,y的线性相关程度越高,故选B.答案:B,5某厂的生产原料耗
8、费x(单位:百万元)与销售额y(单位:百万元)之间有如下的对应关系:(),判断x与y之间是否存在线性相关关系,解:画出(x,y)的散点图,如图所示,由图可知x,y呈现线性相关关系,可线性化的回归分析,复习回顾,线性相关系数r及性质:,,其中。,1、下表是随机抽取的8对母女的身高数据,试根据这些数据探讨y与x之间的关系,母亲身高,女儿身高,练习,解:,,,,,,,,,所以:,所以可以认为,与,之间具有较强的线性相关,的,关系线性回归模型y=a+bx中,线性回归方程为,新课讲解,下表按年份给出了19812001年我国出口贸易量(亿美元)的数据,根据此表你能预测2008年我国的出口贸易量么?,从散点
9、图中观察,数据与直线的拟合性不好,若用直线来预测,误差将会很大。,而图像近似指数函数,呈现出非线性相关性。,分析:,考虑函数 来拟合数据的变化关系,将其转化成线性函数,两边取对数:,即线性回归方程,记1981年为x=1,1982年为x=2,变换后的数据如下表:,设,则上式变为,,对上表数据求线性回归方程得:即:,由此可得:,曲线如图:,这样一来,预测2008年的出口贸易量就容易多了。,将下列常见的非线性回归模型转化为线性回归模型。,作变换,得线形函数。,1.幂函数:,2.指数曲线:,作变换,得线形函数。,作怎样的变换,得到线形函数的方程如何?,思考交流,3.倒指数曲线:,4.对数曲线:,作怎样
10、的变换,得到线形函数的方程如何?,小结,非线性回归方程:,对某些特殊的非线性关系,可以通过变换,将非线性回归转化为线性回归,然后用线性回归的方法进行研究,最后再转换为非线性回归方程。,常见非线性回归模型:,1.幂函数:,2.指数曲线:,3.倒指数曲线:,4.对数曲线:,例3(12分)为了研究某种细菌随时间x变化繁殖个数y的变化,收集数据如下:,(1)作出这些数据的散点图;(2)求y与x之间的回归方程 思路点拨作出数据的散点图,选择合适的函数模型转化为线性模型,精解详析(1)散点图如图所示:,(4分),(2)由散点图看出样本点分布在一条指数函数yc1ec2x图像的周围,于是令zln y,则(6分
11、),由计算器算得z0.69x1.112,则有ye0.69x1.112.(12分),一点通非线性回归问题一般不给出经验公式,这时,应先画出已知数据的散点图,把它与所学过的各种函数图像作比较,挑选一种跟这些散点图拟合得最好的函数,采用适当的变量置换,把问题化为线性回归分析问题,使问题得以解决,6下列数据x,y符合哪一种函数模型(),解析:选项A中当x8,9,10时,函数值与所给数值偏差较大,不合题意;选项B中当x10时,y2e10,远远大于4.3,不合题意;选项C中的函数在(0,)上为减函数,不合题意故选D.答案:D,7在一次抽样调查中测得样本的5个样本点,数值如下表:,试建立y与x之间的回归方程,解:由数值表可作散点图如下,根据散点图可知y与x近似地呈反比例函数关系,,由置换后的数值表作散点图如下:,由散点图可以看出y与t呈近似的线性相关关系列表如下,1判断变量之间的线性相关关系,一般用散点图,但在作图中,由于存在误差,有时很难判断这些点是否分布在一条直线的附近,从而就很难判断两个变量之间是否具有线性相关关系,此时就必须利用线性相关系数来判断 2相关系数r可以定量地反映出变量间的相关程度,明确的给出有无必要建立两变量间的线性回归方程,
链接地址:https://www.31ppt.com/p-6451517.html