《回归分析》课件.ppt
第4章 试验数据的回归分析,4.1 基本概念,(1)相互关系 确定性关系:变量之间存在着严格的函数关系相关关系:变量之间近似存在某种函数关系(2)回归分析(regression analysis)处理变量之间相关关系的统计方法确定回归方程:变量之间近似的函数关系式检验回归方程的显著性 试验结果预测,4.2 一元线性回归分析,4.2.1 一元线性回归方程的建立(1)最小二乘原理设有一组试验数据(如表),若x,y符合线性关系,计算值 与试验值yi不一定相等,与yi之间的偏差称为残差:,a,b回归系数(regressioncoefficient),回归值/拟合值,由xi代入回归方程计算出的y值。,一元线性回归方程:,残差平方和:,残差平方和最小时,回归方程与试验值的拟合程度最好,求残差平方和极小值:,正规方程组(normalequation):,解正规方程组:,简算法:,4.2.2 一元线性回归效果的检验,(1)相关系数检验法 相关系数(correlationcoefficient):描述变量x与y的线性相关程度定义式:,相关系数特点:,1r1r1:x与y有精确的线性关系,r0:x与y负线性相关(negative linear correlation)r0:x与y正线性相关(positivelinear correlation),r0时,x与y没有线性关系,但可能存在其它类型关系相关系数r越接近1,x与y的线性相关程度越高 试验次数越少,r越接近1,当,说明x与y之间存在显著的线性关系,对于给定的显著性水平,查相关系数临界值rmin,相关系数检验,(2)F检验,离差平方和 总离差平方和:,回归平方和(regressionsumofsquare):,残差平方和:,三者关系:,自由度,SST的自由度:dfTn1SSR的自由度:dfR1SSe的自由度:dfen2三者关系:dfT dfR dfe均方,F检验,F服从自由度为(1,n2)的F分布给定的显著性水平下,查得临界值:F(1,n2)若F F(1,n2),则认为x与y有明显的线性关系,所建立的线形回归方程有意义,方差分析表,4.3 多元线性回归分析,(1)多元线性回归形式试验指标(因变量)y与m个试验因素(自变量)xj(j=1,2,m)多元线性回归方程:,4.3.1 多元线性回归方程的建立,偏回归系数:,(2)回归系数的确定,根据最小二乘法原理:求偏差平方和最小时的回归系数偏差平方和:,根据:,得到正规方程组,正规方程组的解即为回归系数。,4.3.2 多元线性回归方程显著性检验,(1)F检验法 总平方和:,回归平方和:,残差平方和:,F服从自由度为(m,nm1)的分布 给定的显著性水平下,若FF(m,nm1),则y与x1,x2,xm间有显著的线性关系,方差分析表:,(2)相关系数检验法,复相关系数(multiple correlation coefficient)R:反映了一个变量y与多个变量(x1,x2,xm)之间线性相关程度 计算式:,R1时,y与变量x1,x2,xm之间存在严格的线性关系R0时,y与变量x1,x2,xm之间不存在线性相关关系 当0R1时,变量之间存在一定程度的线性相关关系 RRmin时,y与x1,x2,xm之间存在密切的线性关系,R一般取正值,0R1,4.3.3 因素主次的判断,(1)偏回归系数的标准化 设偏回归系数bj的标准化回归系数为Pj:,Pj越大,则对应的因素(xj)越重要,(2)偏回归系数的显著性检验,计算每个偏回归系数的偏回归平方和SSj:SSjbjLjy SSj的大小表示了因素xj对试验指标y影响程度,对应的自由度dfj1,服从自由度为(1,nm1)的F分布,如果若F F(1,nm1),则说明xj对y的影响是不显著的,这时可将它从回归方程中去掉,变成(m1)元线性方程,(3)偏回归系数的t检验,t值的计算:,单侧t分布表,检验:,如果,说明xj对y的影响显著,否则影响不显著,,4.4.1 一元非线性回归分析,通过线性变换,将其转化为一元线性回归问题:直角坐标中画出散点图;推测y与x之间的函数关系;线性变换;用线性回归方法求出线性回归方程;返回到原来的函数关系,得到要求的回归方程,4.4 非线性回归分析,4.4.2 一元多项式回归,任何复杂的一元连续函数都可用高阶多项式近似表达:,可以转化为多元线性方程:,4.4.3 多元非线性回归,如果试验指标y与多个试验因素xj之间存在非线性关系,如二次回归模型:,4.5 Excel在回归分析中的应用,4.5.1“规划求解”在回归分析中应用解方程组 最优化 4.5.2 Excel内置函数在回归分析中应用4.5.3 Excel图表功能在回归分析中的应用4.5.4 分析工具库在回归分析中应用,