现代制造实验第3章.ppt
1,一、概述,回归分析是一种处理相关变量之间关系的一种数学方法。,变量之间关系:函数关系:一个变量与另一个变量确定关系。如:匀速位移与速度相关关系:一个变量与另一个变量有关,但不确定。如,少年的年龄与身高,第三章 线性回归,2,二、一元线性回归解决的问题,例如:在某表盘表面腐蚀刻线,试验中,腐蚀时间(x)与腐蚀深度(y)的关系如下表。,3,从表中得出:腐蚀深度随时间增加而加深,不是函数关系,是相关关系,作图如下:,4,要解决的问题:1)求变量x和y之间的回归直线方程(经验公式)2)判断变量x,y之间是否为线性相关关系;3)如何应用 根据一个变量的值,预测和控制另一变量的取值。,如已知少年的年龄,预测身高控制:已知y,求x,5,二、回归直线方程的确定,直线有无穷多,6,7,8,对Q求导,求最小值,求出a、b分别为,9,10,11,1、就回归方法而言,即使对于一组本身没有线性关系(如圆,双曲)线数据也能求出一条回归直线。只是没有实际意义。2、必须对所得到的方程进行判断 确定该回归方程有没有实际意义.是否与实验数据相符。即用一定的方法判断所关联的两个变量之间的相关程度究竟有多大。,三、回归方程判别两种方法:显著性检验 相关系数判别,12,1、显著性检验 判断变量x,y之间是否为线性相关关系,即用线性方程描述实验数据误差是否过大。,13,14,整个数据围绕总平均值上下波动(两部分组成:误差自变量导致因变量变化),应将整个试验点全部考察:,15,推导略,展开,有:,16,17,对于本例,18,19,20,2 相关系数判别法,21,22,1)r的大小表示两个变量之问的线性相关程度2)当 r=0,表示两个变量之间没有线性关系,称为线性无关,3)当 r=1,b1b2=1 即所有的观测点都落在回归线上,存在着完全线性相关的关系,4)0r1,时,两个变量之问存在着一定的线性相关,其中。r的绝对值越大,表示线性相关的程度越紧密。,23,24,25,26,27,1、预测对于任意给定的观测点x0,推断观察值y0落在什么地方。,四、预测与控制,28,根据统计学观测值落在:,29,30,31,10,20,30,40,50,70,60,80,90,10,20,50,60,40,30,X1,X2,2、控制,32,10,20,30,40,50,70,60,80,90,10,20,50,60,40,30,X1,X2,33,例如:在某表盘表面腐蚀刻线,试验中,腐蚀时间(x)与腐蚀深度(y)的关系如下表。,34,六、化非线性为线性,35,36,37,38,例:盛钢水的钢包,在使用中由于钢液及炉渣对包衬耐火材料的侵蚀,使其容积不断扩大,在生产中,积累了钢包的容积与使用输出次数的十三组数据,见下表,39,从图中可以看出可能为双曲线关系:,40,对试验数据作倒数变换,利用线性回归系数计算公式得:,41,42,一、多元线性回归 多元线性回归是研究变量y与多个变量x1、x2、.xp之间的相关关系的一种数学方法。,设一个指标跟p个因素有关,做N次实验,求指标和P个因素水平的相关关系式。第次试验数据是:,共N次试验数据满足下式,可用下面形式的方程表示,一、多元线性回归 多元线性回归是研究变量y与多个变量x1、x2、.xp之间的相关关系的一种数学方法。,设一个指标跟p个因素有关,做N次实验,求指标和P个因素水平的相关关系式。第次试验数据是:,共N次试验数据满足下式,可用下面形式的方程表示,45,实验数据安排,多元线性回归是研究变量y与多个变量x1、x2、.xp之间的相关关系的一种数学方法。,做N次试验,Np,有,做N次试验,Np,有,计算回归系数及建立多元线性回归方程步骤:设试验求变量y与多个变量x1、x2、.xp之间的相关关系,做N次试验(Np)。,要解决的问题:如何安排试验:矩阵A计算繁琐,如A的行列式为0,导致计算不能进行,原因:回归方程显著并不意味着每个白变量对变量y的影响都重要,从回归方程中剔除那些次要的可有可无的变量,重新建立起更为简单的回归方程,这就需要对每一个变量进行考查,如果某变量对y的作用不显著,那么在多元线性回归模型中它前面的系数就可取值为零。重新建立不包含该因子的多元回归方程。筛选出有显著影响的因子作为自变量,并建立“最优”回归方程。,研究任意一个变量xp方法:用余下的p-1变量对于做回归平方和,称为回归平方和,个因素,这个因素是所有不显著因素小厂值为最小的,然后更新建立回归方程,树对新的回归系数进行检验,直到余下的回归系数都显著为止。解决这个问题的根本设想是:在安排试验时就选择这样一些点做试验,使得回归系数之间不存在相关,即相关矩阵c为0矩阵,这时从回归方程小剔除任一个变量都不需要引起什么新的计算,,(1)确定因素变化范围,二、回归正交试验设计,一次回归正交试验是选用二水平的正交安排试验目的:使矩阵A成为对角矩阵,则逆存在,且计算简单,精度高(避免病态矩阵)。,在研究p个因素z1,z2,.zp,用z1j、z2j分别表示每个因素的上下限。Z1j为下水平,Z2j为下水平,Z0j为零水平,(2)编码(线性变换),(3)选择二水平正交表,将1、2改为1、1,(4)组织试验,例:车床上某种材料的车刀,其耐用度T与切削速度v(m/min)、走刀量s(mm/r)、切削速度t(mm)三个因素之间存在一定关系,据推导,它们之间由如下关系:,求多因素经验公式,解:两边取对数,则:,(1)确定水平区间,确定零水平,(2)对各因素的水平编码,切削速度v(m/min)x1,走刀量s(mm/r),切削速度t(mm),将计算结果添入下表:,(2)对各因素的水平编码,计算切削速度t(毫米)x1编码,将切削速度值带入下式,走刀量s(毫米/转)x2,切削深度t x3,试验水平变为下表:,(3)确定二水平正交表精度低,试验次数少,可选取L4(23)正交表,选用L8(27),列号,试验,L8(27)正交表(将1、2改为1、1),列号,试验,L8(27)正交表(将1、2改为1、1)任取三列,如1、2、4列安排因素,列号,试验,L8(27)正交表(去掉5、6、7列),每个因素占一列,常数项占一列,共四列。其中常数项列均为1,结合下表安排试验,则回归方程为,把下式代入,回归方程为:,小结:,多元回归的难点在与矩阵A的求逆,采用正交表进行回归的目的:提供正交表来选取合适的因素水平,并安装一定的安排,使矩阵A具有如下形式:,矩阵A的逆一定存在,且容易求解,92,实验数据安排,