多元模型回归与分析.ppt
《多元模型回归与分析.ppt》由会员分享,可在线阅读,更多相关《多元模型回归与分析.ppt(56页珍藏版)》请在三一办公上搜索。
1、多元数据模型回归与分析,2,一、实验数据分析,由实验数据回归模型,得到模型参数前,对数据自变量间的线性相关性进行检验,是发现回归模型应用的可靠性和准确性受限制的有效方法。因自变量间的线性相关性,使得无法区分它们对因变量的作用;回归模型参数时会遇到几乎是奇异的数据矩阵,这样的模型参数有很大的不确定性(95的参数置信度范围宽)。例:回归二氧化硫的催化氧化速率方程:,装有载铂氧化铝催化剂颗粒的微分固定床反应器中,测定二氧化硫的催化氧化速率。总压为790 mmHg时,记录流体相的组成分压,有下表所示的速率结果,通过这些数据求取二氧化硫的催化氧化速率方程。,3,二氧化硫的催化氧化速率,表82 二氧化硫的
2、催化氧化速率,4,两种模型的非线性回归,1、一般的指数速率方程形式,(8.2.1),k=0.517113.3;a=-1.987.02;b=-0.2164.556;c=6.078124.7,拟合结果:,参数的95置信度太宽,模型参数不可靠。,2、根据原子氧的吸附机理,得到的速率方程式(Smith,Chemical Engineering Kinetics,3rd Ed.,1981,McGraw-Hill,P.374),(8.2.2),K=73,为反应平衡常数A=0.10170.0958;B=16.024.33,拟合结果:,与方程(8.2.1)相比,方程参数的置信度有了显著改善。,5,对速率方程的
3、进一步分析,如果把方程(8.2.2)改写为:,(8.2.3),将模型参数代入计算并以方程左边为横坐标、右边为纵坐标作图。,结果并不是斜率为-1的直线。说明表所给的速率数据没有足够的信息来表明速率方程中的逆反应贡献。,如将SO3分压对O2分压作图,这两分压间有近似线性关系。所以方程()的置信区间范围大。,6,二、回归模型的选择(1),例:水饱和蒸汽压的模型回归 水的蒸汽压数据选用的温度范围为0120,三参数的Antoine方程:,四参数的Riedel回归方程:,五参数回归方程(参考Thek-Stiel的蒸汽压预测方程提出):,(8.2.4),(8.2.5),(8.2.6),7,水饱和蒸汽压的模型
4、回归结果,表8-3 水饱和蒸汽压的方程拟合结果,拟合度十分接近1,表明拟合是成功的,但实际上用Antoine方程来拟合回归得到的结果不理想,说明仅从拟合度上来判断结果的好坏是不够的。为什么呢?,8,因变量与残差关系图,残差定义:,(8.2.7),考察模型参数估计方法的两个基本假设:参数估计的误差相互不相关联,是随机的。估计误差符合正态分布。,检查模型适合体系数据程度的最有效方法之一是对因变量与残差作图,观察其分布情况。,9,Antoine方程拟合的残差,残差虽然很小,但其分布不是随机的。,残差的分布同正态分布相比,有较大的差距。,两方面的结果充分说明了拟合回归的Antoine方程还不能充分反映
5、蒸汽压与温度间的关系,造成残差间存在关联。采用Riedel方程拟合得到的也是类似的结果。,10,改进Thek-Stiel方程方程的拟合结果,拟合误差比Antoine方程小了近一个数量级,而且残差分布是随机分布的。,误差分布基本符合正态分布。,改进Thek-Stiel方程方程描述水饱和蒸汽压的合适模型。,11,二、回归模型的选择(2),前面说明了模型参数较少时会出现拟合残差的分布不是随机的,而是呈现某种分布,相互关联。在模型回归拟合数据的过程中,如模型参数过多会出现什么情况?如何判断回归拟合模型中有过多的参数呢?,12,丙烷在氢型丝光沸石上的吸附平衡,例:选用不同吸附方程拟合丙烷在氢型丝光沸石体
6、系303K的吸附平衡数据。目标:说明如何对模型拟合结果进行统计分析,确定模型拟合的好坏、模型参数的可靠性和准确性,从而进行拟合模型的选择。,表8-4 303K时丙烷在氢型丝光沸石上的吸附平衡数据,13,具有代表性的、也是适用性较广的模型,1、Lanmuir(L)双参数方程:,2、Freundlich(F)双参数方程:,(8.2.8),3、BET双参数方程:,4、Langmuir-Freundlich(LF)三参数方程:,5、三参数方程:,6、Toth三参数方程:,7、扩展的LF方程(五参数):,8、(14)式的特殊形式(四参数):,(8.2.9),(8.2.10),1),2),3),4),5)
7、,14,各模型的计算结果,表85 吸附等温线关联的参数值、方差和回归系数,从表中可看出,方程(814)拟合方差逐渐减少,回归系数更接近1(方程(12)是通过压力数据来拟合的,故拟合方差和其它方程的结果不是在同一数量级上)。由方程(14)的五参数形式改进的方程(15)式获得的结果最好,实验数据点几乎完全落在方程(15)式的曲线上(见下图)。,15,方程(13)和方程(15)的拟合结果,方程(15)式获得的结果最好,实验数据点几乎完全落在方程(15)式的曲线上。,16,判断模型参数是否过少的依据,通过对方程(13)和五参数方程(15)的残差进行分析,方程(13)因参数过少,吸附量的计算误差与实验吸
8、附量之间存在着某种分布。方程(15)计算误差在零的两边是随机分布的,看不出规律性。因此,拟合计算误差有无规律性的分布是判断模型参数是否过少的依据。,因此,拟合计算误差有无规律性的分布是判断模型参数是否过少的依据。,方程(13)的拟合误差,方程(15)的拟合误差,17,判断模型参数是否过多的依据,在方程(14)的计算结果中,有些参数95%的置信度较大,说明这些参数之间有联系,不是独立的。而对于方程(14)的五参数形式,即方程(15),其所有参数的95%置信度都较小。事实上,方程(15)就是据此分析对吸附平衡理论作进一步研究而获得的。,因此,拟合参数95%的置信度是否较大是判断模型参数是否过多的依
9、据。,18,回归模型的选择总结,模型参数较少时会出现拟合残差的分布不是随机的,而是呈现某种分布,相互关联。残差的分布偏离正态分布较远。模型参数过多会出现某些参数95%的置信度较大,说明这些参数之间有联系,不是独立的。,19,习题,研究二硫化碳饱和蒸汽压的模型回归问题。(P266,Ex8.3),二硫化碳的基本性质:临界温度为273.05 临界压力为72.87 atm。,20,Statistica的非线性估计,非线性估计方法User-Specified Regression,least square,可以计算95%置信区间,21,“least square”与“Custom Loss”比较,“le
10、ast square”计算结果(采用Levenberg-Marquardt方法),“Custom Loss”计算结果(采用Quasi-Newton法)Matrix ill conditioned;cannot compute standard errors.,EConf,22,“Custom Loss”的方差分析与迭代步骤,“Custom Loss”无迭代历史纪录,协方差分析结果已出现病态。,Covariance matrix cannot be computed.,23,Statistica非线性估计的残差分析,残差分布情况,残差对预测值作图,24,对方程(15)的残差分析,Histogra
11、m of residuals,Residual vs.Predicted,25,误差正态分布图,“least square”计算的误差正态分布图,“Custom Loss”计算的误差正态分布图,Antoine 方程拟合结果,26,非线性函数的管理,27,三、MATLAB的拟合函数,多项式拟合函数polyfit非线性最小二乘法lsqnonlin()非线性最小二乘(优化问题)lsqcurvefit()非线性最小二乘曲线拟合nlinfit()前两种的简化版本nlparci()计算参数的置信区间nlpredci()计算预测值的置信区间nlintool()nlinfit()、nlparci()、nlpr
12、edci()的集成图形用户界面拟合函数注意:不同的拟合函数命令,其优化目标函数定义以及调用形式不同,注意区分!,28,(一)Polyfit的使用,p=polyfit(x0,y0,n)其中x0和y0分别为观察节点和观察值向量;n表示插值多项式的次数;输出值p表示插值多项式的系数。例:某实验中测得一组数据,其值如下:x l 2 3 4 5 y 1.3 1.8 2.2 2.9 3.5 已知x和y成线性关系,即y=kx+b,求系数k和b,x=1 2 3 4 5;y=1.3 1.8 2.2 2.9 3.5;p=polyfit(x,y,1)y1=polyval(p,x);plot(x,y1)hold on
13、;plot(x,y,b*);,p=0.55 0.69,也就是,k为0.55,b为0.69,29,(二)lsqcurvefit的使用,方程(目标函数)Find coefficients beta that best fit the equation,调用形式beta=lsqcurvefit(fun,beta0,xdata,ydata)beta=lsqcurvefit(fun,beta0,xdata,ydata,lb,ub)beta=lsqcurvefit(fun,beta0,xdata,ydata,lb,ub,options),xdata和ydata分别为观察节点和观察值向量;fun自定义的非线
14、性拟合模型;beta0拟合参数的初始值;beta拟合模型中的参数;lb,ub拟合参数初值的边界值,lb=beta=ub。,30,lsqcurvefit的使用(续),调用形式(续)beta,resnorm=lsqcurvefit(.)beta,resnorm,residual=lsqcurvefit(.)beta,resnorm,residual,exitflag=lsqcurvefit(.)beta,resnorm,residual,exitflag,output=lsqcurvefit(.)beta,resnorm,residual,exitflag,output,lambda=lsqcur
15、vefit(.)beta,resnorm,residual,exitflag,output,lambda,jacobian=lsqcurvefit(.),resnorm返回beta处的残差平方和,sum(fun(x,xdata)-ydata).2)residual返回解beta处的残差,fun(x,xdata)-ydata exitflag退出方式output返回优化信息的输出结果,iterations、funcCount、algorithm、stepsize等lambda解beta处的Lagrange乘子jacobian返回函数在解beta处的Jacobian矩阵,31,lsqcurvefi
16、t的拟合函数的定义,拟合函数的定义:,function F=myfun(beta,xdata)F=.%Compute function values at x,beta=lsqcurvefit(myfun,beta0,xdata,ydata),Note:(1)fun should return fun(x,xdata),and not the sum-of-squares sum(fun(x,xdata)-ydata).2).(2)The algorithm implicitly squares and sums fun(x,xdata)-ydata.,32,lsqcurvefit的拟合函数的
17、定义(续),If the Jacobian can also be computed by user-defined,function F,J=myfun(beta,xdata)F=.%objective function values at betaif nargout 1%two output arguments J=.%Jacobian of the function evaluated at betaend,options=optimset(Jacobian,on),For example,function F=myfun(beta,xdata)F=beta(1)*exp(beta(2
18、)*xdata);,33,lsqcurvefit应用示例,%Assume you determined xdata and ydata experimentallyxdata=0.9 1.5 13.8 19.8 24.1 28.2 35.2 60.3 74.6 81.3;ydata=455.2 428.6 124.1 67.3 43.2 28.1 13.1-0.4-1.3-1.5;beta0=100;-1%Starting guessbeta,resnorm=lsqcurvefit(myfun,beta0,xdata,ydata)function F=myfun(beta,xdata)F=be
19、ta(1)*exp(beta(2)*xdata);,beta=498.8309-0.1013 resnorm=9.5049,34,(三)lsqnonlin的使用,方程(目标函数)Find coefficients beta that best fit the equation,调用形式beta=lsqnonlin(fun,beta 0)beta=lsqnonlin(fun,beta 0,lb,ub)beta=lsqnonlin(fun,beta 0,lb,ub,options),fun自定义的优化函数;beta 0优化参数的初始值;beta拟合模型中的参数;lb,ub拟合参数初值的边界值,lb
20、=beta=ub。,35,lsqnonlin的使用(续),调用形式(续)x,resnorm=lsqnonlin(.)x,resnorm,residual=lsqnonlin(.)x,resnorm,residual,exitflag=lsqnonlin(.)x,resnorm,residual,exitflag,output=lsqnonlin(.)x,resnorm,residual,exitflag,output,lambda=lsqnonlin(.)x,resnorm,residual,exitflag,output,lambda,jacobian=lsqnonlin(.),resnor
21、m返回beta处的残差平方和,sum(fun(beta,xdata)-ydata).2)residual返回解beta处的残差,fun(beta,xdata)-ydataexitflag退出方式output返回优化信息的输出结果,iterations、funcCount、algorithm、stepsizelambda解beta处的Lagrange乘子jacobian返回函数在解beta处的Jacobian矩阵,36,lsqnonlin的用于拟合的目标函数定义,拟合函数的定义:,function F=myfun(beta,xdata,ydata)F=fitfun(beta,xdata)-yda
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 模型 回归 分析

链接地址:https://www.31ppt.com/p-6382267.html