《回归分析专题》PPT课件.ppt
《《回归分析专题》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《回归分析专题》PPT课件.ppt(30页珍藏版)》请在三一办公上搜索。
1、单变量回归,目的:介绍作为实证模型建立方法的回归分析,以模拟具有连续响应变量“Y”的过程。(定义:实证基于观测值或事实),目标:确定何时使用回归,以及为什么使用。理解使用回归方法构建一个连续“X”变量与连续“Y”响应变量的关系模型。在Minitab中应用回归方法,根据数据拟合一条直线。在给定X的情况下,用拟合的直线方程式预测“Y”。了解确定模型是否为所给定数据的最佳模型的数学方法。说明并理解确定模型是否为所给定数据的最佳模型的图形方法。,单变量回归,1、什么是回归?描述“Y”与“X”关系的数学方法 创建工序的“模型”。Y=b0+b1x+e 其中:b0为Y截距b1为直线斜率e为模型的误差项2、为
2、何要使用回归?寻找潜在的关键少数“X”预测“Y”优化“Y”确定如何设置“X”以优化“Y”3、何时使用回归?筛选被动数据(历史或基准数据),以找到潜在的关键“X”危险!不要使用被动数据得出最终结论。还要继续进行DOE(试验设计)记住被动数据是历史数据;这种关系当前可能并不存在。分析DOE(试验设计)的结果,回归是一种必须谨慎使用的强有力的工具。,回归寻找“Y”与“X”关系的方法,单变量回归,我们可能对独立变量(X)和响应变量之间的关系感兴趣。表示它们之间关系的散点图可能如下所示:,假定真正的关系为:线性关系存在“b0”(常数)和“b1”(系数)为固定、但未知的参数“X”为独立变量“Y”为观测的响
3、应值“e”为误差。常见的误差假设有:平均值为0.0不相关正态分布误差不存在型式的分布,Y,i,Y=bo+b1*X+ei i,收集数据 以估测方程的最佳方法是什么?,“b0”和“b1”的估测值是多少?,这是否是正确的函数形式(直线)?,关系是否具有统计显著性(不是偶然出现)?,误差“ei”有多大?,与拟合方程相关的问题有:,要使估计的斜率误差最小,将观测值的1/2置于“X”的下限,将其它1/2置于上限,并使独立变量在广范围内取值。这适用于Y值高度变化、独立变量的范围较小、而且它们之间的关系预期为直线的情形。,要确定关系的形式(是直线还是曲线?),采用两级以上的独立变量。如果数据高度变化,常常采用
4、3个级别。,最好是以随机顺序收集数据,而不要以低值的“X”开始然后逐渐递增 另一个随时间变化的可能影响工序。,收集数据,在Minitab中打开新工作表,并在C1和C2中输入以下数据:,举例:您在尽力优化油漆烤箱的性能。一种理论称鼓风机风扇速度影响油漆中溶剂的蒸发。您在尽力通过下列数据证明这种关系的存在。,Minitab的单变量回归,看上去是线性!,1)始终首先将数据制图,GraphPlot,单击“OK”运行,2)运行数据的回归分析,自变量,单击 Graphs,单击 Storage,StatRegressionRegression.,(参见下页的子对话框),并,此对话框用于生成残差(误差)图采用
5、这些图形检验您的模型中有关误差的假设单击此框,指明您想看的图形,单击 OK,然后单击对话框中的 Storage 按钮,单击 Fits 和 Residuals,以在数据窗口存储信息,点击 OK 两次,“X”变量的p值-速度 Ho:斜率=0 Ha:斜率=0或者,另一种表达方式:Ho:“X”不显著 Ha:“X”显著,会话窗口包含分析结果.,接受Ha,无法拒绝Ho,常数的p-值H0:直线通过原点(0,0)(0速度=0蒸发)Ha:直线不通过原点(0,0),(“Ctrl-M”移至会话窗口,s:残差(误差)的标准差。残差为观测值预测值。换句话说,指观测点至回归方程式中描述的拟合线的距离。(对于优秀的模型,此
6、值应较小)s=MS(error)1/2R-Sq:由拟合线“解释”的总变差的百分数。由“X”解释的变差。(对于优秀的模型,此值应较大)R-Sq(adj):对过于拟合情况(方程式中的变量过多)的调整,它将包括模型中的项数与观测值的个数进行对比其中 n=观测值数量 p=模型中项数,包括常数,R2越大,模型对工序模拟得越好,对于良好的模型,该值应接近R2值,该值越小(误差的大小),模型越好,通过查看R-Sq,R-Sq(adj),s和p值来评估模型,SSregression:由模型中的“X”而解释的响应变量“Y”的变差。每一X值对应的模型预测值和Y的总平均值之差的平方和。SSerror:未被解释的“Y”
7、的变差。每个数据点的Y观测值和该数据点Y的预测值之差的平方和。SStotal:Y值相对其平均值的总变差。,误差项相对总数应很小,p-值应 0.05,以表示统计显著性(良好拟合的方程式),回归项(的SS 和 MS)应比误差项的(SS 和 MS)大,FITS指“Y”的预测值,即根据回归方程式计算出的与“X”值相对应的Y值。C3=0.069+0.00383 C1(会话窗口中的回归方程式)或者响应变量的预测值=0.069+0.00383(速度)残差为误差。残差的出现说明模型显示的数据有误差。(每个点的实际响应变量Y值减去其预测值(拟合值)。因此:,数据窗口将出现两个新栏“FITS1”and RESI1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归分析专题 回归 分析 专题 PPT 课件
链接地址:https://www.31ppt.com/p-5483120.html