《JMP常用工具整理.ppt》由会员分享,可在线阅读,更多相关《JMP常用工具整理.ppt(66页珍藏版)》请在三一办公上搜索。
1、开启档案 相位差.jmp分别利用前三栏位的资料制作 Normal Plot 哪一组趋近于正态?再分别制作直方图(Histogram)这其中透露了什么?,练习,认识数据的分布,认识数据的分布,柏拉图展示的是根据出现频率进行排序后的数据类别,例如:返工的原因。,柏拉图,JMP里的柏拉图,练习,请打开QUALITY CONTROL.jmp,里面的Flows是瑕疵的类型,右侧记录了瑕疵“发生的时刻”。这组数据没有直接提供瑕疵计数。所以要用“X分组”来区隔。,基准(可调),JMP里的柏拉图,练习,JMP会以第一个“发生时刻”值的瑕疵多少排列顺序作为不同时刻分隔的基准,并可自行调整。于是,可以观察各种瑕疵
2、在不同“作业时刻”的具体数量分布。,打开文件 SPC-X.jmp,看I-MR单值 移动全距图,控制图看的就是“异常点”,因I-MR数据基于正态分布,所以“移动极差”只有超限点,控制图看的就是“异常点”,打开文件 SPC-X.jmp,看X-Bar 分组均值范围图若无GROUP列,则在此输入组内个数,X-Bar 分组均值范围图,X-Bar 分组均值范围图,练习,打开P-CHART.jmp,反映了一段时间内被检验产品的不良数,其中分母不尽一致。当然,若分母一致,可自行输入样本常数。,流程能力diag1.jmp 数据包含以下特征:数据正态5个一组的SPC基本正常Max=85.752,Min=56.74
3、9若将LSL=57、USL=80以及LSL=57、USL=86分别输入看流程能力,分析,分组若非连续采集(比如每周4算一组等),可在上方“分组依据”里选类似Subgroup(此时Subgroup算属性)。,JMP缺省显示长期能力,尽管显示出的是Cpk,分析,若需单独显示传统意义上的短期能力,则需点选最下方的分组大小(缺省5个一组)。此时,前面的Cpk变成了真正的Ppk,流程能力分析,数据Camshaft.mtw(Minitab 工作表),凸轮轴由机床削切数据在第3列(Supp2)规格是 600 5凸轮轴生产的子群大小为1流程能力如何?,流程能力分析步骤,SPC稳定性检查,对异常点作出处理。正态
4、检定。如果数据非正态,需做拟合转换。执行流程能力分析。,所以,建议JMP先从“分析分布”开始逐步推进分析。,JMP里的“Z基准”反映出流程的西格玛水平,注意,这里的长短期有1.5的水平位移。看来,是按照MOTOROLA的观点去表现的。,特性不清楚的分布利用BOX-COX转换,转换成正态分布案例分析:打开文件BOX-COX.JMP,其中的D3数据,规格为LSL=0.06,USL=0.15,请计算流程能力。,非正态数据的流程能力计算,非正态数据的流程能力计算,选项/信息屏 用JMP,打开 连续性MSA.jmp,JMP输出,属性R&R利用JMP,打开:“属性MSA.jmp”,分析质量和过程变异性/计
5、数量具(多元控制图),必须每个测量员1列,上方图示反映每个样本的测量一致性。此处每个操作员自身的一致性算法与MINITAB不同。重点解释下方的Kappa值(算法同MINITAB),属性R&R利用JMP,属性R&R利用JMP,2228=78.5714%,JMP里不管Z检验还是t检验,只看“均值检验”,分析输出,e)比较P值和重要水平:P-value=0.798,=0.05所以我们不能否定零假设。数据不能提供足够的证据否定平均强度等于2.85磅。,我们首先使用Shapiro-Wilk W检验评估正态分布。统计 基本统计量 正态性检验,正态检验,值0.68060.05,服从正态。,单样本 T:Thi
6、ckness mu=3 与 3 的检验 平均值变量 N 平均值 标准差 标准误 95%置信区间 T PThickness 18 3.00294 0.00310 0.00073(3.00140,3.00448)4.04 0.001,P值,d)计算P值:分析 分布 均值检验,e)因为p=0.001 0.05,我们否定零假设。f)数据提供了足够的证据证明平均厚度不等于3厘米。,收集数据和计算P数值,JMP分析前必须先做数据表的堆叠转换,c.)随机抽取样本,双样本t,d.)JMP计算P值针对已“堆叠”好的新数据表:分析 以X拟合Y 勾选“假定等方差”,首先按“不等方差”做等方差检验。正态看F检验,非正
7、态看Levene检验,从它们各自的p值是否大于0.05,确定是否“等方差”。如果“等方差”,则按“均值/方差分析/合并的t”;若“不等方差”,则“t检验”。,P=0.1830.05,均值相等,JMP输出,利用软件检验两个相关的样本是否相等,两个相关的样本必须是随机抽取的每个抽样总体都应该大致呈正态分布,统计 基本统计量 配对 t,成对t检验,练习,一轮胎公司认为他们新生产的轮胎的里程数较竞争者的有提高。选择了12部车,用新轮胎跑1000哩,再用竞争者的轮胎跑1000哩。假定里程的差异服从正态分布。,File:Car Mileage.jmp,结论是什么?如果我们将数据作双样本t检验会如何?试试单
8、样本 t 检验其中的差异。,练习,3水平以上一元方差分析路径图,或直接看“Welch检验”,思考,练习,打开三人快递.jmp,因为数据没有进行堆栈,先运行“表堆叠”。接着再针对堆叠表,进入“分析以X拟合Y”;或“分析拟合模型”(可看残差)。,首先通过JMP的“分布”栏做各组数据的SPC稳定性研究与正态检定。进入“分析以X拟合Y”。接着还是做等方差检验(“不等方差”),步骤同前面的“双样本检验”。如果“等方差”,则看“均值/方差分析”;pF”即p值。,JMP的3水平以上一元ANOVA,R2=0.507,1,2,一元ANOVA的数据分析(“分析以X拟合Y”),pF”即p值。,1,一元ANOVA的数
9、据分析(“分析拟合模型”),首先通过“分布”做各组数据的SPC稳定性研究与正态检定。如果各组数据都是等方差,也可以直接运行JMP的“分析拟合模型”,同样可得判定各组数据是否“相等”的p值和因子显著性的R方值。,1,2,在有些实验中,我们发现当改变其他因子的不同水平时,一个因子的水平的主效果有所改变。在这种情况下因子间具有交互作用。两条直线不平行表示存在交互作用。,交互作用,思考,讨论,论社会贡献,“品质”和“智商”有无交互作用?在质量检查工作,性格沉稳与否和注意力之间是否存在交互作用?收入水平和奖励水平之间呢?,多元ANOVA分析,目的:提供分析具有显著交互作用的2因子实验的机会 切换到工作表
10、 Montint.jmp输出变量:Yield(望大)输入变量:Temperature温度(Low,Med,High)Catalyst Solution催化剂浓度(Low,Med,High),JMP的多元方差分析依然是“分析拟合模型”,且“特质”依旧“标准最小二乘法”。JMP的多元方差分析不区分“平衡ANOVA”和“一般线性模型GLM”。将所有因子作“完全析因”,以观察所有交互影响。,多元ANOVA分析,看“效应检验”,2因子交互影响的p=0.029 Catalyst Temp*Catalyst。各因子对Y较有利的适宜水平分别是?,多元ANOVA分析路径,在Minitab中,可通过以下两种方法得
11、到一般线性回归模型(最佳拟合线):,统计 回归 回归,统计 回归 拟合线图,最小平方的方法,R2=87.7%,P数值是对回归等式的整体显著性的测量,P-value=0.000,P-value 0.05表示在统计上回归关系显著,回归关系所表达的Y的变异的87.7%在统计上是显著的。,整体显著性,残差分析,若回归“模型”的p值小于0.05,说明回归公式成立,于是必须检查残差,通过“残差”图来进一步判别模式的适配。“残差”是数学模型的误差,也是随机误差的总和。残差值=实际值(个别样本值)拟合值(水平均值)残差是独立的,且正态分布。残差理想,则残差的和=0。,从文件Oxygen purity.jmp中
12、,建立Oxygen purity 对Hydrocarbon%(X)之间的一般线性回归模式并进行残差分析。,残差分析,点选“二元拟合线性拟合”的“标绘残差”,随时间随机,正态性,正态且均值为0,随机,JMP的残差图表,看拟合直线两侧 的点是否对称,判断正态与否。非正态则一边数 据多,说明流程 噪音大。,观察时序。若图形不随机,说明或许存在与“时间”相关的因子在影响着Y。,发现“预测值-残差”图有特殊形态,可点“二元拟合”里的“特殊拟合”。,JMP的残差图表,随机,希望散点对称、无特殊 形态地散布。从而反映 出残差的方差为一恒定 的常数。否则,分析数据背后有 否异常?流程的噪音干 扰大吗?是否有将
13、不同 组的数据混放?为求恒方差,则需对数 据进行转换处理:曲线型升阶;喇叭型用对数转换;椭圆型用Freeman-Tukey转换。,从文件Oxygen purity.jmp中,测定对于已获得的线性回归模型的95%置信区间CI和预测区间PI。,拟合置信曲线=CI(深绿色带)单值置信曲线=PI(浅绿色带),置信区间和预测区间,运行“分析拟合模型”。选择“刻画器”,最下方会出现“预测刻画器”。将红线十字坐标自由移动,可见按回归公式下Y随着X变化而出现拟合值(红字),下面括弧内是该拟合值的置信区间,及CI。双击红字X,出现输入框,输入给定X=1.15,Y=91.473,CI(90.947,91.999)
14、。,给定X的置信区间CI,给定X的预测区间PI,选择“保存列预测公式”和“保存列单值置信限公式”,在数据表里会增加三列数据。,在数据表里增加1列在最后,双击X空格,填入给定X=1.15,边上会出现Y拟合值=91.473,以及PI预测区间(89.130,93.815),比CI(90.947,91.999)要宽。,打开Reactor 32 Runs.jmp,该例可同时作为DOE分析和历史数据的多元回归分析。,对于百分比数值的Y,如果其分母相同,可只针对分子做连续性回归分析。若分母不同,可在“特质”里选“广义线性模型”直接分析即可。如果数据量不大,且凭专业经验断定不存在3次以上交叉,可直接选“析因次
15、数”(阶数在下方可输入,缺省2阶)。但“完全析因”下的R-Sq肯定=1。需要手写输入的多阶交互因子可选中相应几个因子后按“交叉”添加。,多元回归分析,出现Lenth PSE,无论是多元回归分析还是在DOE分析里都需要模式缩减。直至出现“拟合汇总”里的“均方根误差”为止。,多元回归分析,在“预测刻画器”的“设置意愿”设置完成,必须再执行“最大化意愿”才能出现目标Y下的因子预测值。从“模拟器”可仿真观察最终实现的可能波动范围,自然越窄越好。,多元回归分析下的因子预测,JMP用“以X拟合Y”做逻辑回归。请注意检查每个X和Y的属性。JMP数据表里的Y“审核出错”的基准时间缺省是以第一个Y值为准,如果要
16、像JMP那样缺省以1作为基准事件,则需对Y列右键点选“列信息”里的“列属性”里的“值排序”,将右框里的“1”上移即可。,JMP里的逻辑回归,P值,说明模型整体显著成立。,P值,说明模型的截距和系数都存在。,“单位优势比”决定了因子的显著程度。,JMP里的逻辑回归,二进制 Logistic 回归:审核出错 与 审核时间 连结函数:Logit响应信息变量 值 计数Outcome 1 73(事件)0 151 合计 224Logistic 回归表 95%置信区间自变量 系数 系数标准误 Z P 优势比 下限 上限常量-18.3997 2.53593-7.26 0.000审核时间 0.140326 0.
17、0197355 7.11 0.000 1.15 1.11 1.2对数似然=-97.802检验所有斜率是否为零:G=87.187,DF=1,P 值=0.000拟合优度检验方法 卡方 自由度 PPearson 180.119 162 0.157偏差 151.923 162 0.704Hosmer-Lemeshow 8.451 8 0.391配对 数字 百分比 度量结果综述一致 9387 85.2 Somer 的 D 0.71不一致 1600 14.5 Goodman-Kruskal Gamma 0.71结 36 0.3 Kendall 的 Tau-a 0.31合计 11023 100.0,函式里的
18、常量、系数至少有一个存在。,逻辑回归看的就是某X对 的线性关系。称为让步比(Odd)or优势比。是某事件的发生概率与不发生概率的比值。这里的分子是所谓“基准事件”(此处是“失败,1”的概率)。优势比1.15意味着随着”审核时间“每增加1个单位,“失败”概率反而比“成功”概率高15%。,让“优势比”来说话,也许我们想要确定在什么样审核时间水平下,“订单审核”有50%成功概率?可以用前面的公式来计算算出 T50 我们发现:,用函式来控制质量成本的投入,点选“Logistic拟合”里的“逆预测”,可以根据Y的基准事件目标概率,来推算适宜的X值,同时提供了相应X的置信区间。,用函式(逆预测)来控制质量
19、成本的投入,可能的异常值,异常值说明改观测值与模型拟合得并不好,或预测模型不适合该数据。应做分析溯源,以判定是否是真的异常?,异常点分析,该表显示某一“审核时间”下针对“基准事件”(所谓事件概率1,这里应是“失败”)的概率。比如第1行,Time=99.273时,失败的概率仅仅1.1%,实际输出也是“成功”的0。又如第17行,Time=104时,失败的概率理应仅2.2%,但实际输出却是“失败”的1。这也是为什么“Delta Beta与概率”诊断图称其为异常点的原因。*号表明和上一行相同。,异常点分析,BB收集了历史上448次项目投标的结果数据“成功”或 0“失败”或 1输入变量为:X1:报价,连
20、续型X2:材料的种类 内部资深=1(缺省水平,此处为数字型)外请专家=2分析 逻辑回归 工作表或逻辑回归-投标.jmp 并呈示结果。JMP里请先在数据表里对属性X作右键的“列属性值排序”处理,此处X2“材料”将内部资深-1设定为缺省基准水平。,练习,根据p值是否写出逻辑回归函式,写出公式:lnp/(1-p)=-21.2+0.0155报价-1.127Material(1-内部专家)如有2种以上的“材料”,会有相对“基础事件”p(“失败”)的另一函式。参考因子(Material)水平:1,即“内部资深”,这个是可调的。,P值,说明模型整体显著成立。,P值,说明模型的截距和系数都存在。,多元逻辑回归
21、不用“以X拟合Y”,而是用“拟合模型”。JMP的属性X基准事件以数据包第一个字符为准(此处是1-内部资深)“报价”的优势比估计系数不为零,但优势比非常接近一(1.02),这就表示在“材料”恒定下,“报价”的增加对于竞标成功与否的影响非常小“报价”每增加1个单位,基准事件1(失败)的概率才提升1.56%(1.0156-1)。在“报价”恒定下,“外请专家2”发生基础事件(1,失败)的概率是“内部资深”的9.53倍。“逆预测”里,当基准事件1(失败)目标概率设定为10%时,在“材料”为基准水平1(内部资深)的情况下,适宜“报价”应为1295.505,且给出置信区间。,根据优势比看各因子显著性及其对Y的影响趋势,在“刻画器”里,可以双击输入某固定值或拉动红色十字线改变连续型变量“报价”,来观察“基准事件-1”的发生概率。“报价”输入1500元,基准事件“1-失败”的概率达到73%。“报价”输入1300元,基准事件“1-失败”的概率只有10%。而问题在于,“报价”在1500的时候,内外专家的失败概率差异要明显小于1300报价的时候。从中提示我们在是否聘请外部专家时,有个适宜的报价区间。这从散点图中可以看到。,根据预测刻画器看因子显著性的边界效应,
链接地址:https://www.31ppt.com/p-5436332.html