《工程资料分析-EDA.ppt》由会员分享,可在线阅读,更多相关《工程资料分析-EDA.ppt(57页珍藏版)》请在三一办公上搜索。
1、工程数据分析 Engineer Data Analysis,2,成语教学,【管窥蠡测】,2,东汉班固汉书东方朔传“以管窥天,以蠡测海,以莛撞钟,岂能通其条贯,考其文理,发其音声哉。”(莛:ting草茎),管:竹管。蠡:贝壳做的瓢。原意是竹管里看天,用瓢测量海水。引申意思是比喻对事情的观察了解很狭隘很片面。,3,你是否经常听到这样的话,有没有什么办法可以让你的推论更加准确呢?,给定一组片面的信息或数据,统计学可以摘要并描述这份数据,观察者并以此份数据推论母体。,【统计学的定义】,课程大纲,4,基础统计学假设检定变异数分析(ANOVA)简单回归分析,基础统计学的模型,母体:具有共同特征之个体所组成
2、的群体。样本:由母体中抽取之部分个体所组成的小群体。参数:用来描述母体的特征值。统计量:由样本计算得出的特征值。,5,南京广播中心报道:近日,南京市抽样调查了5000位市民的体重状况,得知目前南京市民中有60%的体重高于标准水平。且超重主要发生在50岁以上人群。,基础统计学,6,误差,减少误差第一要务:抽样要够随机!,基础统计学(统计量符号),7,抽样方法,三种估计的方法,三种估计的方法,数据收集(练习),8,常用统计量EXCEL操作,9,1.工具数据分析描述统计,2.EXCEL中,Var.的操作为 VAR()S 的操作为 STDEV()的操作为 AVERAGE()的操作为 QUARTILE(
3、,2)Mo的操作为MODE(),10,通过统计学的计算,我们可能得到1.第一组人均身高是2.第三组身高的标准差是3.某机种12月白班的平均良率是4.新人的XX周XX周每小时平均产出是,这时,我们需要了解数据母体的分布状态,需要进行对比才能了解真实的状况,课程大纲,11,基础统计学假设检定变异数分析(ANOVA)简单回归分析,改善的漏斗,12,八大步骤+品管工具SPC 统计制程管制发现问题,运用品管工具加以分析找出要因。,EDA 工程数据分析将要因以客观的统计手法加以验证其真实性。,DOE 田口实验设计以实验手法设定要因的水平,找出最佳化组合。,假设检定(目的),13,假设检定,提供一个以统计理
4、论做为基础的证据!,1.请 5 位帅哥、5 位美女上台,2.大声地报出自己的身高,3.以直觉或经验看看男女之间的身高是否有差异?,4.如何证明两者之间的差距?,假设检定(流程),14,1.建立虚无假设及对立假设。(单尾检定或双尾检定),2.设定显著水准,亦即决定型一误差。,3.选择合适的检定统计量。,4.计算检定统计量。,5.以P-value或显著值判定拒绝或接受。,假设,检定,建立假设,15,统计假设是将可能的状况划分为二个互斥的集合,而构成二个互斥的假设。H0:虚无假设 H1:对立假设检定的种类单尾检定:右尾检定:假设群体母数可能变大的检定。左尾检定:假设群体母数可能变小的检定。双尾检定:
5、假设群体母数可能变大或变小的检定。,双尾检定 右尾检定 左尾检定H0:5 H0:5 H0:5H1:5 H1:5 H1:5,设定显著水准,16,显著水准,表示的是发生型一误差的机率即:虚无假设是正确的,但判为拒绝。相对应的,表示的是发生型二误差的机率即:虚无假设是错误的,但判为接受。,显著水准,17,临界值,临界值,决定了此分配的临界值,是“接受”或“拒绝”H0假设之判断基准值的大小无一定的标准,一般采用=5%值越小,表示错杀的机率越小重要的判断 值应设越小(=1%),P-value 检定法,18,临界值(Critical Value),接受域,拒绝域,P-Value 拒绝H0,P-Value
6、不拒绝H0(亦即接受),检定的结果,19,反之则表示拒绝H0,表即示判定H0可能错误。,如右图所示,当计算出结果P-value时,接受H0,即表示无充分证据显示H0错误。,P-value,检定的应用-T检定,20,例1:某圈组的改善主题为提高生产力,怀疑新人作业时间长可能是真因,于是测量数据如右表。(已知:标准人均产能为12),结论:计算得出平均值为10.8,与标准人均产能相差不大,故新人效率低不是生产力低的影响因素。,检定的应用-T检定,21,Ho:A=12 v.s H1:A 12=0.05,P-value 拒绝H0 新人人均产能不等于标准人均产能,由样本计算而得,假设,检定,检定的应用-T
7、检定,22,例2:某厂计划提高机台产出,怀疑不同机台间可能存在差异于是选了A、B两个机台分别测量几个时段的产量,记录如右表,A机台平均值:100B机台平均值:105,结论:B机台产量比A机台多5,而且整体数据均比A大。所以B机台产出高于A机台。,检定的应用-T检定,23,假设,检定,H0:A=B v.s H1:AB=0.05,由样本计算而得,P-value 不拒绝H0无充分证据说明AB机台有差异,24,接下来,给大家5秒时间仔细看看刚刚的画面,25,假设,检定,H0:A=B v.s H1:AB=0.05,由于计算公式有很大的差别,所以在选用时需要借助其它的工具!,P-value 不拒绝H0无充
8、分证据说明AB机台有差异,找出不同的地方,检定的应用-F检定,26,例3:某设备厂商声称新款机台的稳定性要远远优于老款机台,分别对各自生产的10个产品某一特性(规格中心1.35)进行测量,结果如右表。,从数据上判断,如果是你,会选择买新款的机台么?,检定的应用-F检定,27,假设,检定,H0:新=老 v.s H1:新 老=0.05,P-value 不拒绝H0 无充分证据说明新老机台有差异,两母体平均数检定,28,1.双样本等方差假设,2.双样本异方差假设,T检定,F检定,双样本方差检定,不相等,相等,学员实作(15%),29,Ho:A B v.s H1:A=B=0.05,结论:由于1.430.
9、05,所以新老人没有差异,找出左边案例的错误,学员实作(15%),30,Ho:v.s H1:=P-Value=,结论:会打球的果然比较高 其实没差别,请 5 位有打篮球、5 位没打篮球的男生上台大声地报出自己的身高刻板的印象告诉我们,篮球员身高应该比较高请使用假设检定提供有力的证据!,T检定-成对双样本,31,T检定中较为特殊的一种。使用条件:检定单一母体成对样本平均数的变化(例:同一母体改善前后的差异),T检定-成对双样本,32,例4:某一药剂研究所进了一项降压药的实验,先记录12位大专性学生的初始血压,然后在服用此药个月后,再测其血压。根据观察结果,得出右表的资:,你觉得这种降压药有效吗?
10、,T检定-成对双样本,33,假设,检定,H0:前=后 v.s H1:前后=0.05,由样本计算而得,P-value 拒绝H0 服药前后血压有差异。,学员实作(15%),34,结论:有差异 无差异,Ho:前=后 v.s H1:前后=0.05,统计检定方法分类,35,检定平均数,两组相关样本,两组独立样本,检定变异数,一组样本,不相等,相等,未知,已知,未知,已知,t test,Z test,双样本同方差T,双样本异方差T,F test,2test,Z test,检定平均数,检定变异数,成对双样本T,课程大纲,36,基础统计学假设检定变异数分析(ANOVA)简单回归分析,变异数分析(ANOVA),
11、37,通过前面的学习,假设检定可以判别两母体之间的平均数和变异数是有否差异。当母体为三个或者更多的时候?,变异数分析(Analysis of Variance),变异数分析 用来分析一个因子不同水准之间是否存在差异,以及两因素子中哪个对于特性起显著影响。,用检定的方法,两两检定,变异数分析,38,例5:已知有A、B、C三种机台,计划分析它们之间的每小时产量是否存在差异,分别对其5个时段的产量进行记录。如下表,此例题中,因子是机台;水准是A、B、C三种;实验次数是5次。,单因子变异数分析,39,假设:H0:A=B=C H1:i不全相等(i=1k)=0.05,使用软件:Excel工具资料分析 单因
12、子变异数分析,单因子变异数分析,40,假设:H0:1=2=K=H1:i不全相等(i=1k)=0.05k:水准数。因子为机台,水平有A、B、C三种机台,则 k=3。n:实验次数。各水平进行5次实验,共15次实验,则 n=15。,公式,学员实作(20%),哪一组的男生比较强壮?请各组指派三位猛男!,41,俯地挺身(限时10秒),变异数分析,42,例6:已知有A、B、C三种机台,五位作业员。分别对每个作业员在每个机台上作业的产量作记录,如下,此例题中,因子是机台、作业员;水准是机台是三种,作业员五种;实验次数是1次。,二因子变异数分析,43,B因子之假设H0:1=2=3=4=5H1:Bj不全等(j=
13、1r)=0.05,A因子之假设H0:A=B=C H1:Ai不全等(i=1k)=0.05,二因子变异数分析,44,B因子之假设H0:B1=B2=Br=H1:Bj不全等(j=1r)=0.05,A因子之假设H0:A1=A2=Ak=H1:Ai不全等(i=1k)=0.05,公式,二因子变异数分析重复试验,45,请思考,有没有可能某人在某个机台上就发挥的好?即,人员与机台间可能有交互作用?,此时,实验次数为2次,二因子变异数分析重复试验,46,P-value 不拒绝H0 无交互作用产生,B因子之假设H0:1=2=3=4=5H1:Bj不全等(j=1r)=0.05,A因子之假设H0:A=B=C H1:Ai不全
14、等(i=1k)=0.05,交互作用之假设H0:()ij=0(i=1k)H1:()ij不全为0(j=1r)=0.05,二因子变异数分析重复试验,47,A因子之假设H0:A1=A2=Ak=H1:Ai不全等(i=1k)=0.05,B因子之假设H0:B1=B2=Br=H1:Bj不全等(j=1r)=0.05,交互作用之假设H0:()ij=0(i=1k)H1:()ij不全为0(j=1r)=0.05,公式,变异数分析注意事项,48,误差项变异过大,P-Value无任何因子显著,1.规划实验时,需考虑交互作用之影响。2.无任何因子显著时,误差项变异会过大,表示影响实验结果之主要原因未被考虑到,需重新检讨。,变
15、异数分析注意事项(续),49,异常值需挑出,3.变异数分析前需分析组内之数据是否存有异常值。,4.变异数分析后可探讨何种水平具有较佳结果。5.信心水平之选择,建议采 5%或 1%,统计上的含意代表显著与非常显著。,课程大纲,50,基础统计学假设检定变异数分析(ANOVA)简单回归分析,QC7 图,51,可看出温度与落尘量的相关性,举手抢答加5分,QC7散布图(相关系数),52,可得上述案例之相关系数为 r=0.88,QC7散布图(相关性),53,r=0.88 其呈现之关系为正相关,负相关,请列举出身边你认为相关的例子。如:地势越高,气压越低。,54,散布图与回归分析,55,散布图可观察其相关性。回归分析可藉由计算两变量之线性关系求出回归方程式,并据此方程式推估未进行实验之值。,回归方程式,56,由Excel报表可得回归方程式:y=x+依据此方程式可进行最佳解的预测。代入X(温度)可预测Y(落尘量),相关系数,回归方程式(回归线检定),57,P-value 拒绝H0温度可以解释落尘量,用于检定此模型是否显着。H0:温度无法解释落尘量H1:温度可以解释落尘量,用于检定、是否为零。H0:=0 v.s H1:0H0:=0 v.s H1:0,P-value 拒绝H0不为零,P-value 拒绝H0不为零,
链接地址:https://www.31ppt.com/p-5971513.html