精益六西格玛统计工具介绍假设检验ppt课件.ppt
《精益六西格玛统计工具介绍假设检验ppt课件.ppt》由会员分享,可在线阅读,更多相关《精益六西格玛统计工具介绍假设检验ppt课件.ppt(143页珍藏版)》请在三一办公上搜索。
1、六西格玛统计工具介绍(二),2014年2月,精益六西格玛理论体系全景图,客户,流程描述,控制计划,测量系统控制,过程能力分析,多变量分析,实验设计,VoC分析,失效模式分析,流程图(I/O),因果矩阵,统计过程控制,定性分析,定量分析,头脑风暴+KJ失效树鱼骨图Why-Why分析PFMEA对标分析访谈现场调研流程观察,回归分析,软件使用,项目管理,精益六西格玛意识,统计基础,精益工具,基本图表,精益六西格玛持续改进体系,精益六西格玛推行综合管理,课程大纲,假设检验概述相关与回归,统计基础-数据类型,计数型数据(离散型数据,属性型数据):通常表示事物的分类不良品数量/不良率缺陷品数量/缺陷率机器
2、 A, 机器 B, 机器 C白班/中班/夜班计量型数据 (连续型数据):通常是通过测量仪器测量得到的数据压力时间长度重量,目录,假设检验相关基础概念总体参数及样本统计量推定置信区间假设检验介绍目的与意义假设检验概念介绍假设检验原理假设检验步骤假设检验常见路径双样本T 与配对T的区别 讨论及问答,假设检验相关基础概念,总体参数与样本统计量,s,= 样本标准差,X,= 样本平均值,参数 估计 统计量,= 总体平均值,= 总体标准差,抽样(Sampling),A,A,B,D,D,D,C,C,C,C,B,标本,估计的概念,点估计:通过抽样用一个具体的值估计总体的参数举例:通过抽样调查中秋月饼的保质期是
3、3个月点估计的种类:平均的估计、标准差、方差的估计、比率的估计等区间估计:通过抽样用一个具体的值估计总体的参数举例:通过抽样调查中秋的月饼的保质期是1-6个月,置信区间,置信区间的概念(Confidence Interval)误差是,相同样本量的样本重复抽样测量样本中存在实际总体参数的可能性的区间,即100(1- )%置信水平(Confidence Level)是指区间估计时,能够包含总体参数的能力水平,即1- 。,置信区间,90%的置信区间举例如下图如下图总体平均为,连续抽取10个样本,其中有一个样本不包含总体平均95%置信区间的解释:大约100个置信区间中有95个会包含总体参数, 或者我们
4、有95%的把握确定总体参数在置信区间内通常我们计算95%的置信区间,置信区间,置信区间的计算通用公式:置信区间C.I.=统计量K*S(标准偏差)统计量=平均值、方差、Cp等K=统计分布常数正态分布的置信区间公式( 知道的时候):样本的置信区间公式(不知道,只能计算S):样本的平均遵循t分布,置信区间,Minitab中置信区间的计算,这些都可以计算出置信区间,假设检验,假设检验的目的假设检验是对差异较小的情形进行差异性比较,从而通过数据作出客观的判断。是为了解决选择的困难性假设检验的意义用统计的方法,通过数据进行客观的判断把我决策的风险,提高决策水准假设检验是我们政府部门最需要的工具之一。,假设
5、检验,假设检验的概念对观测的样本资料分析后对总体差异的估计是作出选择与否判断的统计性方法假设检验术语假设设定:对要进行判断的情况进行假设设定H0 -Null Hypothesis:说明没有变化或者差异的设定Ha- Alternative Hypothesis:说明有变化或者差异的设定假设设定练习:为了确认小学生男女身高是否有差异为了确认小学生男生比女生高为了确认小学生身高和性别是否有相关性,假设检验,假设检验的种类单边检验 One-sided hypothesis双边检验 Two-sided hypothesis,假设检验的两种错误第1种 错误 (TypeError, -风险)不顾Null H
6、ypothesis 真实. Null Hypothesis放弃的错误 把良品判断为不良的时候(误判) 既, 可以说生产者危险1- 就是置信区间 第2种 错误 ( TypeError, -风险) : 不顾Null Hypothesis 假的. Null Hypothesis接受的错误 不良品当成良品的时候( 漏失 ) 即, 可以说顾客危险1- 是检定力,即检出能力,假设检验的两种错误说明,假设检验的两种错误举例,陪审团的判决,他无罪,事实,实际清白,他有罪,实际有罪,正确,正确,清白的人进监狱,罪犯逍遥法外,I类错误 (-风险),II 类错误 (-风险),假设检验,假设检验原理假设检验其实是个比
7、较的过程两种假设的比较,是A还是B?我们总是用H0 来说话我们的初衷多数时候是想看区别和差异,所以我们总是想放弃H0 放弃H0 的决策不会总是正确的 ,任何决定都会有风险但风险的高低及严重度,会影响我们决策于是我们很急切的指导,我们做出放弃H0 的决策的风险有多大?于是我们通过抽样数据进行运算,算出放弃H0 的决策的风险的大小就是我们长见的 P值(P-value),假设检验,假设检验原理(续)知道了做出放弃H0 的决策的风险的大小,那么风险小于多少时我们才敢于做出放弃H0 的决策呢?于是我们需要提前设定一个风险判断标准 而根据我们承受力的大小及后果的严重度,这个标准各有不同,0.01 、0.0
8、5、0.1 等但我们通常设定 为0.05这也就是我们通常拿P值和0.05 进行大小比较的原因。如果P0.05 接受H0; P0.05 放弃H0 (P Low H0 Go) 理解练习为什么正态检验,等方差检验P要大于0.05?,假设检验,假设检验原理(续) (Significance Level)置信水平:风险判断标准P-value 做出放弃H0 的决策犯错误的最大风险值, 值,Ho 选择域,Ho弃却域,Ho选择域,Ho弃却域,值,P值 放弃H0认为有差异或影响,P值 接受H0不能做决策 ,不能说有差异,TP,T ,TP,T ,假设检验,假设检验步骤,假设 设定,检定统计量选择,留意水准 决定,
9、-value 计算(弃却域 , 检定统计量 计算),判定(统计结论)p-value 时 Ho弃却,实际结论,遵循假设检验路径图,Stat -Tables - Chi-square Test,Stat -Basic Stats -2 proportion,Stat -Basic Stats -1 proportion,Ho: m1 = m2H1: m1 m2Stat - Basic Stats - 2-Sample t “assume equal variances” “假定等方差选择按钮”选择,Ho: M1 = M (中值)H1: M1 M (中值)Stat - Nonparametric -
10、 1 Sample-Sign 或者Stat - Nonparametric - 1 Sample-Wilcoxon,数据形态检验,假设检定,One-wayANOVA,计数型数据,Chi-square检定,Ho: m1 = m2 = m3 = .H1:至少一个是不一样Stat - Anova- One-way,Ho: 跟随正态分布, H1: 不是正态分布Stat - Basic Stat - Normality Test,置信水平 = 0.05 时候:P-值 0.05 时 Ho 接受P-值 0.05 时 Ho 放弃,正态数据,标准偏差的置信区间,一个总体,两个以上的总体,2 Sample t(方
11、差相等),2 Sample t(方差不相等),1 Sample t 或者1 Sample Z,Ho: m1 = m (平均值)H1: m1 m (平均值)Stat - Basic Stats - 1 Sample-t (s不知道时候) 1Sample Z (s知道时候),1 Sample-Sign 或者 1 Sample-Wilcoxon,Mann-Whitney Test,两个以上的总体,两个母集团,1-Proportion,2-Proportion,一个总体,两个总体,两个以上的总体,非正态数据,等 方差,Yes,No,Kruskal-Wallis Test,一个总体,一个总体,两个以上的
12、总体,Ho: M1 = M2H1: M1 M2Stat - Nonparametric - Mann-Whitney,Ho: M1 = M2 = M3 = .H1: 至少一个是不一样Stat - Nonparametric - Kruskal-Wallis,Ho: m1 = m2H1: m1 m2Stat - Basic Stats - 2-Sample t “assume equal variances”“假定等方差选择按钮” 不选择,Test for Equal Variances(Levenes Test),Test for Equal Variances(F Test or Bartl
13、etts Test),Ho: s1 = s2 = s3 = .H1: 至少有一个不一样Stat - Anova - Test for Equal Variances两个总体比较的时候 用F-test,Ho: s1 = s (标准差)H1: s1 s (标准差)标准差的置信区间使用Minitab 路径 Stat -Basic Statistics - Display Descriptive Stats,计量型数据,数据稳定性研究(控制图),配对T(Paired T),Ho: D =0 (差值)H1: D 0 (差值)要对差值进行正态性检验Minitab 路径 Stat -Basic Statis
14、tics Paired t test (配对T),假设检验-常用路径图,假设检验 - 单样本T检验,“单样本t检验”解决什么问题?,典型的问题为: “我们抽取了新坐席员Bob的30通电话录音数据,想知道坐席员A的话后整理时长的平均值是否刚好等于考核要求的25秒?”当然问题也可以是“Bob的平均整理时长大于25秒吗?”或者“Bob的平均整理时长刚好小于25秒吗?”,建立零假设和备选假设:平均整理时间等于目标值平均整理时间不等于目标值决定显著性水平: = 0.05(5%)随机抽取30通电话的整理时间数据作为样本选取适合方法计算P值(参考下页详细步骤)依据P值结果做出结论,按照以下步骤完成,如果P值
15、大于或等于0.05,不能推翻零假设 H0如果P值小于a,推翻零假设 H0,选取适合方法计算P值详细过程,使用控制图检验样本数据稳定性,样本量不足,n25,样本量足够多,n25,不是正态分布,是正态分布,单样本T检验,单样本T检验,单样本T检验,先把数据转换为正态后再使用单样本T检验,检验数据正态性,数据不稳定应先解决稳定性问题,NO,YES,算出P值,样本数据n个,打开文件1- Making Comparison.JMP,分析路线图 单样本T,步骤1: 检验稳定性,步骤1: 检验稳定性,是否有任何明显的变化趋势或模式,足以证明数据并非来自单一的总体/流程?,步骤2: 检验正态性,1,2,3,4
16、,步骤2: 检验正态性,P 值0.05,数据是正态,步骤 3: 检验均值,Ho: 均值(Bob) = 25Ha: 均值 (Bob) = 25,无法推翻零假设,结论的陈述,由于p值大于临界置信水平(本例中P=0.34680.05),或者说,由于均值的置信区间包含了目标值,我们可以作出下述结论:我们没有足够的证据拒绝零假设。是否可以说零假设是正确的(Bob的均值=25秒)? 不!但是,我们通常在假定零假设是正确的情况下执行操作。,延伸,如果问题是: “Bob的平均整理时长大于25秒吗?”或者“Bob的平均整理时长刚好小于25秒吗?”如何构造零假设和备选假设?你的结论是什么?如何利用刚才的结果?,假
17、设检验 - 双样本t检验,“双样本t检验”解决什么问题?,典型的问题为: “我们各抽取了坐席员Bob和Jane的30通电话样本,想知道坐席员A和B的平均话后整理时长是否相等?”当然问题也可以是“Bob的平均整理时长大于Jane的平均整理时长吗?”或者“Bob的平均整理时长小于Jane的平均整理时长吗?”,建立零假设和备选假设: Bob的平均值等于Jane的平均值 Bob的平均值不等于Jane的平均值决定显著性水平: = 0.05(5%)随机抽取Bob和Jane各30通电话的整理时间数据作为样本选取适合方法计算P值(参考下页详细步骤)依据P值结果做出结论,按照以下步骤完成,如果P值大于或等于0.
18、05,不能推翻零假设 H0如果P值小于a,推翻零假设 H0,选取适合方法计算P值详细过程,使用控制图检验样本数据稳定性,样本量不足,n25,不是正态分布,是正态分布,数据变换为正态或非参数检验,双样本T检验,检验数据正态性检验方差是否相等,数据不稳定应先解决稳定性问题,NO,YES,算出P值,样本数据n个,等方差,不等方差,等方差,不等方差,双样本T检验,双样本T检验*,双样本T检验*,双样本T检验,双样本T检验*,数据变换为正态或非参数检验,方差相等双样本T的公式,方差不等双样本T的公式,样本量足够多,n25,样本量,在获取数据并试图得出一些陈述之前, 我们需要确定进行这种检验数要多少数据.
19、记住, 我们有一些基于估计值的抽样“经验方法 Rules of Thumb并不要求Bob和Jane的两组样本量一定是相同的注意: 我们将在以后的模块中讲解样本量的计算,工具或统计 最小样本量 平均值5 - 10 标准偏差 25 - 30 有缺陷的比例 (P) 100 并且 nP = 5 直方图 或帕累托图 50 散点图 25 控制图 20,不同工具的样本量,通常:连续数据: 30属性数据 100,步骤1: 检验稳定性,步骤1: 检验稳定性,步骤2: 检验正态性,步骤2: 检验正态性,步骤2: 检验正态性,数据是否为正态分布 ?小 P-Value (.05), 数据为非正态分布注意样本大小的问題
20、,处理数据,JMP喜欢数据按栏输入我们希望下列表格结构:测量的数据至于单独的一栏“标识符”在一栏在我们的范例中, 我们希望有下列栏:坐席员 Operator (用Bob 和 Jane 作为值)话后整理时长 Time (用所用 Bob 和 Jane的通话时间值)我们显然希望这些数据按照测量值和答复电话的人之间适当的关系安排.JMP 能帮助我们完成这项任务,堆叠数据为下一步进行数据格式转换,数据变换,步骤3: 等方差检验,步骤3: 等方差检验,P-值!,Equal Variance Not equal variance,方差不等时的解决方法,步骤4:均值检验,Ho: Mean(Bob) = Mea
21、n(Jane)Ha: Mean(Bob) = Mean(Jane),步骤4:均值检验,结论的陈述,由于P值小于临界置信水平(本例中P=0.01570.05,我们可以作出下述结论:我们有足够的证据拒绝零假设,如果问题是: “Bob的平均整理时长大于Jane的平均整理时长吗?”或者“Bob的平均整理时长小于Jane的平均整理时长吗?”,假设检验 多样本比较,假设检验用于比较2个或更多数据样本的均值ANOVA检验陈述的原假设(null hypothesis)是所有样本的均值都相同Ho: a = b = c = d = e ANOVA检验陈述的备择假设(alternate hypothesis) 是至
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 精益六西格玛 统计 工具 介绍 假设检验 ppt 课件
链接地址:https://www.31ppt.com/p-1403151.html