西格玛教材40-21Unit-4分析46均值检验.ppt
分析(Analyze)阶段,均值检验(One/Two sample-test),Define,Measure,Analyze,Improve,Control,Step 8-Data 分析,Step 9-Vital Few X的选定,Multi Vari Central limit Hypothesis testing Confidence interval ANOVA,T-test Chi-square Correlation,regression,Step 7-Data 收集,路径位置,了解t-Test 是作为平均比较来观察它的意义.Means平均(means)/中值(medians)检验的 基本概念进行介绍.,目 标,统计性检验的 Roadmap t-Test 说明 1 sample t-Test 双样本T检验,目 录,假设检验模式中,两个全体均值的比较.我们观察零假设中,观察推翻零假设的充分的统计的证据.收集顾客数据.但是,这数据怎样检验(test)?,统计性检验的 Roadmap,X Data,X变数 1个,X变数 复数,Y Data,Y 变数 1个,Y变数 复数,X Data,离散形(记数形),连续形,Y Data,离散形,连续形(计量型),ANOVAt-Tests,X Data,离散形,连续形,Y Data,离散形,连续形,根据数据的种类和比较的对象的不同有多种类的检验方法.,t-Test 是 input 数据是记数型,output 数据是计量型时 使用的检验工具!,统计性检验的 Roadmap,一个管理者在涂敷厂想了解2名作业者的涂敷漆的量的大小.,Y变数是什么?_ 数据的种类?_,X变数是什么?_ 数据的种类?_,使用什么工具?_,统计性检验的例,统计性检验的 Roadmap,您在这里作什么的决定?,Sample#BobJane123.224.2222.223.2324.324.8422.122.7525.925.3,数据如下.,统计检验的 Roadmap,Bob 的 20个印章sample,平均,散布分析的 Roadmap,Bob&Jane的 20个印章 sample,Bob,Jane&Walt 的 20个的印章 sample,1 sample t,2 sample t,ANOVA,统计检验的 Roadmap,t-Tests,标本的平均与其他平均或者标本平均特定值(例:规格下限)比较时,使用t-Teset.这检验是为标本在统计中是否不同,标本特性和基准分布t-分布的比较.数据的分析前观察基本的用语和概念.,t-Test 说明,t-分布,4,3,2,1,0,-,1,-,2,-,3,-,4,P,r,b,T,1%,2.5%,5%,Observed Point,t-Test 说明,T-值 用来衡量一个影响的重要性。(这个影响是“活性的”吗?)。影响定义为两个平均值间的差异 T-值 以样本偏差为单位。比如 T值为+2.00 的意思是这个影响相对于0.00(或相对某个目标值)为2个样本偏差。从正态分布我们知道偏离中心2个样本偏差的情况极少发生每个T值都伴随一个概率(P值)。这个概率表示如果影响为0.00,得到观察到的T-值的机会是“P”例如 T值 为-1.97 时 P值 等于0.085.这就是说如果与T值相对应的影响真是0.00,那么获得T值 等于-1.97 的概率是 8.5%一般我们采用的P-值 限于 5%.如果我们的样本数相对较小,有时使用10%,t-Test 说明,练 习,目的:研究当已知实际结果时如何进行T-检验.1:我们从同样的过程中生成随机样本进行T-检验 2:我们将把过程的样本偏差移动1个单位,然后进行T-检验 3:我们将把过程的样本偏差移动2个单位,然后进行T-检验,t-Test 说明,t-值 概率-1.697260.05-0.255610.40-0.530020.30-3.385190.0010-4.233990.0001-0.853770.20-1.310420.10-1.954650.03,Ha 采用Ho 采用_ _ _ _ _ _ _ _ _ _ _,X,X,X,X,X,X,?,X,t-值 解释练习,利用以下T-值,标示出影响是显著的还是不显著的,t-Test 说明,t-检验的解释,实施t-检验得到t值和 p值时可以做下面的叙述.根据数据,说明有平均差异(Delta),我的结论错误的概率(p-值)或者,根据数据,我有重要效果,根据这自然结果可以说是概率(p-值).根据前面第一页可以做这样的说明.有平均差异,这结论错误的概率是 5%.我们一般希望错误的概率不超过5%.,t-Test 说明,双侧检验(Two-tailed test)当两个平均值差异的方向不能事先确定时使用例如:比较磨粉机的两个结构。我们不知道那一个更好一些单侧检验(One-tailed test)当两个平均值差异的方向事先知道时使用。例如:改造后联结器的平均良品率应该比旧的高这个检验比双向检验更有威力。,t-Test 说明,4,3,2,1,0,-,1,-,2,-,3,-,4,0,.,4,0,.,3,0,.,2,0,.,1,0,.,0,O,u,t,p,u,t,P,d,f,T=1.96,T=-1.96,For=.05,双侧检验,假设检验一般用 表示.,t-Test 说明,右侧检验(Right-tailed Test),4,3,2,1,0,-,1,-,2,-,3,-,4,0,.,4,0,.,3,0,.,2,0,.,1,0,.,0,O,u,t,p,u,t,P,d,f,T=-1.64,4,3,2,1,0,-,1,-,2,-,3,-,4,0,.,4,0,.,3,0,.,2,0,.,1,0,.,0,O,u,t,p,u,t,P,d,f,T=1.64,左侧检验(Left-tailed Test),For=.05,单侧检验,t-Test 说明,样本大小(Sampling Size),稍等!开始比较之前,为决定显著差是否存在的分析需要几个必要数据?记住假设检验.考虑因子数,为决定统计的差异有必要决定必要的测定的(数据)数.平均(Mean)样本偏差(Standard deviation)差异(Delta:我们要观察的差异)风险水准(Risk level),t-Test 说明,样本大小的规则,下表给出了2-K实验中决定样本数的一般原则.,以后将给出更多的细节,t-Test 说明,再观察Paint图表的例题。我们怀疑Bob涂敷的量比目标多,所以对 Bob的涂敷油漆厚度是否在目标范围内进行调查。平均是 25。假如 Bob比目标变化大,那么其他情报是必要的。根据每天的推移数据是样本偏差是0.25。我们可以接收的 a 风险(Bob的平均与目标相同,说不同的概率)是 0.05.我们可以接收的 b 风险(Bob的平均超过目标,但说满足目标的概率)是 0.20。,1 sample t-Test,零假设(Ho):Bob的厚度与目标值相同.备择假设(Ha):Bob的厚度比目标值大.,假设,1 sample t-Test,Step 1 求出要求的样本大小,为在两个假设中选择,必要的样本大小是多少?指定的情报:显著水平,a=0.05检验功效=1-=1-0.20=0.80平均的差异,d=25.1-25.0=0.1样本偏差,s=0.25备择假设(Ha):Bob的厚度比目标大.,1 sample t-Test,Minitab 样本大小的计算,1 sample t-Test,Minitab 使用,2.检验功效(power),输入1-b.,1.输入delta,d.,4.选择备择假设.,3.输入sigma,s.,5.输入alpha,a.,1 sample t-Test,功效和样本数量 单样本 t 检验检验平均值=零(与 零)计算功效的平均值=零+差值Alpha=0.05 假定标准差=0.25 样本 目标差值 数量 功效 实际功效 0.1 41 0.8 0.808582,Minitab 是 0.80的检验功效,为确认Bob的目标为中心是否在 0.25以内,先告诉必要的标本的大小是 41个。(注:N=41时,实际检验功效是 0.8086。),Minitab 输出,1 sample t-Test,打开t-Test.MPJ 中的 1 Sample t.,Step 2 1 Sample t 打开,Bob25.296926.057824.070024.819925.985125.3572.,1 sample t-Test,Comparisons Involving 1 Level To The X,Study Stability(if applicable),SPC ChartI-MR,数据不是在一个总体/工序中得到的,有没有能够证明的显著的倾向或方向?,Minitab,要看什么,Step 3 把握Data的倾向,1 sample t-Test,单值图,1 sample t-Test,有没有说明数据不是 一个的 总体/工序中得到的显著现象或现象?,1 sample t-Test,Comparisons Involving 1 Level To The X,Study Stability(if applicable),SPC ChartI-MR,有没有说明数据不是 一个的 总体/工序中得到的显著现象或现象?,Minitab,要看什么,Study Shape,Descriptive Stats and Normality Tests,数据有正态分布吗?P-Value小时(.05),数据没有正态分布.对样本大小显著.,Step 4 检验Data的正态分布,正态,非正态,Test for Mean1 Sample T-Test1 Sample Z-TestExample:(Ho:Mean=25.00),Z-or T-Test(if n25)使数据变换成正态分布,利用 Z Test.Non-Parametric Tests1-Sample Wilcoxon Signed-Rank Example:(Ho:Median=25),P Value 0.05 时,真平均(中央值)与明示的值不一致.,1 sample t-Test,P 值是什么?是假设检验部分.Ho:数据有正态分布.(Normal)Ha:数据没有正态分布.我们做如下解释:根据数据,我采用备择假设(Ha)并这结论错的概率是 P%.根据指导,P值比.05小时推翻 Ho.,Minitab 输出-P Value,1 sample t-Test,1)Histogram数据有钟型吗(bell shaped)?2)Normality Curve数据有直线吗?3)P ValueP Value 0.05?,确认正态分布(Normality)的方法,1 sample t-Test,Minitab Commands Descriptive Stats,1 sample t-Test,Minitab Output,数据服从正态分布吗?P-Value比0.05大 故该数据服从正态分布.对样本大小显著.,1 sample t-Test,Minitab Commands Normality Test,1 sample t-Test,数据有直线性吗?,数据有正态分布吗?,Minitab Output,1 sample t-Test,Step 5 现在开始实施 t-Test 检验,1 sample t-Test,单样本 T:Bob mu=25 与 25 的检验 平均值变量 N 平均值 标准差 标准误 95%下限 T PBob 41 24.791 0.911 0.142 24.552-1.47 0.925,Ho:Mean(Bob)=25Ha:Mean(Bob)25,P-值!,5-1.中心值的检验,1 sample t-Test,我们要的值在这范围内吗?,MinitabAnother Way To Answer The Question,1 sample t-Test,StudySpread,Descriptive Stats,假设的 s 是否包含在内?这样情况数据有正态分布时有效,Comparisons Involving 1 Level To The X,Study Stability(if applicable),Minitab,要观察什么?,Study Shape,StudyCentering,SPC ChartI-MR,有没有说明数据不是 一个的 总体/工序中得到的显著现象或现象?,Descriptive Stats and Normality Tests,数据有正态分布吗?P-Value小时(.05),那么这数据没有正态分布.对样本大小显著.,5-2.实施散布的检验,1 sample t-Test,实质性的问题:Bob的散布(样本偏差)是否比 1.0小?与1.5比较时?,Bob25.296926.057824.070024.819925.985125.3572.,1 sample t-Test,Minitab Output,1 sample t-Test,其他例题 Helicopter 实习,直升机制造师说自己制作的直升机(条件如下)的飞行平均时间是 2.00秒.-假如不是,给更换新的直升机.6支点降落长翅膀一个水平不利(One stabilizer)短的轴这公司对自己的设计有自信感,宣布假如飞行时间的样本偏差大于0.30时赔偿2倍的钱。为假设平均差异不到 0.10秒,决定必要的样本大小。您能不能确认这样的推荐。,1 sample t-Test,Comparisons Involving 2 Levels,Study Stability(if applicable),Study Shape,StudySpread,StudyCentering,打开2 Sample t 检查表.,Roadmap 分析-2 Samples,双样本T检验,Bob Jane25.296926.005626.057825.940024.070026.006324.819926.435625.985125.992724.690223.696125.933725.676425.100524.5723.,实质性的提问:Bob和 Jane的印章工程能力怎样比较?,双样本T检验,Step 1 现调查样本大小。,因日程和业务交接原因假设Jane时只能取到 30个数据。-30个时充分吗?-这时检出力是多少?-其他检出力和样本大小的调查可能吗?,零假设(Ho):Jane的 油漆厚度 与Bob的厚度一样.备择假设(Ha):Jane的油漆厚度 与Bob的厚度不同.(大或小),假设,双样本T检验,要求的样本大小,为采纳两个中的一个,必要的样本大小是多少?提供的情报:显著水平,=0.05检验功效=1-=0.80平均差异,d=0.1样本差异,s=0.25备择假设(Ha):Jane的油漆厚度与 Bob的厚度不一样.,双样本T检验,双样本T检验,2.输入检验功效(power),1-b.,1.输入delta,d.,4.选择备择假设.,3.输入sigma,s.,5.输入alpha,a.,双样本T检验,功效和样本数量 双样本 t 检验检验平均值 1=平均值 2(与)计算平均值 1 的功效=平均值 2+差值Alpha=0.05 假定标准差=0.25 样本 目标差值 数量 功效 实际功效 0.1 100 0.8 0.803648样本数量是指每个组的。,Minitab是 0.80的检验功效,为检验Jane和 Bob的油漆的(或者差异在 0.1 以内时)涂敷情况确认,提供必要的样本大小是 Jane和 Bob 每个是 100。(注:N=100时,实际检验功效是 0.8036.),Minitab Output,双样本T检验,样本大小的计算,利用Minitab 的 Sample Size Calculator计算提供的样本大小的检验能力!,双样本T检验,Minitab Output,当样本大小等于30时,得到检验功效只有0.3315,也即b值是0.6685。这说明用这么多数据来检验这两个作业者间的差异是不充分的,故还要收集数据。,功效和样本数量 双样本 t 检验检验平均值 1=平均值 2(与)计算平均值 1 的功效=平均值 2+差值Alpha=0.05 假定标准差=0.25 样本差值 数量 功效 0.1 30 0.331522样本数量是指每个组的。,双样本T检验,与以前相同的方法-但根据各水准分别计算.Bobs New Data,Step 2 检验正态分布。,双样本T检验,Janes New Data,双样本T检验,Stack Data&Homogeneity of Variance Test,Levenes Test Ho:2A=2B,Bartlett Test(F-Test)Ho:2A=2B,Normal,Non-Normal,P-Value小.(.05)分散不同.,Comparisons Involving 2 Levels,SPC ChartI-MR,Descriptive Stats and Normality Tests,Minitab,要观察什么?,Study Stability(if applicable),Study Shape,StudySpread,Step 3 比较散布.,有没有说明数据不是 一个的 总体/工序中得到的显著现象或现象?,数据有正态分布吗?P-Value小时(.05),数据没有正态分布.对样本大小显著.,双样本T检验,Minitab 堆叠数据,双样本T检验,Minitab 堆叠数据,双样本T检验,Minitab-等方差检验(Test for Equal Variances),双样本T检验,Ho:s(Bob)=s(Jane)Ha:s(Bob)s(Jane),P-Values!,结论是?,双样本T检验,分散一样.,分散不一样.,If N 25 ANOVA or T(or transformation)Or Mann-Whitney(Median A=Median B),If N25 2 Sample T(or transformation)Or Mann-Whitney(Median A=Median B),P-值小.(.05)对2个总体中心位置(Centering)不一致.,Normal,Non-Normal,Stack Data&Homogeneity of Variance Test,Levenes Test Ho:2A=2B,Bartlett Test(F-Test)Ho:2A=2B,Normal,Non-Normal,P-值小.(.05)分散不同l,Comparisons Involving 2 Levels,SPC ChartI-MR,Descriptive Stats and Normality Tests,Minitab,要观察什么?,Study Stability(if applicable),Study Shape,StudyCentering,StudySpread,有没有说明数据不是 一个的 总体/工序中得到的显著现象或现象?,数据有正态分布吗?P-Value小时(.05),数据没有正态分布.对样本大小显著.,双样本T检验,比较两个平均的 2种方法双样本T单因子方差分析在下一个范围观察 ANOVA 方法,Step 4 比较平均.,双样本T检验,n1和 n2 相同时:,若两平均一样,那么“t“值是多少?,两平均间的差异检验,实验中得到的效果Experimental Effect,双样本T检验,2个独立的样本平均比较,在前面分析了2个全体的分散是显著的,下面我们分析2个全体的平均比较.这就是我们第一个实施的实验计划法(DOE).-1因子(input)和 1个的计量型 output 变数Bob和 Jane的印章工程能力作比较,想象场景.数据的输入法有两种.Bob的数据输入在 C1 中,Jane的数据输入在 C2中.(unstacked)数据输入在C1中,作业者名字输入在 C2中.(stacked)Minitab中 C2列叫 subscript variable.选好后者方法;我们经常希望把各input变数输入在一个列中,各 output 变数输入在其他的列中.,双样本T检验,Ho:Mean(Bob)=Mean(Jane)Ha:Mean(Bob)Mean(Jane),Unstacked 的例,双样本T检验,双样本 T 检验和置信区间:Bob,Jane Bob 与 Jane 的双样本 T 平均值 N 平均值 标准差 标准误Bob 100 24.811 0.977 0.098Jane 100 25.449 0.990 0.099差值=mu(Bob)-mu(Jane)差值估计:-0.638差值的 95%置信区间:(-0.912,-0.364)差值=0(与)的 T 检验:T 值=-4.59 P 值=0.000 自由度=198两者都使用合并标准差=0.9835,Output 解释,双样本T检验,工程师采购了“计量的”半导体线路板焊接 设备.但是这位在再申请增加设备之前,对新的压焊机的工程改善情况进行调查.观察10日间生产的数据.这时,2个压焊机是新的设备.,Bonder 1 Bonder 289 8481 8684 8384 9187 8679 7985 8281 8983 8384 88,Floppy2:Bonder.mtw,-Bonder的例题-,双样本T检验,提问:与使用压焊机A 的工序 比较时新的装备的压焊机 B 效率可以提高吗?,显示描述性统计量变数 N 平均 中央值 样本偏差 Bonder A 10 84.400 85.000 2.91Bonder B 10 85.60 85.50 3.72,统计的提问:可以认为Bonder B的平均重要与Bonder A的平均不同吗?或者与因偶然或周期变动而发生的数值相接近?,The Delta=1.2%,双样本T检验,压焊机可以互相代表两个工序吗?,压焊 A,压焊 B,80.0 82.5 85.0 87.5 90.0 92.5,.:.-+-+-+-+-+-+-80.0 82.5 85.0 87.5 90.0 92.5,两个压焊可以代表一个基本的工序吗?,我们假设这是对时.,双样本T检验,假设检验阶段,1.问题定义:两个压焊机没有达到他们的极限水准.2.陈述目标:为证明新的挑战系统的良品率提高的判断,收集数据.3.假设设定-陈述零假设(Ho)-陈述备择假设(Ha),决定适当的统计测试(假定概率分布 z,t,or F):T-test(Right-Tailed)5.陈述 水准(一般 5%),双样本T检验,Minitab 编辑窗输入下面数据:,Bonder1 Bonder289.784.781.486.184.583.284.891.987.386.379.779.385.182.681.789.183.783.784.588.5,unstacked 数据的模式,使用Minitab,双样本T检验,双样本 T 检验和置信区间:Bonder1,Bonder2 Bonder1 与 Bonder2 的双样本 T 平均值 N 平均值 标准差 标准误Bonder1 10 84.24 2.90 0.92Bonder2 10 85.54 3.65 1.2差值=mu(Bonder1)-mu(Bonder2)差值估计:-1.30差值的 95%置信区间:(-4.40,1.80)差值=0(与)的 T 检验:T 值=-0.88 P 值=0.390 自由度=18两者都使用合并标准差=3.2974,p-value值不是 5%以下.压焊机体现同一水准.,到 统计基本统计量双样本T,CI 包含 0,零假设是合理的.,双样本T检验,堆叠命令语,YieldBonder89.7181.4184.5184.8187.3179.7185.1181.7183.7184.5184.7286.1283.2291.9286.3279.3282.6289.1283.7288.52,C3 中加入输出变数,C4 中输入了输入变数.Stacked 时,Minitab 自动的按压焊编号顺序编定.,到数据堆叠;第一模块输入 C1,第二模块输入 C2.堆叠结果 模块输入 C3.将下标存储在 后输入 C4.,双样本T检验,双样本 T 检验和置信区间:Y,Bonder Y 双样本 T 平均值Bonder N 平均值 标准差 标准误Bonder1 10 84.24 2.90 0.92Bonder2 10 85.54 3.65 1.2差值=mu(Bonder1)-mu(Bonder2)差值估计:-1.30差值的 95%置信区间:(-4.40,1.80)差值=0(与)的 T 检验:T 值=-0.88 P 值=0.390 自由度=18两者都使用合并标准差=3.2974,到 统计基本统计量双样本t点击样本在一列中 输入 C3 与 C4 两个BOX.,双样本T检验,在打印墨盒中加入墨水使用两台机械.墨水加入工序认为是正常的.品质工程师想了解两台机械是否都可以装16毫升的目标.请分析.机械1样本:16.03,16.04,16.05,16.05,16.02,16.01,15.96,15.98,16.02,15.99机械2样本:16.02,15.97,15.96,16.01,15.99,16.03,16.04,16.02,16.01,16.00可容纳 150 Gigabytes 的新的电脑移动盘有两个,进行拷贝数据时间比较.工程师想了解这时间是否一样.Type 1:65,81,57,66,82,82,67,59,75,70Type 2:64,71,83,59,65,56,69,74,82,79,-墨盒例题-,双样本T检验,