CentralLimitTheorem-中心极限定理.ppt
Central Limit Theorem中心极限定理,Six Sigma Greenbelt Training,4.2-1,工序改善方法论TM,Define,Measure,Analyze,Improve,Control,Step 7-Data 收集,Step 8-Data 分析,Step 9-Vital Few X的选定,Sampling(单纯,层化,群体,系统),Multi Vari Central limit Hypothesis testing Confidence interval ANOVA,T-test Chi-square Correlation,regression,C&E Matrix FMEA Control plan,4.2-2,目 的,引入中心极限理论的概念讨论在测量系统分析中的应用用模拟的方法说明这一概念讨论在推论统计中的应用,4.2-3,定义 中心极限应用 1.正态分布的举例 2.Chi-Square的举例 标准误差及样本大小,目 录,4.2-4,Central Limit Theorem(中心极限定理)的定义,在母集团中任意抽样测定标本的平均。-母集团是正态分布时:标本的平均也有正态分布-母集团非正态分布时:样本大小充分的大时标本的平均 具备正态分布型。.样本规格越大越接近正态分布。.样本规格越大标准平均的分布散布越小。大家肯定观察到母集团正态分布和非正态分布状态。,4.2-5,Central Limit Theorem(中心极限定理),推论统计学的根原利用同样的数据观察两个不同的 SPC 样式。CENLIMIT.MTW 打开.StatControl Charts 打开.利用OUTPUT 分析两个SPC:第一:Individuals chart第二:群大小利用5人的 Xbar chart UCL 和 LCL调查。比较的方法两个都是一样的数据,为什么有差异?,4.2-6,Individuals vs.X-bar,个体数据,标准平均,两种情况的管理上下限相比较结论怎么样?,中心极限定理,4.2-7,Central Limit Theorem 的使用,4.2-8,平均值分布的标准偏差叫做 平均值的标准差,因而定义为:这个公式表明平均值比个体数据更稳定,稳定因子是样本数的平方根。,s,x,=,=,平均值的标准差,个体值的标准偏差,n,=,平均值的样本数,x,平均值的标准差(Standard Error of the Mean),其中,4.2-9,我们经常依靠从测量系统中得到的一个数值来估计输入或输出变量的值。减小测量系统误差的简易方法就是把两个或更多的读数平均。我们的测量系统的精密度自动增加,增加因子是平均值样本数的平方根.如果我们要想使测量系统的误差减小一半,我们就要把4次测量值平均。,实际应用,4.2-10,1.正态分布时,中心极限定理练习,假设你有一个大桶,桶里装有很大数量的白色纸单,每张纸单里填有数字,这些数字来自一个具有特定平均值和标准偏差的正态分布。随机抽出9张白色纸单,把这9个数字平均,然后把这个平均值写在一张绿色纸单上。把这9张白色纸单放回原来的桶里。把这张绿色纸单放入另外一个桶里。如此反复,直到盛有绿色纸单的桶放满为止。盛白色纸单的桶代表总体的数据。盛有绿色纸单的桶代表平均值的样本分布。我们用统计再抽样的方法作这个练习。,4.2-11,例题 中心极限定理使用的例,重新启动你的 Minitab 对话窗让我们产生一些模拟的数据来验证我们的理论。使用以下对话窗命令来生成 9 列各250个数据,这些数据来自一个平均值=70、标准偏差=9 的正态分布:列 C1-C9 代表白色纸单,列 C10 代表绿色纸单。MTB rand 250 c1-c9;SUBC normal 70 9.MTB rmean c1-c9 c10MTB describe c1-c10我们期望列 C10 的标准偏差怎么样?它是什么?,4.2-12,用MINITAB找出标本,4.2-13,标准平均数据制作,4.2-14,标准平均数据制作,4.2-15,MINITAB Descriptive Statistics,4.2-16,Variable N Mean Median TrMean StDev SEMeanC1 250 70.069 70.651 70.172 8.876 0.561C2 250 70.253 70.149 70.322 8.614 0.545C3 250 70.170 70.286 70.155 8.272 0.523C4 250 70.525 70.196 70.524 8.814 0.557C5 250 69.123 68.492 69.215 8.637 0.546C6 250 71.380 72.159 71.515 8.670 0.548C7 250 69.409 69.523 69.347 8.817 0.558C8 250 69.698 69.753 69.648 8.766 0.554C9 250 69.472 69.439 69.625 8.362 0.529C10 250 70.011 70.143 70.042 2.887 0.183,结果 _ 统计良比较,4.2-17,结果 _ 统计量比较,Variable N Mean Median TrMean StDev SEMeanC1 250 70.069 70.651 70.172 8.876 0.561C2 250 70.253 70.149 70.322 8.614 0.545C3 250 70.170 70.286 70.155 8.272 0.523C4 250 70.525 70.196 70.524 8.814 0.557C5 250 69.123 68.492 69.215 8.637 0.546C6 250 71.380 72.159 71.515 8.670 0.548C7 250 69.409 69.523 69.347 8.817 0.558C8 250 69.698 69.753 69.648 8.766 0.554C9 250 69.472 69.439 69.625 8.362 0.529C10 250 70.011 70.143 70.042 2.887 0.183,什么意识?,现在开始比较。,4.2-18,结果 _ 柱装图比较,标本的散步(C9)和标准平均的散步(C10)进行比较。,散布减少了很多.,=8.36,=2.89,4.2-19,结果 _ 点装图比较,用点装图比较频度数能够更明确的了解。,4.2-20,结果,让我们实实在在地推动我们的系统!,中心极限定理,样本平均值分布的平均值和总体的平均值十分接近。样本平均值分布的标准偏差等于总体的标准偏差除以样本数的平方根。样本平均值的分布十分接近正态分布。,4.2-22,是标准平均的分布.,个别测定值分布.,追加调查,4.2-21,