西格玛教材40-19Unit-4分析44假设检验.ppt
《西格玛教材40-19Unit-4分析44假设检验.ppt》由会员分享,可在线阅读,更多相关《西格玛教材40-19Unit-4分析44假设检验.ppt(49页珍藏版)》请在三一办公上搜索。
1、分析(Analyze)阶段,假设检验(Hypothesis Testing),Define,Measure,Analyze,Improve,Control,Step 8-Data 分析,Step 9-Vital Few X的选定,多变量研究 中心极限定理 假设检验 置信区间 方差分析,均值检验 卡方检验 相关/回归分析,Step 7-Data 收集,路径位置,目 录,假设检验概要假设检验的核心用语假设检验的定义假设检验的阶段假设检验的应用,?,亲爱的 Abby:你在你的专栏里说妇女怀孕期是266天。这是谁说的?我怀我的孩子用了10个月零5天,这是确信无疑的,因为我精确地知道孩子怀上的那一天。我
2、的丈夫在海军服役,这个孩子不可能在其他任何时间怀上,因为我见到他只一次,只有一个小时,而且在孩子出生之前我再也没有和他见面。我不饮酒,也不东奔西跑,而且这个孩子不可能不是他的。所以请在报纸上声明收回关于 266 天怀孕的时间。因为否则我将面临许多的麻烦!-圣地亚哥读者,你将对她说些什么?对他的丈夫说些什么?,假设检验概要,一则有趣的故事,250,260,240,230,270,280,290,300,220,平均,圣地亚哥的读者,平均怀孕时间是266天如果她说怀孕260天,你对她怀疑吗?如果她说怀孕400天,你对她怀疑吗?从哪点起你开始怀疑呢?作一个记号,假设检验概要,医生很早就知道孩子自然出
3、生有以下特征 正态分布 平均怀孕时间=天 标准偏差=天,假设检验概要,产科医生早就知道:正态分布平均=266 天 标准偏差=16 天,假设检验概要,平均=_266_标准偏差=_16_,临产期间分布,圣地亚哥的读者,究竟如何呢?,假设检验概要,在工业生产中,我们经常希望能够确定某个分布的参数是否就是某个具体数值或是否与其有什么关系。也就是说,我们可能希望要检验这样一个假设,即:某个分布的均值或标准差是否是某些数值,或者两个均值之差是否是零。这些检验就需要使用假设检验方法。实际工作中的例子有:1、制造商希望引进一种新产品。为了能够实现利润,它们需要在今后5周的200小时内生产1200件产品。如果生
4、产一件产品的平均时间不超过6小时,那么目标就会实现。生产者可以通过检验平均生产时间等于6小时这一假设来评估其是否具备所需要的生产能力。2、这个制造商还打算修改工艺流程以减少另一种产品所需要的平均时间。它通过检验在工艺流程改变前后的平均生产时间是否相同这一假设来评估流程的修改是否有效。这两种情况都涉及到对总体均值的检验。假设也可以检验标准差或其他参数。,工业案例的启示,假设检验概要,假设检验是抽样推断的一个重要内容。所谓假设检验,就是事先对总体参数或总体分布形式的作出一个假设,然后利用样本信息来判断原假设是否合理,即判断样本信息与原假设是否有显著差异,从而决定应接受或否定原假设。所以,假设检验也
5、称为显著性检验。假设检验可分为两类:一是参数假设检验,简称参数检验;二是非参数检验或自由分布检验,妥善处理不确定 使主观最小化问题假设预防重要信息的遗漏控制判断错误的风险,假设检验概要:目的,是处理实际问题的方法,把实际问题变成统计问题因为我们用(相对小的)样本来估计总体的参数,因而总有可能为我们的实验选择一个“怪异”的样本,它可能不能代表一子群“典型”的观测.因此,推论统计学可利用一些假设,允许我们估计纯粹由于偶然原因导致的得到一个“怪异”结果的概率.比如,如果我们要知道一个硬币是否“公平”,我们可以抛它数次,记录我们看到它出现正面的次数.根据随机我们期望大约看到50%正面.如果我们抛了10
6、次硬币,得到10次正面,我们将清楚的确信这个硬币不“公平”.用一个公平的硬币1000次只有一次机会获得10个正面.因此我们可以说我们对于“不公平”的硬币的判断将有0.1%的错误机会.即只有1000分之1(概率性的)很难得发生的事件却在一次实验中发生了,则我们这时判断为硬币是非正常的。),假设检验概要,在不好的一天我们可以得到一个好的工程而在一个好天里我们可以得到一个坏工程无论哪一种情况,我们都可能作出错误的结论,我们声明我们在工程中取得了改善,而这个改善结果可能只是抽样的函数,假设检验概要,假设是关于某事是对的描述.如果我们抛10次硬币得到了8次正面,我们将说这个硬币是不公平的.在此我们有错误
7、的概率(约5%),但我们愿意承担这个风险.在工厂里我们用同样的方法验证假设我们将把原因归结于非常的事件,而不是纯粹偶然.问题:我们如何鉴别非常事件?我们如何利用统计学来帮助我们作出判断?我们知道样本数据服从自然散布。当某事“真的发生”时我们怎样知道是真实发生还是偶然发生?让我们开始研究这个程序。,假设检验概要,为何使用假设检验?,当无法确定是否存在真实差异时使用假设检验。例如,分层点图显示子群平均值之间没有明显差异:您想知道平均值的微小差异是由于随机变化还是反映了真实差异。假设检验比分层点图提供更明确的结果(如果假设满足的话)。,Reactor 1 Reactor 289 8481 8684
8、8384 9187 8679 7985 8281 8983 8384 88,Reactor.mtw,让我们看一个制造示例。假设我们改造了两台反应器中的一台反应器。在我们改造所有反应器之前我们想知道这些改善是否“显著地”提高了工程良品率。让我们看一下结果数据。在这个示例中,反应器B是新改造的反应器。,假设检验概要,实际问题:与代表现有工艺的反应器1相比,对反应器2的改造能提高良品率吗?,统计问题:反应器2的平均值(85.54)和反应器1的平均值(84.24)的差异是否足以被认为是显著的?或者说这两个平均值是否足够接近,可被认为是由于偶然因素或日与日之间的散布呢?,差异=1.3%,假设检验概要,V
9、ariable N Mean StDev MedianReactor1 10 84.24 2.902 84.500Reactor2 10 85.54 3.65 85.40,B B B B B BB B B B,80.0 82.5 85.0 87.5 90.0 92.5,A AA AAAA A A,反应器 2,反应器 1,这两个反应器代表两个不同的工艺吗?,这两个反应器代表一个基本的工艺吗?,假设检验概要,假设检验的前提假设,如果数据是连续的,我们假设基本分布是正态。您可能需要转换非正态数据(如周期)。当比较不同总体的子群时,我们假设:独立样本。通过随机抽样实现。样本是总体的代表(没有偏差)。当
10、比较不同过程的子群时,我们假设:每个过程都是稳定的。没有特殊原因或随时间的变化(没有与时间相关的差异)。样本是过程的代表(没有偏差)。,主要核心术语,1、实际推断原理:概率小的事件几乎不会发生2、零假设(Null Hypothesis-Ho)又名原假设 它是关于“没有差异”或者“根本没有效果”或“是相同的”陈述的假设,它直到有充分的证据说明其是错误时为止总被认为是真实的。3、备择假设(Alternative Hypothesis-Ha)又名替代假设 它是关于“有差异”或“有效果”,或“不同的”陈述的假设 它在零假设被推翻时生效的另一个假设,根据具体事件有不同的假设;4、类错误:又名“弃真错误”
11、,是指零假设是真的时候而拒绝它5、值:又称显著性水平,是指犯一类错误的概率,值越大,则越有可能 拒绝真实的零假设,该值一般没有统一的基准,通常设定为0.05,如果犯一类错误将会造成严重性的后果,则要求它设定小些。6、P值:显示了犯一类错误的可能性,用来判断是拒绝或接受零假设的。P值越小,犯拒绝零假设错误的可能性越小。一般情况下,如果P0.05,则零假设成立,如果P0.05,则推翻零假设。,7、类错误:又名”取伪错误”,是指零假设是假的时候而接受它.8、值:是指犯二类错误的概率,越大,则越有可能接受不真实的零假设 显著差异(Significant Difference)-用于描述统计性假设检验的
12、结果 的术语,在此差异大的不能合理的随机发生。那里很可能在发生什么特殊事9、检验功效(Power)-统计检验的能力,探测出某事很重要时,实际上 某事确实很重要。常被用来决定在处置中样本的大小是否足以探测到存在差异。零假设不真实时推翻错误零假设的概率,即能够检出假的零假设的概率。(1-)11.检验统计量(Test Statistic)-一个标准化的数值(z、t、F等),代表错误 确认的可能性,分布于一个已知的方式,以便可以决定这个观察到的数值的概率 通常错误确认越可行,检验统计量的绝对值就越小,而且在其分布内观察到 这个数值的概率就越大。,主要核心术语,实际的假设是:新改造的机器将减少不良.这个
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 西格玛 教材 40 19 Unit 分析 44 假设检验
链接地址:https://www.31ppt.com/p-5837498.html