MINITAB学习指南.ppt
1,Minitab实务应用,Ver.01,2008.4.6,2,Minitab介绍,Minitab是众多统计软件当中比较简单易懂的软件之一;相对来讲,Minitab在质量管理方面的应用是比较适合的;Minitab的功能齐全,一般的数据分析和图形处理都可以应付自如。,3,Minitab与6 Sigma的关系,在上个世纪80年代Motolora开始在公司内推行6 Sigma,并开始借助Minitab使6 Sigma得以最大限度的发挥;6 Sigma的MAIC阶段中,很多分析和计算都可以都通过Minitab简单的完成;即使是对统计的知识不怎么熟悉,也同样可以运用Minitab很好的完成各项分析。,4,Minitab界面和基本操作介绍,5,Minitab界面,Data Window:输入数据的窗口每一列的名字可以写在最前面的列每一列的数据性质是一致的,主菜单,Session Window:分析结果输出窗口,6,Minitab界面,同一时间只能激活一个窗口.每一个窗口可以单独储存.,不同的要求选择不同的保存命令,7,工具栏的介绍,打开文件,保存文件,打印窗口,剪切,复制,粘贴,恢复,插入单元格,插入行,插入列,移动列,剪切单元格,最后一次对话框,程序窗口,上一次记忆刷,下一次记忆刷,数据窗口,管理图形,撤销,帮助,关闭图形,8,档案,9,PROJECT,项目,是一个宏观的,其可以包含了数据工作表、图形、报告等。如果你想要存下所有的数据那么应当是使用PROJECT的格式。MINITAB有个优点可以做PROJECT档案的说明。,10,PROJECT说明,11,贮存时的选项,12,想存什么内容,13,安全性的密码设定,14,打开PROJECT时的状况,此时可能需要输入密码才能打开。另外也可以事先预览,不一定要先打开才知道。也可以先看一下说来了解档案的一些内容。,15,打开项目,16,预览,17,按下预览,18,WORKSHEET,一般就是和EXCEL一样,就只会保留数据而已。这是最基本的贮存内容,就是要有数据留下来。,19,打开工作表,20,打开工作表有二个方式,合并:合并是将第二个要打开的工作表内的内容直接并到前一个工作表中,所以就是在一个工作表中有二个工作表的内容。打开就是直接再打开一个工作表而已,也就,21,合并图示说明,C1为原有内容,此为合并进来的内容。,22,Minitab也可以打开其它型文件,Minitab也可以打开其它类型的文件。一般比较常见的就是excel格式的文件。,23,打开其它格式的档案,注意选成excel的格式,24,可以按下选项做调整,25,贮存工作表,26,工作表也可以做相应的说明,27,也可以存成其它格式的档案,注意存成excel的格式,28,按下选项可以决定是否存变量名,29,GRAPH,也可以把图形存下来。图形也可以有相应的说明。一般我都是直接贴到WORD或POWERPOINT中。,30,可以将图形存成.mgf or jpeg格式,31,编辑,32,编辑,此部份的功能和大部份的OFFICE软件都一样,所以可以不用说明。,33,编辑的命令列,34,数据,35,划分子集,您已经收集了关于一组大学生的静息脉搏率(脉搏 1)和运动后的脉搏率(脉搏 2)的数据,您希望检查脉搏率变化最大的学生的数据。您决定创建一个新的工作表,其中只包含脉搏率变化超过 20 的学生的数据。?注要子集化工作表,可以使用数据 子集化工作表或数据 复制 列到列 划分数据子集。该示例使用数据 子集化工作表,但两种方法的对话框项是相同的。1 打开工作表“脉搏.MTW”。(pulse.mtw)2 选择数据 子集化工作表。3在包括或不包括下,选择指定要包括的行。4在指定要包括的行下,选择匹配的行。单击条件。5在条件中,输入 脉搏 2 脉搏 1 20。在每个对话框中单击确定。注此命令不会在“会话”窗口中产生输出。要查看结果,请在数据窗口中查看。Minitab 将创建一个有 13 行数据的新工作表。对于每一行,脉搏 2-脉搏 1 大于 20。,36,操作接口1,按下条件,决定子集条件,37,操作接口2,38,结果,结果就将脉搏 2 脉搏 1 20的一些数据另成一个工作表的档案。,39,拆分工作表,当你想要对某个工作表的内容进行拆分时,可以利用此命令。“销售人员 2.MTW”的拆分为例,如果你想针对四个商店分开其数据,此时可以利用此命令。,40,按商店来拆分数据成四个档案,41,结果,原来的一个档案就被拆分成四个档案,按商店来区分。,42,合并工作表,就是将二个工作表合并成一个工作表。,43,合并工作表,44,45,按列:二边一样的信息并起来,46,47,包括列:是新的工作表要包含那些列,比较常用的一种合并方式,48,复制,其实就是copy,基本上用ctrl+C 和ctrl+V会更方便一些。,49,拆分列,假设您希望查看您在波士顿、丹佛和西雅图的商店的销售数据。要将合并的销售数据拆分成对应每个商店的单独列,请执行下列操作:1打开工作表“销售人员 2.MTW”(Sales2.mtw)2选择数据 拆分列。3在拆分的数据在中,输入销售数据。4在使用的下标在中,输入商店。5在存储拆分的数据下,选择在最后使用的一列之后将拆分的列放在当前工作表的商店列之后。6选中命名包含未堆叠存放数据的列,然后单击确定。注此命令不会在“会话”窗口中产生输出。要查看结果,请在数据窗口中查看。数据窗口,50,操作接口,51,拆分结果,52,堆栈,假定您积累了丹佛、波士顿和西雅图商店的季度销售数据。现在,您要堆叠销售数据的区组。1打开工作表“销售人员.MTW”。(Sales.mtw)2选择数据 堆叠 列的区组。3在将两个或以上的列区组互相在顶部堆叠中,在第一个框内输入丹佛季度,在第二个框内输入波士顿季度,在第三个框内输入西雅图季度。4选择当前工作表的列,然后输入销售季度?以指出新堆叠数据的存储位置。5在将下标存储在中,输入商店 以标识将包含下标的列。6选中在下标列中使用变量名,然后单击确定。注此命令不会在“会话”窗口中产生输出。要查看结果,请在“数据”窗口中查看。,53,操作接口,54,结果,55,转置列的示例-将列转换为行,假设您正在根据体操课上学生所进行的体操项目的相关数据进行分析。当前数据按学生排列在列中,但您需要按照您的学生所做体操项目的类型重新排列这些列。1打开工作表“练习.MTW”。2选择数据 转置列。3在转置以下列中,输入 Lyn?Bill?Sam?Marie。4在存储转置下,选择在最后使用的一列之后。5在使用列创建变量名中,输入任务。单击确定。,56,操作方式,57,转置后的结果,58,排序的做法,1 将下列数据输入到一个新工作表中:C1:2 3 1 4 5C2:10 11 12 13 142 选择数据 排序。3在需排序的列中,输入 C1 C2。4在第一个按列中,输入 C1。5在将排序数据存储在中,选择当前工作表的列,然后输入 C3 C4。单击确定。注此命令不会在“会话”窗口中产生输出。要查看结果,请在数据窗口中查看。数据窗口解释结果C1 和 C2 包含原始数据;C3 和 C4 包含按 C1 排序的数据(以升序排列)。,59,操作接口,60,排序的结果,C1,C2是原始数据,C3,C4是排序完的结果,61,排秩,以下是将排秩分值分配给列中的值的说明。1打开工作表“市场数据.MTW”。(market.mtw)2选择数据 排秩。3在排秩数据在中,输入销售人员。4在将秩存储在中,输入排秩。单击确定。注此命令不会在“会话”窗口中产生输出。要查看结果,请在数据窗口中查看。数据窗口针对“销售人员”的排秩分配存储在新列“排秩”中。,62,操作接口,63,结果,64,删除行、删除变量,此选项建议直接利用del键可能会更直观一些。,65,编码的应用,66,编码的应用,67,数据编码,假设您有一个班级的学生的平均成绩等级(从 0 到 100),您希望将数字平均成绩编码为字母等级 A、B、C、D 和 F。1将下列数据输入到新工作表中的一列中:91 92 77 83 95 69 78 85 81 88?2在列名称单元格中,输入平均成绩。3选择数据 编码 数字到文本。4在列中的编码数据中,输入平均成绩。5在在列中存储编码数据中,输入字母等级。6在第一个原始值框中,输入 91:100,在第一个新值框中,输入 A。在第二行中,输入 81:90 和 B。在第三行中,输入 71:80 和 C。在第四行中,输入 61:70 和 D。在第五行中,输入 0:60 和 F。单击确定。,68,操作接口,69,编码结果,70,更改数据类型,Minitab和excel一样,都有不同的数据类型,最典型的有文本类型和数据类型。而一般只有数据类型才能进行计算。所以有时我们需要更改数据类型。,71,更改数据类型,如此之下就可以将文字的类型改成数据的类型,72,从日期提取到文本,假设您希望从名称为“日期”的一列中提取数据(如下所示)。1选择数据 从日期/时间提取 到文本。2在从日期/时间列提取中,输入日期。在将文本列存储在中,输入 季度年。3选中季度和年。在年的下方,选择两位数。单击确定。注此命令不会在“会话”窗口中产生输出。要查看结果,请在数据窗口中查看。数据窗口C1-DC2-T日期季度年C1 包含原始数据。C2 包含新列季度年。,73,操作接口,74,结果,75,合并,合并两个文本列的示例假设您已经创建了一个工作表,其中包含有班级中学生的特定数据。学生的姓名当前分布在两列中-姓氏和名字-但您希望将每位学生的完整姓名显示在一列中。1打开工作表“学生.MTW”。(student.mtw)2选择数据 合并。3在合并文本列中,输入名字和姓氏。4在将结果存储在中,输入学生。单击确定。,76,操作接口,77,合并结果,78,计算,涂顺章,79,计算的功能,计算器行统计量列统计量标准化,80,计算器,81,计算器示例,设定公式以自动计算历时时间的示例假设某家书店要跟踪从收到在线订单到从仓库发出图书所经历的时间。他们为工作表中的一列设定了一个公式,以便在添加新的订单日期和发运日期时,让 Minitab 自动计算历时时间。1打开工作表“订单.MTW”。2在列标题 C4 下的单元格中,键入历时天数。3单击列标题 C4 以选定该列。选择编辑器 公式 对列设定公式。4在表达式中,输入 C3-C2。单击确定。5选择编辑器 公式,确保已选中“自动计算所有公式”。如果未选中该项,请选中它。?6在列 C2 与行 12 的交叉处,输入日期 10-18-2005。在列 c3 与行 12 的交叉处,输入日期 10-21-2005。,82,操作接口,83,结果,84,列统计量,85,行统计量,86,标准化,87,产生模板化数据简单数集,简单示例要使用菜单创建名称为 ID、包含数字 1、2、3、.、100 的一列,请执行下列步骤:1选择计算 产生模板化数据 简单数集。2在将模板数据存储在中,输入 ID。3在从第一个值中,输入 1。在至最后一个值中,输入 100。单击确定。,88,产生模板化数据简单数集,89,任意数集,90,文本值,91,日期时间的简单数集,92,产生网格数据,计算 产生网格数据创建正规(x,y)网格 以用作等值线图 和 3D 曲面和线框图 的数据输入,同时带有使用函数创建 z 变量的选项。使用“产生网格数据”最简单的方法是指定 X 和 Y 列,并使用这些列的默认设置。如果还没有 z 列,可指定该列,并从提供的函数列表中选择所需函数。对话框项产生 X 和 Y 网格变量:7 到 15 个点之间的网格为等值线图、曲面图和线框图提供了性能和分辨率的良好结合。X:这些设置允许您指定网格的 x 位置。存储在:为生成的 x 值输入一个存储列。从:输入起始 x 值。至:输入结束 x 值。位置数:最多可以指定 101 个位置。位置越多网格越精细,但绘图的时间也越长。Y:这些设置允许您指定网格的 y 位置。存储在:为生成的 y 值输入一个存储列。从:输入起始 y 值。至:输入结束 y 值。位置数:最多可以指定 101 个位置。位置越多网格越精细,但绘图的时间也越长。Z 作为 X 和 Y 的一个函数的可选计算将 Z 变量存储在:为生成的 z 值输入一个存储列。使用函数示例:用于选择一个函数示例。如果使用由此对话框生成的 x、y 和 z 值创建一个 3D 图形,该图形看起来好像是选择了任何一个函数。请参见示例函数和参数。使用函数编号:选择该项可使用已添加到 MACROS 文件夹下的 USERFUNC.MAC 文件中的您自己的函数。请参见创建您自己的函数。函数参数(可选):为所选的函数输入自定义参数,用空格分隔。请参见示例函数和参,93,操作接口,94,立体图形,95,指示变量,您正在执行公司日销售额数据的回归分析。根据您对市场的了解,您决定在模型中包括季节,这是一个类别变量。季节有四个不同的类别:春季、夏季、秋季和冬季。为了在回归模型中包括类别信息,必须首先创建指示变量。1 打开“季节性销售.MTW”。Sales2.mtw2 选择计算 产生指示变量。3 在需要指示变量的列中,选择季节。4 在将指示变量存储于列中,查看表格中的可区分值和默认的指示变量名称。5 单击确定。注产生指示变量功能不会在“会话”窗口中产生输出。?而是将列存储在工作表中。,96,操作接口,97,结果,解释结果Minitab 创建了四个指示变量,因为季节有四个可区分类别。对于每个观测值(行),如果为真则 Minitab 存储值 1,如果为假则存储值 0。对于季节销售数据的示例,Minitab 将创建变量“季节_春季”,并在每个春季观测值的行中存储值 1,在所有非春季观测值的行中存储值 0。剩余季节将重复这一过程。下面是一个样本。?周期季节_春季季节_夏季季节_秋季季节_冬季春季1000夏季0100秋季0010冬季0001,98,设置基数,计算 设置基数可以设置 Minitab 的随机数生成元的起始点。当您希望选择相同的随机样本 或多次生成相同的随机数据集合时,该选项十分有用。Minitab 有一长串可用的随机数。如果 Minitab 始终从列表的开头开始,您将始终得到相同的数据。为避免出现这一情况,Minitab 使用当天的时间(精确到秒或小数秒)来选择字符串中的“随机”起始点。设置基数可以告诉随机数生成元在何处开始。生成元将从其停止的点处继续读取,除非指定一个新的基数。要每次都生成完全相同的随机数集合,可在每次选择随机样本或生成随机数据时设置相同的基数。注如果在不同的平台上或不同版本的 Minitab 上使用相同的基数,则可能得不到相同的随机数序列。对话框项将随机数据生成元的基数设置为:输入希望指定为随机数序列的开始的整数。?,99,随机数据,随机是minitab依据各项的统计分析来产生随机数据,可以在教学上使用或则在模拟上使用。这在后面的课堂上会陆续使用到再进行一些说明。,100,例如要产生随机的正态分布,101,概率分布,是用来计算各项统计分布的概率密度累积概率逆累积概率的,102,编辑器,103,转到,104,修改数字格式,105,列设定列宽,106,列可以补充列说明,107,列可以取除隐藏列,108,可以设定列的宽度,109,可以对某一column设定公式,110,工具,111,选项,112,文件安全性,可以针对project来设定好相应的密码,以及是否为只读。,113,窗口,114,窗口,115,Minitab的SPC使用,116,Minitab可提供的图形,计量型Xbar-RXbar-sI-MRI-MR-sZ-MR,计数型PNpCU,117,Xbar-R做法,Xbar-R是用于计量型判稳准则:连续二十五点没有超出控制界限。判异准则:一点超出控制界限连续六点上升或下降或在同一侧不呈正态分布,大部份点子没有集中在中心线。,118,Xbar-R做法,决定要研究或控制的Y或X特性,收集数据,输入minitab中,用minitab绘图及分析,判定及采取措施,119,Xbar-R练习,打开下列档案,Select:Stat Control Chart Variables Charts for subgroup Xbar-R,120,输入参数,根据不同的输入方式选择不同的分析方法,若数据输入在一列中,则确定出每组的样本数,121,决定控制用控制图的控制界限,输入稳定条件下的平均值和标准差,即确定出控制用控制图的控制界限。,122,Xbar-R Options选项,可以在这里选择判异准则,123,Box-Cox正态转换,进行正态性转换,124,Storage项,输出数据的平均值和标准差,125,图形输出,126,判图,请判定前图是否有异常请问本图为解析用图或是控制用图,127,Xbar-s做法,决定要研究或控制的Y或X特性,收集数据,输入minitab中,用minitab绘图及分析,判定及采取措施,128,Xbar-s练习,打开下列档案Select:Stat Control Chart Variables Charts for subgroup Xbar-s,129,输入参数,解释与Xbar-R图相同,130,图形输出,131,判图,请判定前图是否有异常请问本图为解析用图或是控制用图,132,I-MR图做法,决定要研究或控制的Y或X特性,收集数据,输入minitab中,用minitab绘图及分析,判定及采取措施,133,I-MR练习,打开下列档案,用其来进行I-MR图练习Select:Stat Control Chart Variables Charts for individuals I-MR,134,输入参数,输入变量,135,控制用控制图的控制界限,如果是控制用控制图请输入数据,136,图形输出,137,判图,请判定前图是否有异常请问本图为解析用图或是控制用图,138,p图做法,决定要研究或控制的Y特性,收集数据,输入minitab中,用minitab绘图及分析,判定及采取措施,139,p练习,P图只能适用在二项分布的质量特性性。在做p图时,要注意其样本数必须达到1/p5/p,如此之下的图才比较具有意义。,140,输入数据,请打开数据文档Select:Stat Control Chart Attributes Charts P,141,输入参数,输入样本数,输入变量,142,决定判异准则,选择判异准则计数型的判异准则与计量型的不太一样,143,保存P值,保存根据数据计算所得到的总的不良率,144,图形输出,145,np图做法,决定要研究或控制的Y特性,收集数据,输入minitab中,用minitab绘图及分析,判定及采取措施,146,np练习,np图只能适用在二项分布的质量特性性。在做np图时,要注意其样本数必须达到1/p5/p,如此之下的图才比较具有意义。Np图要求的每组的样本数必须是一样的。,147,输入数据,请打开数据文档 Select:Stat Control Chart Attributes Charts NP,148,输入参数,输入样本数,输入变量,149,图形输出,150,c图做法,决定要研究或控制的Y特性,收集数据,输入minitab中,用minitab绘图及分析,判定及采取措施,151,C图练习,c图只能适用在卜氏分布的质量特性上。在做c图时,要注意其样本数必须达到取样时至少包含一个缺陷以上,如此之下的图才比较具有意义。另外就是基本上c图的样本要一定才可以。如果样本数不一样,则应当使用u图。,152,输入数据,请打开数据文档Select:Stat Control Chart Attributes Charts C,153,输入参数,输入变量,154,决定判异准则,判异准则同P图一样,155,图形输出,156,u图做法,决定要研究或控制的Y特性,收集数据,输入minitab中,用minitab绘图及分析,判定及采取措施,157,u图练习,u图只能适用在卜氏分布的质量特性上。在做u图时,要注意其样本数必须达到取样时至少包含一个缺陷以上,如此之下的图才比较具有意义。,158,输入数据,请打开数据文档 Select:Stat Control Chart Attributes Charts U,159,输入参数,输入变量,输入样本量,160,图形输出,161,MINITAB之制程能力分析,162,制程能力之分类,计量型(基于正态分布),计数型(基于二项分布),计数型(基于卜氏项分布),163,MINITAB 能力分析的选项(计量型),Capability Analysis(Normal)Capability Analysis(Between/Within)Capability Analysis(Weibull)Capability Sixpack(Normal)Capability Sixpack(Between/Within)Capability Sixpack(Weibull),164,Capability Analysis(Normal),该命令会划出带理论正态曲线的直方图,这可直观评估数据的正态性。输出报告中还包含过程能力统计表,包括子组内和总体能力统计。,165,Capability Analysis(Between/Within),该命令会划出带理论正态曲线的直方图,可以直观评估数据的正态性。该命令适用于子组间存在较大变差的场合。输出报告中还包含过程能力统计表,包括子组间子组内和总体能力统计。,166,Capability Analysis(Weibull),该命会会划出带韦伯曲线的直方图,这可直观评估数据是否服从韦伯分布。输出报告中还包含总体过程总能力统计,167,制程能力分析做法,决定Y特性,收集Y特性数据,输入MINITAB数据表,进行分析,结果说明,168,STEP1决定Y特性,决定Y特性,收集Y特性数据,输入MINITAB数据表,进行分析,结果说明,Y特性一般是指客户所关心所重视的特性。Y要先能量化,尽量以定量数据为主。Y要事先了解其规格界限,是单边规格,还是双边规格。目标值是在中心,或则不在中心测量系统的分析要先做好。,169,STEP2决定Y特性,决定Y特性,收集Y特性数据,输入MINITAB数据表,进行分析,结果说明,在收集Y特性时要注意层别和分组。各项的数据要按时间顺序做好相应的整理,170,STEP3决定Y特性,决定Y特性,收集Y特性数据,输入MINITAB数据表,进行分析,结果说明,将数据输入MINTAB中,或则在EXCEL中都可以。,171,STEP4决定Y特性,決定Y特性,收集Y特性數據,輸入MINITAB數據表,進行分析,結果說明,利用MINITABSTATQUALITY TOOLCAPABILITY ANALYSIS NORMAL,172,STEP5决定Y特性,決定Y特性,收集Y特性數據,輸入MINITAB數據表,進行分析,結果說明,利用MINITAB的各项图形来进行结果说明,173,练习,174,输入数据,注意输入方式,Select:Stat Quality Tools Capabilty AnalysisNormal,175,输入选项,输入上下规格界限,根据不同的数据输入方式选择分析方法,176,选择标准差的估计方法,一般选择复合的标准差估计方式,177,选项的输入,如果需要计算Cpm则需要输入目标值,过程能力表现形式的选择,178,以Cpk,Ppk结果的输出,179,以Zbench方式输出,180,结果说明,请学员按此图形来说明该制程状况,181,Capability Analysis(Between/Within),182,Capability Analysis(Weibull),此项的分析是用在当制程不是呈现正态分布时所使用。因为如果制程不是正态分布硬用正态分布来分析时,容易产生误差,所以此时可以使用韦氏分布来进行分析,会更贴近真实现像。,183,练习,请使用同前之数据来进行分析。上规格:103下规格:97规格中心:100,184,输入相关参数,Select:Stat Quality Tools Capabilty Analysis Nonnormal,185,填入选项要求,韦氏分布的参数估计,186,结果图形,187,正态分布适用性的判定,可以使用Statbasic statisticnormality test但数据要放到同一个column中,所以必须针对前面的数据进行一下处理,188,数据调整,进行数据的堆积,189,填写选项,输入变量,输入作为参考的概率线,190,结果输出,191,结果输出(加标0.5概率),192,计量型制程能力分析总结,一般的正态分布使用Capability Analysis(Normal)如果是正态分布且其组内和组间差异较大时可用Capability Analysis(Between/Within)当非正态分布时则可以使用Capability Analysis(Weibull),193,二项分布制程能力分析,二项分布只适合用在好,不好过,不过好,坏不可以用在0,1,2,3等二项以的选择,此种状况必须使用卜氏分布。,194,示例,数据在excel档案中Select:Stat Quality Tools Capabilty Analysis Binomial,195,填好各项的参数,输入样本数,输入历史的不良率,196,选好控制图的判异准则,197,结果及输出,198,卜氏分布制程能力分析,卜分布只适合用在计数型,有二个以上的选择时例如可以用在外观检验,但非关键项部份0,1,2,3等二项以的选择,此种状况必须使用卜氏分布。,199,示例,数据在excel档案中,Select:Stat Quality Tools Capabilty Analysis Poisson,200,填好各项的参数,201,结果及输出,202,基 础 统 计,203,描述性统计,一些参加统计学课程的学生做了一个简单的试验。每个学生被要求记录下自己的每分钟脉搏跳动次数。下面我们对他们脉搏跳动的数据进行简单的分析。,204,描述性统计,1Open the worksheet PULSE.MTW.2Choose Stat Basic Statistics Graphical Summary.3In Variables,enter Pulse1.Click OK.,205,结果输出,206,Z检验,例 某零件,其厚度在正常生产下服从N(0.13,0.0152)。某日在生产的产品中抽查了10次,其观测值为:0.112,0.130,0.129,0.152,0.138,0.118,0.151,0.128,0.158,0.142。发现平均厚度已稍增大至0.136,如果标准差不变,试问生产是否正常?(取0.05),207,Z检验,H0:0.13,H1:0.13 由于已知,故用z检验由MINITAB计算,StatBasic Statistics1 Sample Z,Test of mu=0.13 vs not=0.13The assumed standard deviation=0.015Variable N Mean StDev SE Mean 95%CI Z P C1 10 0.135800 0.015106 0.004743(0.126503,0.145097)1.22 0.221,208,t检验,例 某宾馆六西格玛团队评定某项服务的等级,最大可能的级别为10。团队规定服务等级的总体均值“达到7”的服务项目可以接受,总体均值“超过7”的认为有提高。随机调查12位顾客,要求他们对此项服务评定等级,得到12个级别数据为:7,8,10,8,6,9,6,7,7,8,9和8。假设总体级别近似服从正态分布,在显著性水平0.05的情况下,问服务项目确实比规定可接受标准有提高吗?,209,t检验,建立假设 H0:7,H1:7未知,且n7是小样本,故选用 t 检验。下面是MINITAB软件计算的结果:,Test of mu=7 vs 7 Variable N Mean StDev SE Mean 95%Lower Bound T P C1 12 7.75000 1.21543 0.35086 7.11989 2.14 0.028,210,1P检验,例 某厂规定产品必须经过检验合格后才能出厂,某不合格品率p0不得超过5。现从一批产品中随机抽取50个进行检验,发现有4个不合格品,问该批产品能否出厂?(取0.05),211,1P检验,用MINITAB软件计算,StatBasic Statistics1 Proportion,Test and CI for One Proportion Test of p=0.05 vs p 0.05 Sample X N Sample p 95%Lower Bound Exact P-Value 1 4 50 0.080000 0.027788 0.240,212,2P检验,例 用A与B两种不同的方法制造某种零件,从各自制造的零件中分别随机抽取100个,其中A有10个废品,B有3个废品。在0.05水平上,能否认为废品率与方法有关?,213,2P检验,用MINITAB软件计算,StatBasic Statistics2 Proportion,Test and CI for Two Proportions Sample X N Sample p 1 10 100 0.100000 2 3 100 0.030000Difference=p(1)-p(2)Estimate for difference:0.0795%CI for difference:(0.00235994,0.137640)Test for difference=0(vs not=0):Z=2.03 P-Value=0.043,214,标准差的检验,例 在改革工艺前后,各测量了若干钢条的抗剪强度,数据如下:改革后:525,531,518,533,546,524,521,533,545,540 改革前:521,525,533,525,517,514,526,519 设改革后钢条的抗剪强度,改革前为 问:可以认为改革工艺后钢条的抗剪强度标准差有改变吗?,215,标准差的检验,设 用MINITAB软件,StatBasic Statistics2 Variances,216,單因子變異數分析,涂順章,217,例題,您设计了一项试验来评估四种试验性地毯产品的耐用性。您将这些地毯产品中每种的一个样本分别铺在四个家庭,并在 60 天后测量其耐用性。由于您要检验平均值是否相等并评估平均值之间的差异,因此您使用包含多重比较的单因子方差分析过程(堆叠形式的数据)。通常,您会选择适用于数据的一种多重比较方法。但是,此处选择了两种方法来展示 Minitab 的功能,218,操作步驟,1打开工作表“方差分析示例.MTW”。Exh_aov.mtw2选择统计 方差分析 单因子。3在响应中,输入耐用性。在因子中,输入地毯。4单击比较。选中 Tukey,全族误差率。选中许氏 MCB,全族误差率并输入 10。5 在每个对话框中单击确定。,219,操作方法,220,按下多重比較以及圖形,221,輸出結果,One-way ANOVA:Durability versus Carpet Source DF SS MS F PCarpet 3 146.4 48.8 3.58 0.047Error 12 163.5 13.6Total 15 309.9S=3.691 R-Sq=47.24%R-Sq(adj)=34.05%Individual 95%CIs For Mean Based on Pooled StDevLevel N Mean StDev-+-+-+-+1 4 14.483 3.157(-*-)2 4 9.735 3.566(-*-)3 4 12.808 1.506(-*-)4 4 18.115 5.435(-*-)-+-+-+-+10.0 15.0 20.0 25.0Pooled StDev=3.691,222,許氏比較結果,Hsus MCB(Multiple Comparisons with the Best)Family error rate=0.05Critical value=2.29Intervals for level mean minus largest of other level meansLevel Lower Center Upper-+-+-+-+-1-9.602-3.632 2.337(-*-)2-14.350-8.380 0.000(-*-)3-11.277-5.308 0.662(-*-)4-2.337 3.632 9.602(-*-)-+-+-+-+-12.0-6.0 0.0 6.0,223,Turkey比較結果,Tukey 95%Simultaneous Confidence IntervalsAll Pairwise Comparisons among Levels of CarpetIndividual confidence level=98.83%Carpet=1 subtracted from:Carpet Lower Center Upper-+-+-+-+-2-12.498-4.748 3.003(-*-)3-9.426-1.675 6.076(-*-)4-4.118 3.632 11.383(-*-)-+-+-+-+-10 0 10 20Carpet=2 subtracted from:Carpet Lower Center Upper-+-+-+-+-3-4.678 3.073 10.823(-*-)4 0.629 8.380 16.131(-*-)-+-+-+-+-10 0 10 20Carpet=3 subtracted from:Carpet Lower Center Upper-+-+-+-+-4-2.443 5.308 13.058(-*-)-+-+-+-+-10 0 10 20,224,圖形,225,結果說明,在方差分析表 中,地毯的 p 值(0.047)表明,有足够证据证明,当 alpha 设置为 0.05 时,并非所有平均值都相等。要研究平均值之间的差异,请检查多重比较结果。许氏 MCB 比较许氏 MCB(与最佳值的多重比较)是将每个平均值与其他平均值中的最佳值(最大值)进行比较。Minitab 会将地毯 1、2、3 的平均值与地毯 4 的平均值进行比较,因为地毯 4 的平均值最大。地毯 1 或 4 可能是最佳的,因为对应的置信区间 包含正值。没有证据表明地毯 2 或 3 是最佳的,因为上区间端点为 0,这是最小的可能值。注通过检查上下置信区间,可以说明任意最佳角逐者的潜在优势或不足。例如,如果地毯 1 是最佳的,则它优于与其最接近的竞争者的程度不会超过 1.246,它劣于其他水平平均值中最佳者的程度可能达到 8.511。,226,Tukey 比较,Tukey 检验提供了 3 组多重比较置信区间:地毯 1 平均值减自地毯 2、3、4 平均值:第一组 Tukey 输出的第一个区间(-12.498,-4.748,3.003)给出了减自地毯 2 平均值的地毯 1 平均值的置信区间。通过颠倒区间值的顺序和符号,可以轻松找到未包括在输出中的项的置信区间。例如,地毯 1 的平均值减地毯 2 的平均值的置信区间为(-3.003,4.748,12.498)。对于此组比较,由于所有置信区间都包括 0,因此没有任何平均值在统计意义上不同。地毯 2 平均值减自地毯 3 和 4 平均值:地毯 2 和 4 平均值在统计意义上不同,因为此平均值组合的置信区间(0.629,8.380,16.131)不包括零。地毯 3 平均值减自地毯 4 平均值:地毯 3 和 4 不存在统计意义上的不同,因为置信区间包括 0。通过不将 F 检验作为条件,在全族误差率 为 0.10 时,处理平均值