SPC数理统计基础知识.ppt
1,SPC数理统计基础知识,I dont know everything,but I know a solution for everything.,2,課程大綱:,第一讲、概述1、数据及其相关概念2、数理统计的有关概念,第二讲、数据的整理和分析1、数据的离散性和规律性2、数据的特征值3、数据的频数分布和直方图,3,課程大綱:,第三讲、质量变异的规律性分析 1、概率分布2、正态分布3、中心极限定理3、二项分布和泊松分布,第四讲、过程控制和统计过程控制1、SPC和SPCD2、过程能力及过程能力指数3、过程能力指数与不合格品率4、影响过程能力的因素及其要求5、过程分析方法,4,SPC的数理统计基础知识,第一讲:概 述,要点:,数理统计的有关概念,5,数据及其相关概念,一、数据的分类,数据大体可以分为两大类:计量型数据和计数型数据。,计量数据(连续型数据):是指连续测量所得的质量特性值,如:长度、重量、强度、化学成分、时间、电阻等,6,数据及其相关概念,计数型数据(非连续型数据):是指按个数数得的非连续性取值的质量特性值,以上控制图适用计数值,,1,2,3,4,1,2,如:不合格品数、缺陷数及事故的件数,如:满意的和不满意的人数,如:瓷砖中的斑点数,7,数据及其相关概念,二、数据的要求,1、针对性2、完整性3、准确性4、及时性5、连续性6、统一性,8,数据及其相关概念,三、异常数字的判定和剔除,即使是在同样生产条件下的一组数据,其中的个别数据也可能是“不合群”的,即不符合这组数据应遵循的固有分布规律。一般而言,一组数据中最大值或最小值成为异常数据的可能性最大,判为正常数据的风险也最大。异常值来源:测量仪器不正常,测量环境偏离正常值较大,计算机出错,看错,读错,抄错,算错,转移错误。,9,数据及其相关概念,判定和剔除异常数据的方法有多种,这里我们仅介绍一种简单的方法-格拉布斯法。,下表是格拉布斯检验简表。表中给出了不同的第一类错判概率(=0.05,0.25,0.01)下的剔除标准。,10,数据及其相关概念,表中的n为相同条件下抽取的样本数,T为第一类错判率值下的剔除标准。该表的使用前提是数据服从正态分布。例1:为验证某批铸件质量,抽查了9件铸件,测得零件重量与该类零件的标准重量的差别分别为(单位g)6.95,7.20,7.25,7.40,7.46,7.52,7.60,7.80,8.47;试检验上述数据有无异常(取=0.05),11,数据及其相关概念,解:(1)用Minitab进行正态性检验,P 0.05,数据符合符合正态分布,12,数据及其相关概念,(2)将数据由小到大排列;(3)计算数据的平均值和标准差:,(4)从两头数据进行检验,对n个数中的最大值X n和最小值X1,为此需计算统计量:,13,数据及其相关概念,注意:在 X n和X1中,首先应从这两个数据与相邻两个数据中差异最大的开始检验,这里,(4)将统计量 T 与 T 进行比较,如果T T 则判为异常,应予以剔除。,X n-X n-1=8.47-7.80=0.6;,T n=(8.47-7.52)/0.439=2.19;,T1=(7.52-6.95)/0.434=1.31.,X 2-X1=7.20-6.95=0.25。,故应先检验X n,(为便于比较,最小数据也一并检验),将相关数据代入,得,14,数据及其相关概念,为此查表得,当=0.05,n=9时,T=2.11,,剔除 X n 异常后,重新计算余下的8个数的平均值、标准差和统计量 T n-1,依次按上述步骤对 X n-1、X n-2、各数据进行检验,直到无异常数据为止。,因为 T n=2.192.11,X1=6.95应予以保留。,T1=1.312.11,.,故X n=8.47为异常,应剔除;,15,数据及其相关概念,这里教大家一种比较简单的判别方法(用Minitab),此点为异常点,16,数据及其相关概念,移掉异常点后对剩余数据做箱型图:无新的异常点,17,第一讲:概 述,二、数理统计的有关概念,18,数理统计的有关概念,一、数理统计与统计技术,统计技术主要是指“数理统计”,它是建立在概率论基础上的一门数学分支,统计技术是研究事物变异性及其规律的科学。推断型统计技术:主要解决从样本如何推断总体。概率论和数理统计研究的对象大多属于此类。描述型统计技术;主要是利用数据的特征或有关图表描述事物。,19,数理统计的有关概念,20,数理统计的有关概念,二、总体(Population)/个体(unit)/样本(sample),总体,也叫母体,是研究对象的全体。总体可以是有限的或无限的。个体:组成总体的每一个单位称为个体。样本:从总体中抽取的部分个体称为样本抽样:抽取样本的过程称抽样。,21,数理统计的有关概念,总体,个体,22,数理统计的有关概念,所谓统计推断,就是依据对样本的检测或观察结果去推断总体状况(如下图所示)。,23,数理统计的有关概念,三、生产批与检验批,生产批:过程在受控状态下连续生产的一批产品称为一个生产批。批量:组成一批产品的单位个数称为批量。检验批:待检验的一批产品称为检验批。,一般而言,一个生产批,即为一个检验批。但在某些特殊情况下,如批量过大、生产周期过长、可以将一个生产批划分为若干检验批。但要保证生产过程是稳定的,各检验批之间质量均衡,不可人为地任意划分。,24,数理统计的有关概念,自然界中所观察到的现象有确定性现象和随机现象两种。,注意:为保证检验批的代表性,任何情况下不能将两 个生产批合并为一个检验批。,四、现象,确定现象:在一定条件下必然发生(出现)某一结果的现象称为确定性现象。例如:太如从东边升起;三角形的三个内角之和等于180度;函数在间断点处不存在导数等等。,确定性现象的特征是:条件完全决定结果。,25,数理统计的有关概念,实例3:“抛掷一枚骰子,观察出现的点数”,结果可能为:1,2,3,4,5,6。,随机现象:在一定条件下可能发生这种结果,也可能发生那种结果,即预先不能确定到底发生哪种结果的的现象称为随机现象。,实例1:“在相同条件下掷一枚均匀的硬币,观察正反两面出现的情况”,结果有可能出现正面朝上也可能出现反面朝上。,实例2:“用同一门炮向同一目标发射同一种炮弹多发,观察弹落点的情况”,结果:“弹落点会各不相同”。,26,数理统计的有关概念,实例4:“从一批含有正品和次品的产品中任意抽一件产品”,其结果可能为:正品或次品。,实例5:“刚出生的婴儿可 能是男,也可能是女”。,随机现象的特征:条件不能完全决定结果。,1.、随机现象揭示了条件和结果之间的非确定性联系。,说明:,27,数理统计的有关概念,五、随机试验,2、随机现象在一次观察中出现什么结果具有偶然性,但在大量试验或观察中,这种结果的出现具有一定的统计规律性。,如何来研究随机现象?,随机现象是通过随机试验来研究的。,随机试验:在概率论中,将实现一组条件称为试验。把具有以下三个特征的试验称为随机试验。,28,数理统计的有关概念,1.试验可以在相同的条件下重复地进行;2.试验的可能结果在试验前可以明确知道;3.每次试验总是恰好出现上述结果中的一个,但在试验前不能确定哪一个结果将会出现。,随机试验简称为试验,是一个广泛的术语.它包括各种各样的科学实验,也包括对客观事物进行的“调查”、“观察”、或“测量”等。,29,数理统计的有关概念,例如:,1.抛掷一枚骰子,观察出现的点数。2.从一批产品中,依次任选三件,记录出现正品与次品的件数。3.记录某公共汽车站某日上午某时刻的等车人数。4.考察某地区四月份的平均气温。5.从一批灯泡中任取一只,测试其寿命。,30,数理统计的有关概念,六、随机事件,确定性现象只有两种结果:发生与不发生,它们可以用必然事件和不可能事件来表示。必然事件(对应确定现象):在一定条件下必然发生的结果。如:“三角形的三个内角和等于180度”,“在一批全部是合格品的产品中任抽一件合格品”,都是必然事件。不可能事件(对应确定现象):在一定条件下必然不发生的结果。如:“物体的速度达不到第二宇宙速度(11.2公里/秒),物体成为行星”,“在一批全部是合格品的产品中任抽一件不合格品”,都是不可能事件。,31,数理统计的有关概念,在质量体系运行过程中或产品实现的各个阶段出现的各种现象、状态或结果,在统计技术中统称为事件。,随机事件(对应随机现象):随机现象中可能发生也可能不发生的结果称为随机事件,简称事件。例如:一批待检验的产品中,可能有合格品,也可能有不合格品,若从中任意抽取一件合格品的事件,就是随机事件。,统计技术研究的主要是随机事件,简称事件。,32,数理统计的有关概念,频率:随机事件发生的个数(次数)在总观察数中所占的比率称为频率。通常记作 f n。如上例事件若是从总数为100件电发火管中抽取的,则爆破力落在 78.0581.05 间的事件A的频率为 f n(A)=3/100=3%。,七、频数、频率和概率,频数:随机事件在一组数据或多次试验中出现的次数,或不同数据落在某区间的个数称为频数。例如:有3个电发火管的爆破压力落在78.0581.05区间,即压力在 78.0581.05这一随机事件的频数为3。,33,数理统计的有关概念,随机事件在一次试验中可能发生,也可能不发生,具有不确定性,即随机性。然而在大量的试验中,随机事件却呈现出明显的规律性,即所谓的频率稳定性。,频率的稳定性反映了事件发生的可能性的大小。由此看来,事件发生的可能性的大小可以用一个数值来度量。,概率:,一般地,度量随机事件A发生的可能性大小的数值称为事件A的概率,记作P(A)。,34,数理统计的有关概念,频率的稳定性的意义就在于它表明概率的存在,从而使得概率概念在现实世界有其参照物。,概率是频率的稳定值,反之,频率可以认为是概率的近似值,是对概率进行一次测量的结果。,概率应具有下列性质:对于任何事件A,,0 P(A)1,P()=1,P()=0,35,数理统计的有关概念,八、小概率事件,当某一事件发生的概率很小时(通常小于0.05)称小概率事件 著名的英国统计家Ronald Fisher 把20分之1作为标准,这也就是0.05,从此0.05或比0.05小的概率都被认为是小概率,九、几个经典的小概率事件,三国演义中的连环计 金茂大厦辛普森跳伞事件 不可能事件可能转化为小概率事件吗?,36,数理统计的有关概念,条件误差:是指在加工过程是由于人、机、料、法、测、环中一个或多个因素发生变化引起的误差。,正常误差:是指在加工过程受控状态下,由于机床的微小颤动力、材料在合格范围内的不均匀变化等引起的误差。,十、条件误差和正常误差,统计技术的实质就是要区别因误差引起的的数据波动是正常因素引起的还是由条件因素引起的。,由于条件误差对质量影响较大,较易识别,是质量控制的主要对象。而正常误差通常由公差给以保证。,37,第一讲:概 述,The EndThank you very much!,38,SPC的数理统计基础知识,第二讲:数据的整理和分析,要点:,数据的离散性和规律性 数据的特征值 数据的的频数分布表和直方图,39,第二讲:数据的整理和分析,一、数据的离散性和规律性,40,数据的离散性和规律性,电发火管爆破压力试验数据,注:蓝色字体为每班的最小值,红色为最大值。,41,数据的离散性和规律性,从该表中可以看出,在这100个数据中的最大值和最小值可以从表的右边两列中找出:X max=101.7,X min=75.2;,虽然表中的数据提供的信息是有限的,但我们仍可从中看出数据所具有的两个重要特征:离散性和规律性。,1、离散性:与其它产品一样,不管事前如何严格控制,反映产品质量的数据(这里是爆破压力),总是有波动的。,2、规律性:反映爆破压力的数据虽有波动,但这种波动并非是杂乱无章的,而是有一定的规律。,42,第二讲:数据的整理和分析,二、数据的特征值,43,数据的位置特征值,前面所用的表可以用来观察数据波动的大致情况,但不能看到数量方面信息,特别是比较两组以上数据分布时,无法定量地表征它们之间的差别。为了解决这个问题,我们常用两类统计量表征数据。,表示数据位置特征(中心趋向)的值有平均值、中位数、中值和众数等。,一、数据的位置特征值,1、平均值,如果从总体中抽取的一个样本数据为 X1,X2,Xn 则样本平均值为,44,数据的位置特征值,2、中位数X,有时,为了减少计算,将数据 X1,X2,Xn 按从大到小次序排列,用位居于正中的那个数或中间两个数的平均值(当数据为偶数个时)表示数据的总体平均值水平。,子组中位数的平均值,25.0,25.3,25.4,25.6,25.5,例:,n 5 为奇数,Me25.4,数据为 25.0,25.4,25.5,25.6,时,n 4 为偶数,45,数据的位置特征值,3、中值M,测定值中的最大值 X max 与最小值 X min 的平均值,用M表示。,M=(X max+X min)/2,上表中的数据的中值为:M=(101.7+75.2)/2=88.45.,4、众数,在用频数分布表表示测定值时,频数最多的值即为众数。若测定值按区间做频数分布时,频数最多的区间代表值(一般用区间中值)亦称众数。,46,数据的离散特征值,二、数据的离散特征值,为什么要研究数据的离散程度?,示例,如果你想过河,有人只告诉你河的平均深度是2米,你是否还想知道它的变化范围,如:07米。,47,数据的离散特征值,注:通常,极差用于测定个数 n 小于10的场合,当 n 大于10时,一般用标准偏差 s 表示离散程度。,1、极差 R,测定值中的最大值 X max 与最小值 X min 之差,用R表示。,R=Xmax-Xmin,偏差:各个测定值X i 与平均值 X 之差称为偏差。,2、偏差平方和 S,48,数据的特征值,则,3、无偏方差 s2,偏差平方和 S:各个测定值的偏差的平方和称为偏差平方和,简称平方和,用 S 表示。,设各个测定值为 X1,X2,Xn,其平均值为,各个测定值的偏差平方和除以(n-1)后所得的值称为无偏方差(简称方差),用 s2 表示。,49,数据的特征值,s 标准差计算公式,25.0,25.3,25.4,25.6,25.5,例:,0.2302,4、标准偏差 s,50,第二讲:数据的整理和分析,三、数据的频数分布和直方图,51,数据的的频数分布表和直方图,一、数据的频数分布表,为进一步挖掘数据的有用信息,仍以发管爆破压力的100个数据为例,讲解频数分布表的步骤:,1、计算数据的变化范围(极差),2、根据样本 n 的大小,按下表确定组数。这是K=9。,R=101.9-75.2=26.5,52,数据的的频数分布表和直方图,3、计算组距 h h=R/K=2.94,为了计算方便,将组距舍入到最小测量单位的整数倍,本例取 h=3.0.,4、确定边界值,为避免数据落在边界上,并使最小值落在第一组内,故取第一组的下限等于最小值减去最小测量单位的一半(本例即0.1/2=0.05),于是,第一组的下限=75.2-0.05=75.15;第一组的上限=第一组的下限+组距=75.15+3=78.15;其余各组依此类推。,53,数据的的频数分布表和直方图,5、为统计方便,可采用唱票法,将数统计在对应区间,即作出频数分布表(如下表),54,数据的的频数分布表和直方图,二、频数直方图,为更加直观,可以用频数直方图代替频数分布表,频数直方图是频数分布表的图示形式。频数直方图是在频数分布表基础上作出的。作法如下:,以各组边界值画横轴,纵轴为频数,画出以组距 h为宽,频数 n i 为高的一个个直方,即为直方图。,55,数据的的频数分布表和直方图,三、频率直方图,频率直方图的的基本作法与频数直方图相同,只是纵轴以频率取代频数,其图形的形状不变。,频率直方图可帮助我们分析数据在每一组中所占比例的变化情况。,56,数据的的频数分布表和直方图,四、利用直方图对过程进行分析,如果随机从同一生产条件下再抽100件产品,虽然各组的频数(或频率)不尽相同,但直方图的图形大致相同。如两个直方图差异很大,则应怀疑生产条件有可能变化。,由于直方图作法简单,且又形象、直观,在企业中应用广泛。有些外企在采购产品时,不仅要求供方出具产品的合格证明,而且要求提供能反映质量变异情况的直方图。,下图是过程控制中常见的几种直方图,常因产品类别、设备、加工方法等不同而有异,以下分析仅供参考。,57,数据的的频数分布表和直方图,a.正常型:特点是中间高、两边低、左右基本对称。这是数据服从正态分布的特征,也是大多数产品质量特性所具有的图形。,b.偏向型:特点也是中间高、两边低、但高峰偏向一侧,形成不对称形状。,这种情况可能是人为有意识对过程进行干涉造成的。如机加工中孔的尺寸往往偏下限,而轴的尺寸偏上限。,58,数据的的频数分布表和直方图,c.双峰型:特点是有两个高峰。这往往由于来自两个总体的数据混在一起所致,如两个工人加工的产品混在一起。,d.孤岛型:在远离主分布的地方出现一个小直方形,有如一个孤岛。这可能是由于过程在有一个时期产生了过程条件的较明显变化,如原材料混杂、操作疏忽等。,59,数据的的频数分布表和直方图,e.低峰型:可能由于过程中某种倾向性因素缓慢作用所致。,f.高峰型:可能数据已经过筛选。,g.锯齿型:特点是直方图内各直方高低参差不齐。其原因可能是直方图分组不当(过多)或测量误差过大而所致。,60,第二讲:数据的整理和分析,The EndThank you very much!,61,SPC的数理统计基础知识,第三讲:质量变异的规律性分析,要点:,概率分布 正态分布 中心极限定理 二项分布和泊松分布,62,第三讲:质量变异的规律性分析,一、概率分布,63,概率分布,概率分布是将变量在总体中的取值与其发生的概率二者相联系的数字模型。概率分布有两种类型:连续概率分布和离散概率分布。,典型的连续概率分布是正态分布,常见的离散概率分布是二项分布和泊松分布。,64,第三讲:质量变异的规律性分析,二、正态分布(normal distribution),65,正态分布是最常见、应用最广泛的一种分布,当质量特性(随机变量)由为数众多的因素影响,而又没有一个因素起主导作用的情况下,该质量特性的变异分布,一般都服从正态分布。例如,轴径的加工尺寸、化工产品的化学成分、一些电子产品的电参数、测量误差,以及一些自然现象等都属正态分布。,正态分布,一、正态分布特点:,正态分布变量的分布密度曲线形状如下图所示的草帽状:,66,1、曲线最高点的横坐标,称正态分布的均值,用表示,这就意味着随机变量x在 附近出现的概率最大,当x向左右远离时,x出现的概率随分布曲线的降低而迅速下降。,其特点为:,当n,h0时,直方图趋于一条光滑的曲线-分布曲线,正态分布,67,2、曲线以为对称轴,从理论上讲,若将曲线以该轴对折时,两边曲线应重合。,3、如果用数学模式表述正态分布曲线(称正态分布密度函数),则,正态分布,68,4、由密度函数可看出,任一正态分布仅由两个参数,即总体均值 和总体标准差完全确定。亦称分布的位置参数,称分布的形状参数;值越小,曲线越陡,数据(变量)离散也越小;值越大,曲线越扁平,数据的离散也越大。下图给出了标准差 分别为0.5,1和2的三种图形的示意图。,正态分布,69,5、从理论上讲,曲线以横轴为渐近线,亦即横轴的定义域从-到。通过计算(实际上是查表)可得出以下几个在质量管理中常用的结论:,变化的直观意义,正态分布,70,1界限范围内的概率为68.27%;,2界限范围内的概率为95.45%;,3界限范围内的概率为99.73%;,以为基准分布曲线下不同面积所包含的概率,正态分布,71,直方图是用来描述样本特性值的分布的,其均值和标准差分别用 和s表示。概率分布则是描述总体特性值的分布其均值和标准差分别用希腊字母 和来表示。概率分布是将质量特性值(随机变量)在总体中的取值与其发生的概率相联系的数学模型。,正态分布,72,对于一个具有均值为,样准差为的正态分布,通常采用一个专门符号来表示,记作N(,)或N(,2)。,三、标准正态分布:,1、累积正态分布:,正态分布,在质量管理中,常见的连续分布是正态分布。对于计量特性值,如长度、重量、时间、强度、纯度、成分等连续性数据,最常见的是正态分布。,前面讲过累积频率的概念,即从数据最小的直方频率,一直累加到某一指定的直方频率。与此类似,正态分布的累积概率,是指从数据最小(理论上是-)的概率一直累加到某一指定数值c的概率。,73,正态分布的累积概率实质是计算-至数轴上某一指定点(称正态分位点)分布曲线所包含在面积。根据正态密度函数,数据(正态变量)xc的概率为图中阴影部分,亦即:,正态分布,74,为便于应用,可令=0,=1的正态分布为标准正态分布,记作N(0,1)。根据正态分布的密度函数,标准正态分布的密度函数可记为:,2、标准正态分布:,对于一个 0,1的任一正态分布只需作如下变换转化为标准正态分布。即设统计量Z为:,正态分布,75,标准正态分布,76,即将总体中的每一个值减去 并缩小倍。从而使上述积分的计算与 和的具体数值无关。于是,简记为(Z),它是标准正态分布N(0,1)的累积分布函数。,正态分布,77,附表1中的正态分布表是以标准正态分布设计的。该表给出从-4.99 Z4.99范围内的(Z)值。表中的第一列表示Z的整数部分及小数点后第一位,第一行为Z的小数点后第二位值。为便于排版,表中采象031078、938922等写法,分别表示小数点后有3个0或3个9,即0.0001078和0.9998922。,例1、已知发火管爆破压力服从N(89,4.6)的正态分布,试求:(1)x80的概率;(2)x90的概率;,(3)80 x90的概率;(4)x90的概率。,正态分布,78,Z1=(80-89)/4.6=-1.96,查表,当 Z1=-1.96时,得(-1.96)=0.025(也可以在Excel中用函数:Normsdist(-1.96)=0.025),即对于正态变量x服从 N(89,4.6)时,爆破压力小于80的概率为2.5%。,(1)首先,将N(89,4.6)转化为N(0,1)的标准正态分布,即计算统计量Z1:,解:,(2)统计量Z2=(90-89)/4.6=0.22,查表,得(0.22)=0.5871,即压力值低于90的概率近似为59%。,(3)P(80 x90)=(Z2)-(Z1)=0.59-0.025=0.565,正态分布,79,故 P(x90)=1-(Z2)=1-0.59=0.41。也可以用函数(=normsdist(z)来实现,(4)由于,三、样本均值 的分布,统计推断是根据样本统计量(、s 等),去对总体作出判定,若已知总体的概率分布,则通常可以确定由所抽取的样本统计量的概率分布。统计量的概率分布称抽样分布。,可以证明,不论总体分布如何,样本均值 的分布都近似为:,正态分布,80,即,均值不变,而标准差为:,四、正态性检验,直方图虽然很象正态分布,但直方图并非是稳定的,而且利用正态分布解决问题(常直接使用正态分布表),也并非要画直方图。这常需要直接验证数据是否服从正态分布,即所谓的正态性检验问题。数据的正态性检验有多种方法,如X2检验法、偏态、峰态检验法等.,正态分布,81,第三讲:质量变异的规律性分析,三、中心极限定理(Central Limit Theorem),82,中心极限定理,随机变量独立同分布的概念随机变量X1和X2独立,是指X1的取值不影响X2的取值;X2的取值也不影响X1的取值.随机变量X1和X2同分布,是指X1和X2具有相同的分布形状和相同的分布参数.随机变量独立同分布的特性可以推广到3个或更多的随机变量.独立同正态分布随机变量的重要性质,83,中心极限定理,84,中心极限定理,85,中心极限定理,这个定理表明:无论随机变量服从何种分布,可能是离散分布,也能是连续分布,连续分布可能是正态分布,也可能是非正态分布,只要独立同分布随机变量的个数n较大,那么,随机变量之和的分布,随机变量均值的分布都可以近似为正态分布.,86,中心极限定理,中心极限定理是概率论中最著名的结果之一,它不仅提供了计算独立随机变量之和的近似概率的简单方法,而且有助于解释为什么很多自然群体的经验频率呈现出钟形曲线这一值得注意的事实.高尔顿钉板实验高尔顿正态曲线女生的智力分布曲线,87,第三讲:质量变异的规律性分析,四、二项分布和泊松分布(binomial&Poisson distribution),88,一、二项分布(binomial distribution),二项分布和泊松分布,有时,一个事物只有两种可能的状态或结果,例如:一件产品的检验,要么合格,要么不合格;一个待发射的卫星,要么发射成功,要么发射不成功;虫子吃了农药,要么死去,要么活着,等等,二者必居其一。此时,我们都可用二项分布来研究和分析这类问题。,以产品检验为例,虽然结果只有合格与不合格两种情况,但抽到不合格品(或合格)的概率显然决定于该批产品的固有不合格率。如果我们用p和q分别代表不合格率和合格率,则p+q=1,(p+q)n 的展开式也应为1;从而得出,89,第x=r项即n个产品中出现 r 个不合格的概率为:,二项分布和泊松分布,或,写成一般形式为:,二项分布的均值和标准差分别为:,二项分布属离散型分布,其图形由横座标上孤立点的垂直线表示(如图),90,二项分布和泊松分布,二项分布图形随不合格率p 的变化示意图,从图上可看出,当p=0.5时,图形基本对称,当 p=0.250.5时,图形右偏。,91,另一方面,图形与抽取的样本量 n有关,当 n充分大时,二项分布直线顶部的连线趋于对称,近似正态分布。,二项分布和泊松分布,对于计件特性值,如特性测量的结果只有合格与不合格两种情况的离散性数据,最常见是二项分布。,92,二项分布和泊松分布,在抽样检验中,常设定一个合格判定数 c,当样本中出现不合格数 rc 时,该批产品接收,当 rc 时则拒收,此时需要计算当x=0,1,2,c 的概率,即计算x c 的累积概率。,附表七给出了累积二项分布表,表中n为样本数,c为合格判定数,p为不合格品率。,93,例6、在一批不合格品率 p=0.05的精密铸件中(p是长期统计的稳定值),按规定每一工作班,抽取5件,并且被抽的5件铸件不允许有不合格,否则,需分析原因。试计算,这种情况下,铸 件被接收的概率,并用附表七进行验证。,二项分布和泊松分布,解:,根据所给条件,x=c=0 代入,得,查附表七,当p=0.05,n=5,c=0 时的结果与计算完全一样。,94,例7、求上述条件,样本中不合格品数正好为1的接收概率。,二项分布和泊松分布,解:,(1)先从表中查得c 1 的概率为0.9774;,(2)从表中再查出c=0 的概率为0.7738;,(3)两者数值之差即为在被抽5件产品中恰好有一件不合格品的概率:,(P(r=1)=0.9774-0.7738=0.2036。,95,二项分布和泊松分布,二、泊松分布(Poisson distribution),该分布主要描述稀有事件的分布,如纺织品中的疵点、铸件中的气孔、溶液中的杂质等。泊松分布有时也称疵点分布或计点分布。,泊松分布只取正整数和零,且在疵点x 处的概率为:,泊松分布的均值和标准差分别为:,式中的常用样本缺陷数的平均值估计。,96,二项分布和泊松分布,可以证明,当产品不合格率 p 较小(一般小于0.1),样本量 n 较大(一般与总体个数相比大于0.1),可用泊松分布作为二项分布或超几何分布的近似。而且当 n充分大时,泊松分布在每一点上的概率线条顶点的连线图形趋于对称,近似正态分布。,97,二项分布和泊松分布,对于计点特性值,如铸件的沙眼数、布匹上的疵点数、电路板上的焊接不良数等离散性数据,最常见的是泊松分布。,泊松分布的累积概率为:,在满足泊松分布应用条件情况下,在实际应用中,常以不合格品率p和样本数n的乘积代替参数,即np=,并且可从累积泊松分布表(附表八)直接查到。,98,二项分布和泊松分布,例8、已知产品不合格品率p=0.02,样本数n=15,合格判定数 c1,试用查表法(附图七和八)比较两种结果。,解:,先查累积二项分布表得。,P(n=15,p=0.02,c1)=0.9647,为查累积泊松分布表,先估计,,=np=0.03,,P(=0.03,c 1)=0.963。,例9、试比较,当p=0.005,n=20,c1时,二项分布和泊松分布的结论。,99,二项分布和泊松分布,查二项分布表,得,解:,P(20,0.005,1)=0.999,当=00.005*20=0.001时,查泊松分布表,得,可见,当 p很小、n较大时,两种分布的结论完全一致。,P(0.01,1)=0.999,100,第三讲:质量变异的规律性分析,The EndThank you very much!,101,SPC的数理统计基础知识,第四讲:过程控制和统计过程控制,要点:,过程能力及过程能力指数,过程能力指数与不合格品率,影响过程能力因素及其要求,过程分析方法,SPC与SPCD,102,第四讲:过程控制和统计过程控制,一、SPC与SPCD,103,SPC 与SPCD,1、什么是SPC?SPC-Statistical Process Control(统计过程控制),SPC 是1924年由美国贝乐电话实验室的休哈特()首创的含义-利用统计技术对过程中的各个阶段进行监控,从而达到保证产品质量的目的。2、SPC的作用预防:判断过程的异常,及时告警。3、SPC的缺点不能告知异常是由什么因素引起的和发生于何处,即不能进行诊断。,104,SPC 与SPCD,2、什么是SPCD?(新概念)SPCD-Statistical Process Control and Diagnosis(统计过程控制与诊断)含义-利用统计技术对过程中的各个阶段进行监控与诊断,从而达到缩短诊断异常的时间、以便迅速采取纠正措施、减少损失、降低成本、保证产品质量的目的。,105,SPC 与SPCD,3、为什么要学习SPC和SPCD工程(一)?时代的需要:21世纪是质量的世纪,提出超严质量要求,是世界发展的大方向。如电子产品的不合格品率由过去的百分之一、千分之一、降低到百万分之一(ppm,parts per million),乃至十亿分之一(ppb,parts per billion)。科学的要求:要保证产品质量、要满足21世纪超严质量要求就必须应用质量科学。生产控制方式由过去的3控制方式改为6控制方式。3控制方式下的稳态不合格品率为2.7 X 10-3,6控制方式下的稳态不合格品率为2.0 X 10-9后者比前者降低了:2.7 X 10-3/2.0 X 10-9=1.35 X106 即一百三十五万倍!,106,SPC 与SPCD,3控制方式与6控制方式的比较:,107,第四讲:过程控制和统计过程控制,二、过程能力及过程能力指数,108,过程能力及过程能力指数,一、过程能力,过程能力是指当过程处于统计控制养状态,过程符合容差范围的输出能力。一般用特性值散布的6倍标准差(6)衡量。,1、过程能力的应用前提是产品和过程的质量特性值能用数据表征,且处于统计控制状态。统计状态是保证过程稳定的基础,只有在稳定状态下的过程能力才具备再现性,才能发现数据分布的异常,其计算才具有实际意义。,这是需强调:,109,过程能力及过程能力指数,2、所以采用正态分布的6幅度的概率值来度量过程能力,是因为这种散布在理论上是经济和合理的,而且与控制图上、下控制限的幅度相一致。,3、过程能力是过程客观存在的一种固有能力,即过程在一定的人、机、料、法、测、环(5M1E)条件下所具有的能力。生产条件发生变化,过程能力也会发生变化。过程能力是5M1E的综合结果。,二、过程能力指数,过程能力指数:通常将允许的容差范围除以 6的比值,称为过程能力指数。,110,过程能力及过程能力指数,当容差的中心值 M与数据分布中心 相一致时,即=M,称过程能力“无偏”,用Cp表示;不一致时,称“有偏”,用Cpk表示。,1、双边容差情况,Cp=T/6=(Tu-TL)/6.,注:式中,T为容差范围,T=Tu-TL,Tu为上容差(公差上限),TL 为下容差(公差下限)。,根据上式可看出,公差范围越大,Cp 值越高,数据的散布()越大,Cp值越低。,(1)、当=M 时,,111,过程能力及过程能力指数,例1、工艺规范要求,某零件热处理的温度为7605oC,经长期测试结果,炉温服从N(760,2)正态分布,请计算这种条件下的过程能力指数。,解:由于M=,而T=Tu-TL=10oC,=2oC,将数据代入公式,得 Cp=T/6=10/120.83.,例2、在上例中,若将温度控制范围放宽到7608oC,问这种情况,Cp值有何变化?,解:由于容差放宽到7608oC,即T=Tu-TL=16oC,代入公式,得 Cp=T/6=16/121.33。,112,过程能力及过程能力指数,由上例可以看出,如果过程能力(6)不变,Cp值将决定于公差范围的大小。,(2)、当 M 时,,如果容差中心M与数据分布中心不一致,即当 M 时,上式需乘上一个修正系数(1-K),这时K=/(T/2)=2/T。其中=|M-|。计算公式为:,Cpk=(1-K)Cp=(T-2)/6.,例3、上例中温度控制要求仍为7608oC,但实际炉温的均值改变到762oC,即温服从N(762,2)正态分布,试求种情况下的Cpk值。,113,过程能力及过程能力指数,显然,由于 M,Cpk值总是要比Cp值小,而数值减小的幅度取决于M与 的差值。,解:由于M,根据公式:Cpk=(1-K)Cp=(T-2)/6,其中=|M-|=762-760=2oC,T=16oC,所以,Cpk=(16-2*2)/6*2=12/12=1。,2、容差限为单边的情况,在实际应用中,还会遇到单边容差限的情况,例如,某些材料的强度要求越大越好,只规定一个强度容差的下限;又如电发火管的最小发火电流,希望发火电流越小越,114,过程能力及过程能力指数,好,只规定一个容差上限。对单边容差限情况,应按下列公式计算过程能力指数:,上述几种过程能力指数的计算公式及其示意图概括如下:,Cp=T/3,1、双边容差情况,(1)、当 与 M 重合(=M)时,,Cp=T/6=(Tu-TL)/6.,115,过程能力及过程能力指数,(1)单侧上限:,(2)、当 与 M 不重合(M)时,,Cpk=(1-K)Cp=(T-2)/6.,2、单边容差的情况,Cp=T/3=(Tu-)/3.,Cp=T/3=(-TL)/3.,(2)单侧下限:,116,过程能力及过程能力指数,总体参数要通过寻找流程的稳态来得到,因此,计算过程能力指数的前提条件是流程处于稳态。Cp只是反映了过程的潜在能力,而Cpk反映了实际的过程能力对历史数据,我们可以做Pp和Ppk,PP和PPK是从过程总波动的角度考虑流程输出满足顾客要求的能力也称为长期能力指数(不要求过程稳定)计算Pp及Ppk的方法与Cp及Cpk的方法类似,所不同的是,它们是规格范限与流程总波动的比值.,117,过程能力及过程能力指数,在实际应用中,在排除系统变异情况(如控制图控制)下,可用极差或样本标准差的平均值 并经过适当转换来估计总体标准差,用样本均值 的间均值 来估计,具体计算在后边的控制图讲解中将会讲到。,二、过程能力的分级及Cpk值的调整,1、过程能力分级,为便于比较,通常将过程能力指数分成5级,如下表所示:,118,过程能力及过程能力指数,2、对有偏过程能力的调整,当有偏情况(M 时),是否需将数据的分布中心调整到与容差中心一致,则取决于下列多种因素:,119,过程能力及过程能力指数,(1)Cp 值的富裕程度;,(2)调整的难易程度;,(3)对最终产品的影响;,(4)调整的经济性。,下表给出的情况可供参考:,120,第四讲:过程控制和统计过程控制,三、过程能力指数与不合格品率,121,例5、加工 80 毫米的轴径。根据统计分析,已知轴径的加工尺寸服从N(80.0.1)正态分布。