SPC数理统计基础知识.ppt
《SPC数理统计基础知识.ppt》由会员分享,可在线阅读,更多相关《SPC数理统计基础知识.ppt(159页珍藏版)》请在三一办公上搜索。
1、1,SPC数理统计基础知识,I dont know everything,but I know a solution for everything.,2,課程大綱:,第一讲、概述1、数据及其相关概念2、数理统计的有关概念,第二讲、数据的整理和分析1、数据的离散性和规律性2、数据的特征值3、数据的频数分布和直方图,3,課程大綱:,第三讲、质量变异的规律性分析 1、概率分布2、正态分布3、中心极限定理3、二项分布和泊松分布,第四讲、过程控制和统计过程控制1、SPC和SPCD2、过程能力及过程能力指数3、过程能力指数与不合格品率4、影响过程能力的因素及其要求5、过程分析方法,4,SPC的数理统计基础
2、知识,第一讲:概 述,要点:,数理统计的有关概念,5,数据及其相关概念,一、数据的分类,数据大体可以分为两大类:计量型数据和计数型数据。,计量数据(连续型数据):是指连续测量所得的质量特性值,如:长度、重量、强度、化学成分、时间、电阻等,6,数据及其相关概念,计数型数据(非连续型数据):是指按个数数得的非连续性取值的质量特性值,以上控制图适用计数值,,1,2,3,4,1,2,如:不合格品数、缺陷数及事故的件数,如:满意的和不满意的人数,如:瓷砖中的斑点数,7,数据及其相关概念,二、数据的要求,1、针对性2、完整性3、准确性4、及时性5、连续性6、统一性,8,数据及其相关概念,三、异常数字的判定
3、和剔除,即使是在同样生产条件下的一组数据,其中的个别数据也可能是“不合群”的,即不符合这组数据应遵循的固有分布规律。一般而言,一组数据中最大值或最小值成为异常数据的可能性最大,判为正常数据的风险也最大。异常值来源:测量仪器不正常,测量环境偏离正常值较大,计算机出错,看错,读错,抄错,算错,转移错误。,9,数据及其相关概念,判定和剔除异常数据的方法有多种,这里我们仅介绍一种简单的方法-格拉布斯法。,下表是格拉布斯检验简表。表中给出了不同的第一类错判概率(=0.05,0.25,0.01)下的剔除标准。,10,数据及其相关概念,表中的n为相同条件下抽取的样本数,T为第一类错判率值下的剔除标准。该表的
4、使用前提是数据服从正态分布。例1:为验证某批铸件质量,抽查了9件铸件,测得零件重量与该类零件的标准重量的差别分别为(单位g)6.95,7.20,7.25,7.40,7.46,7.52,7.60,7.80,8.47;试检验上述数据有无异常(取=0.05),11,数据及其相关概念,解:(1)用Minitab进行正态性检验,P 0.05,数据符合符合正态分布,12,数据及其相关概念,(2)将数据由小到大排列;(3)计算数据的平均值和标准差:,(4)从两头数据进行检验,对n个数中的最大值X n和最小值X1,为此需计算统计量:,13,数据及其相关概念,注意:在 X n和X1中,首先应从这两个数据与相邻两
5、个数据中差异最大的开始检验,这里,(4)将统计量 T 与 T 进行比较,如果T T 则判为异常,应予以剔除。,X n-X n-1=8.47-7.80=0.6;,T n=(8.47-7.52)/0.439=2.19;,T1=(7.52-6.95)/0.434=1.31.,X 2-X1=7.20-6.95=0.25。,故应先检验X n,(为便于比较,最小数据也一并检验),将相关数据代入,得,14,数据及其相关概念,为此查表得,当=0.05,n=9时,T=2.11,,剔除 X n 异常后,重新计算余下的8个数的平均值、标准差和统计量 T n-1,依次按上述步骤对 X n-1、X n-2、各数据进行检
6、验,直到无异常数据为止。,因为 T n=2.192.11,X1=6.95应予以保留。,T1=1.312.11,.,故X n=8.47为异常,应剔除;,15,数据及其相关概念,这里教大家一种比较简单的判别方法(用Minitab),此点为异常点,16,数据及其相关概念,移掉异常点后对剩余数据做箱型图:无新的异常点,17,第一讲:概 述,二、数理统计的有关概念,18,数理统计的有关概念,一、数理统计与统计技术,统计技术主要是指“数理统计”,它是建立在概率论基础上的一门数学分支,统计技术是研究事物变异性及其规律的科学。推断型统计技术:主要解决从样本如何推断总体。概率论和数理统计研究的对象大多属于此类。
7、描述型统计技术;主要是利用数据的特征或有关图表描述事物。,19,数理统计的有关概念,20,数理统计的有关概念,二、总体(Population)/个体(unit)/样本(sample),总体,也叫母体,是研究对象的全体。总体可以是有限的或无限的。个体:组成总体的每一个单位称为个体。样本:从总体中抽取的部分个体称为样本抽样:抽取样本的过程称抽样。,21,数理统计的有关概念,总体,个体,22,数理统计的有关概念,所谓统计推断,就是依据对样本的检测或观察结果去推断总体状况(如下图所示)。,23,数理统计的有关概念,三、生产批与检验批,生产批:过程在受控状态下连续生产的一批产品称为一个生产批。批量:组成
8、一批产品的单位个数称为批量。检验批:待检验的一批产品称为检验批。,一般而言,一个生产批,即为一个检验批。但在某些特殊情况下,如批量过大、生产周期过长、可以将一个生产批划分为若干检验批。但要保证生产过程是稳定的,各检验批之间质量均衡,不可人为地任意划分。,24,数理统计的有关概念,自然界中所观察到的现象有确定性现象和随机现象两种。,注意:为保证检验批的代表性,任何情况下不能将两 个生产批合并为一个检验批。,四、现象,确定现象:在一定条件下必然发生(出现)某一结果的现象称为确定性现象。例如:太如从东边升起;三角形的三个内角之和等于180度;函数在间断点处不存在导数等等。,确定性现象的特征是:条件完
9、全决定结果。,25,数理统计的有关概念,实例3:“抛掷一枚骰子,观察出现的点数”,结果可能为:1,2,3,4,5,6。,随机现象:在一定条件下可能发生这种结果,也可能发生那种结果,即预先不能确定到底发生哪种结果的的现象称为随机现象。,实例1:“在相同条件下掷一枚均匀的硬币,观察正反两面出现的情况”,结果有可能出现正面朝上也可能出现反面朝上。,实例2:“用同一门炮向同一目标发射同一种炮弹多发,观察弹落点的情况”,结果:“弹落点会各不相同”。,26,数理统计的有关概念,实例4:“从一批含有正品和次品的产品中任意抽一件产品”,其结果可能为:正品或次品。,实例5:“刚出生的婴儿可 能是男,也可能是女”
10、。,随机现象的特征:条件不能完全决定结果。,1.、随机现象揭示了条件和结果之间的非确定性联系。,说明:,27,数理统计的有关概念,五、随机试验,2、随机现象在一次观察中出现什么结果具有偶然性,但在大量试验或观察中,这种结果的出现具有一定的统计规律性。,如何来研究随机现象?,随机现象是通过随机试验来研究的。,随机试验:在概率论中,将实现一组条件称为试验。把具有以下三个特征的试验称为随机试验。,28,数理统计的有关概念,1.试验可以在相同的条件下重复地进行;2.试验的可能结果在试验前可以明确知道;3.每次试验总是恰好出现上述结果中的一个,但在试验前不能确定哪一个结果将会出现。,随机试验简称为试验,
11、是一个广泛的术语.它包括各种各样的科学实验,也包括对客观事物进行的“调查”、“观察”、或“测量”等。,29,数理统计的有关概念,例如:,1.抛掷一枚骰子,观察出现的点数。2.从一批产品中,依次任选三件,记录出现正品与次品的件数。3.记录某公共汽车站某日上午某时刻的等车人数。4.考察某地区四月份的平均气温。5.从一批灯泡中任取一只,测试其寿命。,30,数理统计的有关概念,六、随机事件,确定性现象只有两种结果:发生与不发生,它们可以用必然事件和不可能事件来表示。必然事件(对应确定现象):在一定条件下必然发生的结果。如:“三角形的三个内角和等于180度”,“在一批全部是合格品的产品中任抽一件合格品”
12、,都是必然事件。不可能事件(对应确定现象):在一定条件下必然不发生的结果。如:“物体的速度达不到第二宇宙速度(11.2公里/秒),物体成为行星”,“在一批全部是合格品的产品中任抽一件不合格品”,都是不可能事件。,31,数理统计的有关概念,在质量体系运行过程中或产品实现的各个阶段出现的各种现象、状态或结果,在统计技术中统称为事件。,随机事件(对应随机现象):随机现象中可能发生也可能不发生的结果称为随机事件,简称事件。例如:一批待检验的产品中,可能有合格品,也可能有不合格品,若从中任意抽取一件合格品的事件,就是随机事件。,统计技术研究的主要是随机事件,简称事件。,32,数理统计的有关概念,频率:随
13、机事件发生的个数(次数)在总观察数中所占的比率称为频率。通常记作 f n。如上例事件若是从总数为100件电发火管中抽取的,则爆破力落在 78.0581.05 间的事件A的频率为 f n(A)=3/100=3%。,七、频数、频率和概率,频数:随机事件在一组数据或多次试验中出现的次数,或不同数据落在某区间的个数称为频数。例如:有3个电发火管的爆破压力落在78.0581.05区间,即压力在 78.0581.05这一随机事件的频数为3。,33,数理统计的有关概念,随机事件在一次试验中可能发生,也可能不发生,具有不确定性,即随机性。然而在大量的试验中,随机事件却呈现出明显的规律性,即所谓的频率稳定性。,
14、频率的稳定性反映了事件发生的可能性的大小。由此看来,事件发生的可能性的大小可以用一个数值来度量。,概率:,一般地,度量随机事件A发生的可能性大小的数值称为事件A的概率,记作P(A)。,34,数理统计的有关概念,频率的稳定性的意义就在于它表明概率的存在,从而使得概率概念在现实世界有其参照物。,概率是频率的稳定值,反之,频率可以认为是概率的近似值,是对概率进行一次测量的结果。,概率应具有下列性质:对于任何事件A,,0 P(A)1,P()=1,P()=0,35,数理统计的有关概念,八、小概率事件,当某一事件发生的概率很小时(通常小于0.05)称小概率事件 著名的英国统计家Ronald Fisher
15、把20分之1作为标准,这也就是0.05,从此0.05或比0.05小的概率都被认为是小概率,九、几个经典的小概率事件,三国演义中的连环计 金茂大厦辛普森跳伞事件 不可能事件可能转化为小概率事件吗?,36,数理统计的有关概念,条件误差:是指在加工过程是由于人、机、料、法、测、环中一个或多个因素发生变化引起的误差。,正常误差:是指在加工过程受控状态下,由于机床的微小颤动力、材料在合格范围内的不均匀变化等引起的误差。,十、条件误差和正常误差,统计技术的实质就是要区别因误差引起的的数据波动是正常因素引起的还是由条件因素引起的。,由于条件误差对质量影响较大,较易识别,是质量控制的主要对象。而正常误差通常由
16、公差给以保证。,37,第一讲:概 述,The EndThank you very much!,38,SPC的数理统计基础知识,第二讲:数据的整理和分析,要点:,数据的离散性和规律性 数据的特征值 数据的的频数分布表和直方图,39,第二讲:数据的整理和分析,一、数据的离散性和规律性,40,数据的离散性和规律性,电发火管爆破压力试验数据,注:蓝色字体为每班的最小值,红色为最大值。,41,数据的离散性和规律性,从该表中可以看出,在这100个数据中的最大值和最小值可以从表的右边两列中找出:X max=101.7,X min=75.2;,虽然表中的数据提供的信息是有限的,但我们仍可从中看出数据所具有的两
17、个重要特征:离散性和规律性。,1、离散性:与其它产品一样,不管事前如何严格控制,反映产品质量的数据(这里是爆破压力),总是有波动的。,2、规律性:反映爆破压力的数据虽有波动,但这种波动并非是杂乱无章的,而是有一定的规律。,42,第二讲:数据的整理和分析,二、数据的特征值,43,数据的位置特征值,前面所用的表可以用来观察数据波动的大致情况,但不能看到数量方面信息,特别是比较两组以上数据分布时,无法定量地表征它们之间的差别。为了解决这个问题,我们常用两类统计量表征数据。,表示数据位置特征(中心趋向)的值有平均值、中位数、中值和众数等。,一、数据的位置特征值,1、平均值,如果从总体中抽取的一个样本数
18、据为 X1,X2,Xn 则样本平均值为,44,数据的位置特征值,2、中位数X,有时,为了减少计算,将数据 X1,X2,Xn 按从大到小次序排列,用位居于正中的那个数或中间两个数的平均值(当数据为偶数个时)表示数据的总体平均值水平。,子组中位数的平均值,25.0,25.3,25.4,25.6,25.5,例:,n 5 为奇数,Me25.4,数据为 25.0,25.4,25.5,25.6,时,n 4 为偶数,45,数据的位置特征值,3、中值M,测定值中的最大值 X max 与最小值 X min 的平均值,用M表示。,M=(X max+X min)/2,上表中的数据的中值为:M=(101.7+75.2
19、)/2=88.45.,4、众数,在用频数分布表表示测定值时,频数最多的值即为众数。若测定值按区间做频数分布时,频数最多的区间代表值(一般用区间中值)亦称众数。,46,数据的离散特征值,二、数据的离散特征值,为什么要研究数据的离散程度?,示例,如果你想过河,有人只告诉你河的平均深度是2米,你是否还想知道它的变化范围,如:07米。,47,数据的离散特征值,注:通常,极差用于测定个数 n 小于10的场合,当 n 大于10时,一般用标准偏差 s 表示离散程度。,1、极差 R,测定值中的最大值 X max 与最小值 X min 之差,用R表示。,R=Xmax-Xmin,偏差:各个测定值X i 与平均值
20、X 之差称为偏差。,2、偏差平方和 S,48,数据的特征值,则,3、无偏方差 s2,偏差平方和 S:各个测定值的偏差的平方和称为偏差平方和,简称平方和,用 S 表示。,设各个测定值为 X1,X2,Xn,其平均值为,各个测定值的偏差平方和除以(n-1)后所得的值称为无偏方差(简称方差),用 s2 表示。,49,数据的特征值,s 标准差计算公式,25.0,25.3,25.4,25.6,25.5,例:,0.2302,4、标准偏差 s,50,第二讲:数据的整理和分析,三、数据的频数分布和直方图,51,数据的的频数分布表和直方图,一、数据的频数分布表,为进一步挖掘数据的有用信息,仍以发管爆破压力的100
21、个数据为例,讲解频数分布表的步骤:,1、计算数据的变化范围(极差),2、根据样本 n 的大小,按下表确定组数。这是K=9。,R=101.9-75.2=26.5,52,数据的的频数分布表和直方图,3、计算组距 h h=R/K=2.94,为了计算方便,将组距舍入到最小测量单位的整数倍,本例取 h=3.0.,4、确定边界值,为避免数据落在边界上,并使最小值落在第一组内,故取第一组的下限等于最小值减去最小测量单位的一半(本例即0.1/2=0.05),于是,第一组的下限=75.2-0.05=75.15;第一组的上限=第一组的下限+组距=75.15+3=78.15;其余各组依此类推。,53,数据的的频数分
22、布表和直方图,5、为统计方便,可采用唱票法,将数统计在对应区间,即作出频数分布表(如下表),54,数据的的频数分布表和直方图,二、频数直方图,为更加直观,可以用频数直方图代替频数分布表,频数直方图是频数分布表的图示形式。频数直方图是在频数分布表基础上作出的。作法如下:,以各组边界值画横轴,纵轴为频数,画出以组距 h为宽,频数 n i 为高的一个个直方,即为直方图。,55,数据的的频数分布表和直方图,三、频率直方图,频率直方图的的基本作法与频数直方图相同,只是纵轴以频率取代频数,其图形的形状不变。,频率直方图可帮助我们分析数据在每一组中所占比例的变化情况。,56,数据的的频数分布表和直方图,四、
23、利用直方图对过程进行分析,如果随机从同一生产条件下再抽100件产品,虽然各组的频数(或频率)不尽相同,但直方图的图形大致相同。如两个直方图差异很大,则应怀疑生产条件有可能变化。,由于直方图作法简单,且又形象、直观,在企业中应用广泛。有些外企在采购产品时,不仅要求供方出具产品的合格证明,而且要求提供能反映质量变异情况的直方图。,下图是过程控制中常见的几种直方图,常因产品类别、设备、加工方法等不同而有异,以下分析仅供参考。,57,数据的的频数分布表和直方图,a.正常型:特点是中间高、两边低、左右基本对称。这是数据服从正态分布的特征,也是大多数产品质量特性所具有的图形。,b.偏向型:特点也是中间高、
24、两边低、但高峰偏向一侧,形成不对称形状。,这种情况可能是人为有意识对过程进行干涉造成的。如机加工中孔的尺寸往往偏下限,而轴的尺寸偏上限。,58,数据的的频数分布表和直方图,c.双峰型:特点是有两个高峰。这往往由于来自两个总体的数据混在一起所致,如两个工人加工的产品混在一起。,d.孤岛型:在远离主分布的地方出现一个小直方形,有如一个孤岛。这可能是由于过程在有一个时期产生了过程条件的较明显变化,如原材料混杂、操作疏忽等。,59,数据的的频数分布表和直方图,e.低峰型:可能由于过程中某种倾向性因素缓慢作用所致。,f.高峰型:可能数据已经过筛选。,g.锯齿型:特点是直方图内各直方高低参差不齐。其原因可
25、能是直方图分组不当(过多)或测量误差过大而所致。,60,第二讲:数据的整理和分析,The EndThank you very much!,61,SPC的数理统计基础知识,第三讲:质量变异的规律性分析,要点:,概率分布 正态分布 中心极限定理 二项分布和泊松分布,62,第三讲:质量变异的规律性分析,一、概率分布,63,概率分布,概率分布是将变量在总体中的取值与其发生的概率二者相联系的数字模型。概率分布有两种类型:连续概率分布和离散概率分布。,典型的连续概率分布是正态分布,常见的离散概率分布是二项分布和泊松分布。,64,第三讲:质量变异的规律性分析,二、正态分布(normal distributi
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPC 数理统计 基础知识
链接地址:https://www.31ppt.com/p-6520055.html