多变量统计故障诊断方法.ppt
《多变量统计故障诊断方法.ppt》由会员分享,可在线阅读,更多相关《多变量统计故障诊断方法.ppt(61页珍藏版)》请在三一办公上搜索。
1、基于统计学的故障诊断方法,Contents,PCA故障诊断方法,1,KPCA故障诊断方法,2,ICA故障诊断方法,3,仿真实验,4,基于多变量统计的故障诊断方法有不依赖于过程模型、易于实施等特点,近年来在过程工业中得到广泛的应用,特别是对于复杂的过程,描述生产过程的精确数学模型难以建立时。最常用的有主元分析(PrinciPal Component Analysis,PCA)、主元回归(Pincipal component Regression,PCR)、偏最小二乘(PartialLeas square,PLS)、典型相关分析(eanonical correlation Analysis,CCA
2、)、费舍判别式(Fisher Discriminant Analysis,FDA)以及隐马尔可夫模型(Hidden Marov Model,HMM)。,基于多变量统计的故障诊断方法,最常用的有主元分析(PrinciPal Component Analysis,PCA)、主元回归(Pincipal component Regression,PCR)、偏最小二乘(PartialLeas square,PLS)、典型相关分析(eanonical correlation Analysis,CCA)、费舍判别式(Fisher Discriminant Analysis,FDA)以及隐马尔可夫模型(Hid
3、den Marov Model,HMM)。,在MSPC研究领域中,目前常用的工具有PCA、PCR、PLS、CCA、FDA及HMM等。PCA、PCR、PLS和CCA都属于基于投影的统计降维技术,常用于故障的检测与隔离,而FDA和HMM都是统计模式识别技术,可用于故障的诊断,这其中研究较多的为PCA、PLS及FDA。,基于PCA的故障诊断方法,主元分析法(PcA,又称主成份分析)是一种应用广泛的多元统计分析方法.主元分析(PCA)是由Pearson(1901)最早提出来的。Hotelling(1933)对主元分析进行了改进,其已被广泛应用于各个领域。在过程监控领域相比其它方法具有适应性强、更易实现
4、等优点,另外它在具有降维能力的同时,还可以把过程变量空间划分为表示子空间和残差子空间,实现子空间识别法可以实现的功能,如系统辨识v、故障识别等。因此,自从20世纪90年代初以来,PCA吸引了越来越多过程监控学者的关注,国内外也都出现以其为主要内容的专著。,基于PCA的故障诊断方法,基于PCA的故障诊断方法,基于PCA的故障诊断方法,基于PCA的故障诊断方法,基于PCA的故障诊断方法,故障检测就是检测系统中各个监测点的数据有无异常,它通常是将测量数据与系统校验模型相比较来实现的。跟据两者之间差距的显著性程度,判断系统中有无故障。根据前面的论述,主元分析法将数据空间分解为主元子空间和残差子空间,每
5、一组测量数据都可以投影到这两个子空间内。因此引入Hotelling T2和平方预报误差(Squared Prediction Error,SPE)这两个统计量来监测故障的发生。Hotelling T2统计量是用来衡量包含在主元模型中的信息大小,它表示标准分值平方和。它的定义如下:,基于PCA的故障诊断方法,系统如果正常运行,则T2应满足:其中k为保留的主元数,n为样本数,为置信度为,自由度分别为k和n-k的F分布的上限值。,基于PCA的故障诊断方法,SPE统计量是通过分析新的测量数据的残差进行故障诊断,用以表明这个采样数据在多大程度上符合主元模型,它衡量了这个数据点不能被主元模型所描述的信息量
6、的大小。它的计算如下:正常工况下,SPE应满足:其中,是正态分布的的置信极限。,主元分析需要注意的几点问题,数据的标准化问题矩阵Xnm每一列对应于一个测量变量,每一行对应一个样本。在m维空间中,两个样本间的相似度应正比于两个样本点在m维空间中的接近程度。由于m个测量变量的量纲和变化幅度不同,其绝对值大小可能相差许多倍。为了消除量纲和变化幅度不同带来的影响,原始建模数据应作标准化处理,即:其中:,为均值;,为标准差。测试数据也要按照原始变量的均值和标准差进行标准化处理。,主元分析需要注意的几点问题,主元的个数选取问题构造主元模型时必须确定主元的个数,而主元个数的确定应考虑两个方面的因素:即原始测
7、量数据维数的降低和原始测量数据信息的丢失。主元个数的选取直接影响到故障监测与诊断的效果。如果主元数目选得过小,则残差子空间所包含的方差太多,使的残差子空间统计量的阈值偏大,从而导致小故障难于被检测出。而若主元数目取的太大,又会使残差子空间包含的信息太少,使得故障对残差影响不大,故障难于被监测出。可见,主元个数的选取是很重要的。有几种技术可以确定要选取主元个数的值4546,如百分比变化量测试、Scree检验、平性分析法、PRESS统计、主元贡献率法和重构故障偏差准则等。但似乎没有一种占主导地位的技术,可以作为确定主元个数的通用的方法。需要具体问题具体分析。,基于PCA的统计建模,如上所述,利用过
8、程测量数据建立正常状态下的PCA统计模型,是实现基于PCA的SPC的第一步。值得注意的是包括PCA(PLS,PcR等多变量技术也存在此问题)在内的传统的多元统计方法在建模推导中作了一些假设;l)各变量都服从高斯正态分布;(2)过程是线性的;(3)过程处于稳态,不存在时序自相关性;(4)过程参数不随时间变化。但流程工业中的对象往往难以满足上述条件,针对这些对标准PCA(或称传统PCA)的限制,许多学者提出了一些改进算法。,1.针对非高斯特性的改进,传统PCA为了推导SPE和T2统计量的分布,确定控制限,一般假设过程变量服从正态分布,但实际工业过程观测到的数据的分布情况事先并不知道,并且由于非线性
9、、过程自身因素等原因,往往也不服从多元正态分布,这时再采用传统的PCA方法,就会造成故障的严重误报和漏报。,1.针对非高斯特性的改进,一种解决办法是利用大量的历史数据进行概率密度估计进而确定统计量的控制限,首先采用PCA算法对过程数据进行降维,然后采用核密度估计算法估计隐变量的分布情况,该法在过程中的熔炉故障和齿轮故障的检测中都取得了理想效果。它的主要缺点在于核密度估计算法只对低维数据有效(2一3维),当数据维数上升时,必须有大量的数据才能够得到较好的概率密度估计结果(即所谓的“维数灾难”),同时其计算量也大大增加。另外,对局部概率密度的差别描述也较困难。,1.针对非高斯特性的改进,另一种解决
10、办法是引入高斯混合模型(Gaussian Mixture model,GMM)来估计PCS中的数据模式(即聚类),GMM的训练可采用期望最大(Expeetation Maximization)算法来实现。由于每个模式对应着一个高斯函数,即每个模式中数据分布服从正态分布,所以可以利用传统的PCA求取新数据的SPE和T2检测统计量,进而实现故障的检测。但如果过程中的数据模式信息不充分,那么GMM模型难以建立,Thissen等对该法进行了改进,不再在各个类上分别采用T2统计量检测变量的波动,而是仅采用一个总体的密度参数,很好地解决了这个问题。,1.针对非高斯特性的改进,独立主元分析(又称独立成分,独
11、立元,Independent Component Analysis,ICA)方法作为统计信号处理领域内一种新的方法最早由Juten和Herault提出,其利用信号的高阶统计信息(二阶统计量便足以描述高斯信号),将混合信号分解成相互独立的非高斯成分,由于各非高斯成分满足独立性条件,联合概率密度等于各成分概率密度之积,因此避免了高维的概率密度估计问题。Hyvnen改进了ICA的算法,增强了它的鲁棒性和训练速度,由于ICA的上述优势,近年来采用IcA方法进行过程统计性能监控的工作正逐步增多,Kan等实现了基于IcA的故障检测,Lee等在此基础上用贡献图实现了故障的隔离,Lin和zhang把IcA与小
12、波结合构造滤波器,可以降低过程中测量传感器不足带来的影响,另外IcA在动态过程、非线性过程、间歇过程中也得到了较好扩展,成功的应用实例有利用动态ICA实现废水处理过程的监控。,2.针对过程中非线性的改进,如前面所述,传统PCA的目标是通过把过程空间分为PCS和RS,来在两个子空间上实现故障的检测与隔离,其中PCS代表的是在各个线性方向上的过程变量变化信息,而RS代表的是过程中存在的线性冗余。但针对流程工业中存在的大量非线性过程,尤其是当输入的取值范围较大时,很多过程信息及这种非线性关系无法再被PCA描述。针对这种非线性问题,目前研究中主要有基于神经网络的非线性PCA(Nonlinear PCA
13、)法和核PCA(Kemel PCA)法。,2.针对过程中非线性的改进,采用PCA处理非线性问题的另一种方法,是将过程变量之间的非线性关系映射到更高维的特征空间,以采用线性关系来近似描述。通过核学习法也采用上述的映射原理实现PCA实现的矩阵分解,但不需要求出具体的非线性函数,而只需在式(l.12)定义的内积空间上进行样本矩阵分解:式中。为映射函数,K(xi,x,)为与。无关的非线性函数,这种方法常被称为KemelPCA。由于核(Kemel)学习方法建立在较为坚实的结构风险最小化理论之上,对有效的训练样本集,能够获得最优的推广泛化能力,较好地解决了过拟合和欠拟合问题,逐步成为机器学习和模式识别领域
14、内的研究热点,而基于Kemel学习方法的 Kemel PCA在被成功用于人脸识别及语音识别领域之后,在过程监控领域的研究也有了很大进展。,3.针对过程参数时变特性的改进,传统的PCA技术假定过程为时不变的,过程变量的均值和协方差处于一个稳态点,由于原料性质的变化,外界环境的改变,过程设备的老化等原因,会导致过程的正常工况区域会随时间发生漂移。如果仅仅过程变量的均值和方差发生变化,而协方差阵没变化,即变量之间的线性关系不变,这时可以通过更新数据的归一化参数来适应系统的这种变化。如果过程变量的均值、方差和协方差都发生了变化,那么变化前建立的PCA统计模型就不再适用,这时一般采用递归 PCA(Rec
15、ursive PCA)来解决这一问题。其基本原理是将新的测量数据以一定的权值包含到待处理的数据矩阵中,这些权值一般是指数减小的。也就是说,随着过程的进行,历史数据对当前数据矩阵的影响是逐渐减少的,这种方法又称自适应的方法,它的思想与带遗忘因子的最小二乘蜘辛识算法的思想相类似,当前时刻的数据具有最大的权值,而离当前时刻越远时刻的数据具有越小的权值。,4.针对动态系统的改进,传统PCA可以看作一种静态建模方法,而对实际流程工业数据而言,由于系统本身时滞特性、闭环控制和扰动的存在,多数过程变量都呈现出动态特性,即不同时刻的采样之间时序相关,此时如果依然采用传统PCA,那么得到的主元得分会时序自相关,
16、甚至各主元间互相关,进一步造成故障的误报率增加。为消除动态性的影响,一个简单的做法是人为增加采样的间隔,从而降低数据之间的相关性,但是这种做法只能检测到无时滞过程变量的协方差阵的变化,忽略了过程变量间存在的动态关系,会降低监控系统对故障的敏感性,推迟故障的检测时间,甚至对一些动态关系波动故障(仅引起时滞过程变量的协方差阵变化)产生漏报,所以该法并未从实质上解决动态性引起的问题。目前文献中处理动态性影响的方法主要包括两种,即动态特性建模法以及多尺度方法。,4.针对动态系统的改进,多尺度方法通过将过程数据在不同尺度上进行分解,实现了不同频率信息之间的分离。对于一个自相关变量而言,由于其分解得到的系
17、数近似无关,且能描述变量变化的动态特性,因此在动态系统中可以代替原始过程变量进行性能监控,在实现多尺度监控的同时,也解决了变量自相关性带来的问题。小波分析在过程监控中可用于含噪声数据的预处理,但研究最多的还是作为多尺度分析工具。Kosanovieh和Piovoso(1996)首先提出用无关的小波系数代替过程变量测量值来进行PCA,但多尺度PCA(Multi scale PCA,MSPCA)模型的概念及其完整理论是由Bakshi(1995)提出的,原理如图,4.针对动态系统的改进,这里W表示对数据进行小波变换,得到小波系数GX和尺度函数系数HLX,W表重构利用小波分析重构原始信号。在建模阶段,对
18、正常数据进行L级分解,在各个尺度上对小波分解系数进行PCA建模,得到该尺度上的负荷向量及其控制限。在监控阶段,对测量数据在各个尺度上进行监控,如果当前测量数据在某些尺度超出控制限,那么需要由正常数据在这些尺度上的信息建立全尺度的PCA模型,并把当前数据在这些尺度上重构,然后用全尺度模型对重构信号进行过程状况的最终判断。,5.间歇过程的监控,工业生产中另一种重要的生产方式是间歇生产过程,与连续过程相比,具有启停频繁、动态特性变化快、时序操作严格、多阶段、有限生产(以批次为周期的生产)等特点,间歇生产过程的监控更为复杂。其测量数据是三维的(时间x变量X批次),而不象连续过程是二维的。多向PCA(M
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多变 统计 故障诊断 方法
链接地址:https://www.31ppt.com/p-6456499.html