毕业设计(论文)K均值聚类算法在滚动轴承故障诊断中的应用.doc
《毕业设计(论文)K均值聚类算法在滚动轴承故障诊断中的应用.doc》由会员分享,可在线阅读,更多相关《毕业设计(论文)K均值聚类算法在滚动轴承故障诊断中的应用.doc(21页珍藏版)》请在三一办公上搜索。
1、吉 林 农 业 大 学学 士 学 位 论 文题目名称: K-均值聚类算法在滚动轴承故障诊断中的应用 学生姓名: 院 系: 专业年级:指导教师: 职 称: 2013年5月23 日目 录K-均值聚类算法在滚动轴承故障诊断中的应用I摘要I1 前 言11.1 研究背景11.2 研究意义21.3 本论文研究数据及内容22 K-均值聚类算法32.1聚类算法介绍32.2 K-均值聚类算法介绍32.3 K-均值聚类算法基本思想42.4 相似性度量及聚类准则函数42.6 K-均值聚类算法描述52.5 K-均值聚类算法过程53 实验结果及分析53.1 K=2时聚类结果63.2 K=4时聚类结果8参考文献11致 谢
2、12附 录13K-均值聚类算法在滚动轴承故障诊断中的应用姓 名: 专 业:信息与计算科学指导教师:摘要:滚动轴承作为旋转机械中重要的零部件,对整个机械设备的正常工作起到举足轻重的作用,然而滚动轴承又是其中极易损坏的元件之一。据粗略估计,有30%的机械故障是由滚动轴承的故障引起的,因此对滚动轴承故障的诊断对机械的正常工作有重要意义。其中聚类算法在滚动轴承中得到了广泛的应用。聚类算法是数据挖掘领域中非常重要的研究方向,其中K-均值聚类算法是一种简单快速的聚类算法。把K-均值聚类算法应用到滚动轴承故障诊断中可以快速高效的验证实验结果的正确性,做到对错误的检测,从而可以减少经济损失。本文主要运用K-均
3、值聚类算法对实验中提取的滚动轴承故障数据进行聚类分析,以验证实验结果的正确率。关键字:滚动轴承;故障诊断;K-均值聚类;聚类中心The application of K-means in fault diagnosis of rolling bearingName: Major: Information and Computing SciencesTutor: Abstract: As the important components in rotating machinery, the rolling bearing plays a decisive role, but the rollin
4、g bearing is one of the easily damaged components. According to the rough estimate, 30% of the mechanical failure is caused by the fault of rolling bearing; therefore the diagnosis of the rolling bearing fault has important significance. The clustering algorithm has widely used in the diagnosis of t
5、he rolling bearing fault. The clustering algorithm is a very important research direction of the data mining technology, and K-means is one of the clustering algorithms, which is easy and quick. If we apply the K-means to the fault diagnosis of the rolling bearing, we can verify the experimental res
6、ult fast and efficient and also can detect the error, therefore reduce the economic loss. This text mainly applies the K-means to analyze the data of the diagnosis of the rolling bearing, which are collected from the experiment, to test the accuracy of the experiment.Key words: rolling bearing; faul
7、t diagnosis; K-means clustering; cluster center1 前 言1.1 研究背景滚动轴承是将运转的轴座与轴之间的滑动摩擦转变为滚动摩擦的,从而达到减少摩擦损失的目的,是一种精密的机械元件。滚动轴承一般由内环、外环、滚动体与保持架组成,内环与轴相配合并与轴一起旋转;外环与轴承座相配合起到支撑作用;滚动体借助于保持架均匀的将滚动体分布在内环和外环之间,其形状大小和数量直接影响着滚动轴承的使用性能和寿命;保持架能使滚动体均匀分布,防止滚动体脱落,引导滚动体旋转起润滑作用。滚动轴承支撑转动的轴以及轴上零件,并保持轴的正常工作位置和旋转精度,滚动轴承使用维护方便,
8、工作可靠,启动性能好,在中等速度下承载能力较高。滚动轴承是机械应用中最为广泛的机械零件,同时,它也是机器中最容易受到破坏的元件。大部分的旋转机械的故障引起都与滚动轴承的状态有关。据不完全统计,在使用滚动轴承的旋转机械之中,大约有30%的机械故障都是由于轴承而引起的。由此可见,轴承的好坏对机器工作状态影响极大。通常,由于轴承的种种缺陷会导致机器产生振动以及噪声,甚至还会引起机器一定程度的损坏。而在一些精密机械中(精密机床主轴、陀螺等),对轴承的要求就有更高的标准,哪怕是轴承上有微米级的小缺陷,都会导致整个机器系统的精密程度遭到破坏。最早使用的轴承故障诊断方法是将听音棒接触轴承部位,完全依靠听觉来
9、及经验判断轴承有无故障。这种方法今天仍在使用,不过已经逐步被电子听诊器来替代听棒用来提高灵敏度。后来逐步采用各式测振仪器、仪表并利用位移、速度或加速度的均方根值或峰峰值来判断轴承有无故障。这样可以减少对设备检修人员的经验的依赖,虽然这样,但还是仍然很难发现早期故障。随着对滚动轴承运动学、动力学的深化的研究,以及对轴承振动信号中频率成分和轴承零件的几何尺寸及缺陷类型的关系都有了比较清楚的了解,FFT级数的发展也使得利用频率域分析和检测轴承故障成为一种很是有效的途径。也是目前滚动轴承监测诊断的基础。滚动轴承是一种广泛应用于国民经济和国防事业各个领域的重要的机械基础件。主要体现在以下几个方面:(1)
10、 在国民经济中-滚动轴承被称为“工业的关节”。(2) 在国防事业上-滚动轴承是必备的军备物资。(3) 在技术地位上-轴承钢是各种合金钢中要求技术指标最多而且最严的钢种。滚动轴承在长时间的摩擦运动中,由于种种原因,各个部件都会产生不同程度的故障。为此要进行故障诊断。1.2 研究意义 由以上叙述可知,如果我们对滚动轴承产生的故障视而不见,任由出现故障的轴承运行,可想而知,一旦不及时作出相应的补救措施,那将会造成多大的经济损失。其中对故障数据进行聚类能够分清数据故障的类型,是哪个部件产生的故障。每个部件产生故障时,不同部件间相同的故障特征会表现出不同。我们对滚动轴承的每个部件提取故障特征值,以确定滚
11、动轴承各个部件是否正常。如果某个部件出现较大故障,要及时采取措施,以免造成重大损失。由于不同部件间相同的故障特征会表现出不同,比如说内环故障数据和外环故障数据会有所不同,因此我们可以对实验提取的实验数据聚类,以确定实验数据的正确性,避免在对故障进行采取措施是出现不必要的损失。我们对故障数据聚类时,各个部件的故障数据会被聚为不同的类簇,这样就可验证实验的正确性。可见,对滚动轴承故障数据进行聚类具有重大意义。综上所述,在机械设备中,滚动轴承是一种通用的连接和传递动力的零部件,几乎在任何大型设备中滚动轴承都起着重要作用。运用先进的技术,我们可以对轴承进行状态监测和故障诊断,可以实现从时候维修、定期维
12、修到监测维修的转变,这样可以减少不必要的人力和物力浪费,以提高经济效益。1.3 本论文研究数据及内容本文对从6205型深沟球滚动轴承提取的振动数据进行聚类分析,以验证实验结果的正确率。所采集的数据均存储为* .mat 格式( MATLAB 格式文件) 。数据文件中包含有以下数据:1.滚动轴承正常数据;2.滚动轴承内环故障数据;3.滚动轴承滚动体故障数据;4.滚动轴承外环故障数据。针对以上数据,本文主要运用K-均值聚类算法对数据进行聚类。K-均值聚类算法是基于划分的算法,它通过进行不断的迭代进行聚类,当算法满足收敛条件时停止迭代过程,输出聚类结果。K-均值聚类算法具有思想简单、收敛快速的优点,对
13、大量数据进行聚类具有较高的效率,因此使得其成为一种最常用的聚类算法之一。当聚类数目设置为2时,将正常数据与故障数据聚为两个类别;当聚类数目为4时,将各种状态的数据各聚为一类。给出实验的结果的正确率以验证实验结果的正确性。2 K-均值聚类算法2.1聚类算法介绍聚类分析是由若干模式组成的。通常,模式也就是一个度量的向量,或者是多维空间中的一个点。聚类分析以相似性为基础,在同一个聚类中的模式之间比在不同一聚类中的模式之间具有更多的相似性,以此为根据进行聚类。在自然科学和社会科学中,存在着大量的分类问题。类,就是指相似元素的集合。聚类分析也称为群分析,它是研究分类问题的一种统计分析方法。聚类分析起源于
14、分类学,在早时的分类学中,人们主要是依靠经验和专业知识来实现分类,很少利用数学工具进行定量的分类。伴随着人类科学技术的发展,人们对分类的要求越来越高,以致很多时候仅凭经验和专业知识难以确切地进行分类,于是人们逐渐地把数学工具引用到了分类学中,形成了数值分类学,随后又将多元分析的技术引入到数值分类学形成了聚类分析。聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等。聚类算法要求有可伸缩性、处理不同类型属性的能力、发现任意形状的聚类、用于决定输入参数的领域知识最小化、处理“噪声”数据的能力、对于输入记录的顺序不敏感、高纬度、基于约束的聚类、可解释性
15、和可用性。聚类分析的计算方法主要有如下几种:1划分法;2. 层次法;3. 密度算法;4. 网格算法;5. 模型算法;6. K-MEANS;7. K-MEDOIDS;2.2 K-均值聚类算法介绍K-均值聚类算法是一种数据挖掘技术,由于本算法思想简单,容易得到实现,而且对于求解大数据问题有较好的时间性能,因此K-均值聚类算法成为目前最常用的聚类算法之一。K-均值聚类算法是基于最小误差平方和,通过不断的迭代过程进行聚类,它能找到关于聚类误差的局部的最优解,在很多的聚类问题上能够快速求解。2.3 K-均值聚类算法基本思想该算法是将含有个数据点的数据集合划分为K个类簇的问题,其中;第一次迭代时随机选取K
16、个样本数据作为初始聚类中心,集合中其余的样本被分到K个初始聚类中心所代表的类簇中,这样就被分为K个类簇。对每一个分配完的类簇计算新的聚类中心,按照新的聚类中心进行聚类。不断进行上述过程,直到前后两次的聚类中心不再发生变化,则算法停止,否则继续进行迭代。2.4 相似性度量及聚类准则函数在运用K-均值聚类算法对数据集进行聚类时要选定某种距离作为样本间的相似性度量,在计算不同数据样本之间的距离时,我们可以选择不同的距离计算方法,列如欧氏距离、曼哈顿距离以及明考斯距离。选择欧氏距离作为数据样本间的相似性度量。聚类准则函数一般采用误差平方和准则函数,用来评价聚类性能。此算法的特点为每次进行迭代时,都要对
17、数据集合中的样本数据进行聚类,再次计算新的聚类中心,进行下一次的迭代过程。如果在某一次迭代过程中所有的类簇没有发生变化,相应的聚类中心也没有发生变化,此时标志着聚类准则函数已经收敛,算法结束。选择欧氏距离作为相似性度量:对于两个数据样本:; ;则他们之间的欧氏距离为: ; (2-1)欧氏距离越小两个样本之间的相似程度越大,差异度越小;反之样本之间的相似程度越小,差异度越大。使用误差平方和函数评价聚类性能:给定数据集包含K个聚类子集;各个聚类子集中的样本数量分别为;各个聚类子集的聚类中心分别为;则误差平方和准则函数为: ; (2-2)2.6 K-均值聚类算法描述1. 为中心向量初始化个种子;2分
18、组:(1) 将样本分配给距离其最近的中心向量;(2) 由这些样本构造互不相交的聚类;3. 确定聚类中心; 用聚类各自的中心向量作为新的中心;4.重复分组和确定聚类中心的步骤,直到算法收敛;2.5 K-均值聚类算法过程输入:样本数据集,聚类数目;输出:个类簇,;算法流程:1: 随机选取个样本数据,;作为初始聚类中心;2: 计算每个样本数据与的距离,;如果有 ; (2-3)成立.则属于类簇;并计算误差平方和;3: 计算新的个聚类中心并把上次迭代过程的聚类中心保存; ; ; (2-4)4: 判断算法是否停止;如果;则算法停止;否则转向步骤2.3 实验结果及分析由于篇幅原因,表3-1只列出了部分故障样
19、本的数据量,其中1组,2组,3组样本为正常样本;4组,5组,6组样本为滚动轴承内环故障样本;7组,8组,9组样本为滚动轴承滚动体故障样本;10组,11组,12组样本为滚动轴承外环故障样本。我们将运用K-均值聚类算法对以下12组样本数据聚类,对K值分别取不同的值,把正常数据和故障数据聚为不同的类别。这里我们令K的值分别取2和4,分别对应K-均值聚类算法把实验数据聚为2个类别和4个类别。表3-1不同故障类型样本特征量Table 3-1 different fault types sample characteristics 特征样本ch(1)ch(2)ch(3)ch(4)ch(5)ch(6)ch(
20、7)ch(8)*ch(9)ch(10)10.07380.05910.18070.48781.24912.44933.05943.432760.4805.573520.07160.05800.18880.36311.23292.63843.25283.633959.43845.244330.07410.05930.18870.42401.24892.54743.18143.553660.74105.619640.23490.18530.77510.59211.26773.29954.18294.7204189.743056.506450.23470.18820.79960.50721.24733
21、.40644.24874.7622192.721956.427760.23440.18620.69100.55081.25892.94883.71224.1740190.625556.239170.08900.07080.26570.49731.25712.98623.75404.235572.46348.103780.09150.07270.26210.54541.25852.86393.60434.069674.45228.574090.09340.07520.26520.42291.24312.83933.52953.952276.95388.9364100.18700.14680.63
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 毕业设计 论文 均值 算法 滚动轴承 故障诊断 中的 应用
链接地址:https://www.31ppt.com/p-4016311.html