离散制造业聚类挖掘模型研究与应用课件.ppt
基于离散制造业的聚类挖掘模型研究及应用,2,目录,1.本课题研究的主要内容,2.主要的研究工作,3.对未来的展望,4.学术论文发表情况,研究生学位论文答辩,成都信息工程学院,3,成都信息工程学院,决策支持系统整体框架图,本课题研究的主要内容,数据挖掘(data mining,DM)也叫数据开采,数据采掘等,就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中人们事先不知道的,但又是潜在有用的信息和知识的过程。,聚类是研究“物以类聚”的一个方法,它的任务就是把一组样本按照相似性归成若干个类,使得同一个类的个体聚集在一个类中心的周围,它们之间的距离比较近,而不同类的个体之间的距离比较远。,4,本课题研究的主要内容,成都信息工程学院,聚类模块逻辑结构图,研究生学位论文答辩,5,主要的研究工作,成都信息工程学院,聚类模块逻辑结构图,主题分析,研究生学位论文答辩,6,主要的研究工作,成都信息工程学院,主题分层图,研究生学位论文答辩,7,主要的研究工作,成都信息工程学院,聚类模块逻辑结构图,构建数据仓库,研究生学位论文答辩,8,主要的研究工作,成都信息工程学院,数据仓库的建立过程,研究生学位论文答辩,9,主要的研究工作,成都信息工程学院,物资主、维表关系图,研究生学位论文答辩,10,成都信息工程学院,聚类模块逻辑结构图,研究改进算法,研究生学位论文答辩,主要的研究工作,11,成都信息工程学院,K-均值法流程图,研究生学位论文答辩,优点:能有效地解决簇内密集,簇间区别明显的数据聚类问题,其时间复杂度为O(nkt),有相对较高的可伸缩性和高效率。,缺点:要求用户必须事先确定参数K,且聚类结果与数据的输入顺序有明显的关系,对于孤立点数据也非常敏感。,主要的研究工作,12,成都信息工程学院,改进后的K-均值法流程图,研究生学位论文答辩,主要的研究工作,13,成都信息工程学院,研究生学位论文答辩,降维前的聚类结果,降维后的聚类结果,主要的研究工作,14,成都信息工程学院,研究生学位论文答辩,调整数据输入顺序前的聚类结果,调整数据输入顺序后的聚类结果,主要的研究工作,15,成都信息工程学院,研究生学位论文答辩,处理孤立点数据前的聚类结果,处理孤立点数据后的聚类结果,主要的研究工作,16,成都信息工程学院,聚类模块逻辑结构图,主题分析,构建数据仓库,研究改进算法,研究生学位论文答辩,搭建新平台,主要的研究工作,17,成都信息工程学院,聚类模块功能模块图,研究生学位论文答辩,主要的研究工作,18,成都信息工程学院,供应商知识管理决策过程,以供应商信用等级聚类为例,研究生学位论文答辩,主要的研究工作,19,成都信息工程学院,供应商等级聚类表,研究生学位论文答辩,主要的研究工作,20,成都信息工程学院,初步的聚类结果,不易理解,研究生学位论文答辩,主要的研究工作,21,成都信息工程学院,供应商主题首页面,研究生学位论文答辩,主要的研究工作,簇的数目,种子数,帮助,物料采购情况,供应商信息,聚类,22,成都信息工程学院,研究生学位论文答辩,供应商主题聚类概要结果展示,主要的研究工作,图形展示,结果概要描述,查看,23,成都信息工程学院,研究生学位论文答辩,供应商主题聚类详细结果展示,主要的研究工作,选择,24,成都信息工程学院,研究生学位论文答辩,供应商主题聚类进一步操作展示,主要的研究工作,25,成都信息工程学院,研究生学位论文答辩,供应商主题聚类进一步操作结果展示,主要的研究工作,26,对未来的展望,聚类分析技术作为无先验知识情况下进行数据挖掘的首选,具有广阔的发展前景。下一步的工作可以从以下几个方面进行:一、扩大应用领域,本文仅对聚类分析在离散制造业方面的应用进行了研究,如何将聚类技术应用于其他领域中,还有待研究。二、加强算法改进,本文只着重研究了聚类分析中的K-Means算法,对于其他聚类算法未作深入的研究,在今后的工作中,可以试着对聚类的不同算法进行交叉分析,以获得更有效的改进算法。三、尝试技术交融,通过对聚类与其他数据挖掘技术或数据挖掘以外的技术的结合应用进行探索,以期能使聚类功能更完善,实用性更强。,成都信息工程学院,研究生学位论文答辩,27,学术论文发表情况,成都信息工程学院,在论文方面,已发表一篇关于聚类分析的学术论文(聚类挖掘在离散制造业中的应用研究计算机科学 第36卷,第4期(2009.7)。,