数据挖掘及其工业应用.ppt
数据挖掘及其工业应用,答辩者:胡 铭指导教师:杨 涛2010年6月3日,2,选题,意义:数据挖掘技术的发展及其广泛应用方法:阅读相关文献了解国内外数据挖掘发展状 况,并加以实用举例分析。,3,论文结构,数据挖掘技术理论 起源,定义,数据特征,应用现状数据挖掘应用实例 医药领域:两种聚类算法及其性能比较 证券领域:BP算法预测股市实例,4,数据挖掘理论,数据挖掘溯源及“尿布与啤酒”的故事 数据挖掘是从大量的数据中挖掘出隐含的,位置的,用户可能感兴趣的和对决策有潜在价值的知识和规则。这些规则蕴含了数据库中一组对象之间的特定关系,揭示出一些有用的信息,可以为经营决策、市场策划和金融预测等方面提供依据。数据挖掘大体上有两种功能,即预测/验证功能和描述功能 应用十分广泛,从政府管理决策、商业经营、科学研究到工业决策支持,5,数据挖掘应用实例,在医药领域的应用GK算法,6,两种聚类算法的比较,7,不同的聚类算法对同一数据集的聚类结果是不尽相同的,聚类效果和性能可以通过迭代步骤(IS)、分组指数(PI)、分离指数(SI)、XBI几个指标进行评价。如下表格所示。IS PISIXBIGK聚类701.06460.01333.3545FCM聚类340.87300.00772.2854,8,迭代步骤:两种方法都是迭代算法,由上表可以看出GK聚类算法没有FCM快,因为GK是距离自适应而后者是距离固定的。分组指数:它是每个分组紧致性和分离度比值之和,在比较有相同聚类个数方法的分组有效性是非常有用的。分离指数:它是每个分组的紧致性与最小距离分离度比值之和。XBI:它是衡量每个类的紧致性和类与类之间的分离性的指标。由以上表格中的对比可以看出,GK算法得出的每个类是紧致的,类之间的分离度较高,因此聚类效果好。,9,BP算法预测股市,10,11,结 论,数据挖掘从理论研究到产品开发只用了短短数年,目前在国内外已经进入到应用阶段。数据挖掘技术的应用十分广泛,从政府管理决策,商业经营,科学研究到工业决策支持等各个领域都可以找到数据挖掘的用武之地本文着重探究了数据挖掘在各个领域的应用,查阅了大量的相关资料,在各个领域的应用都举出了相应的实例,并着重举出在医药领域和股票领域的应用。,厦门大学06级电子工程系 胡铭,谢谢!,