数据挖掘及应用数据挖掘概述.ppt
《数据挖掘及应用数据挖掘概述.ppt》由会员分享,可在线阅读,更多相关《数据挖掘及应用数据挖掘概述.ppt(46页珍藏版)》请在三一办公上搜索。
1、数据挖掘及应用:数据挖掘概述,统计与数学学院:徐雪琪2010-11-30,数据挖掘的原由,可怕的数据,有价值的知识,数据挖掘的原由,数据,知识SWA,决策,数据挖掘概念的提出,现在数据挖掘概念的首次国际学术会议1989年8月在美国底特律召开的第11届国际联合人工智能学术会议(IJCAI89)上,Gregory Piatetsky-Shapiro组织了“数据库中的知识发现”(KDD:Knowledge Discovery in Database)专题讨论会,该讨论会的重点是强调发现(Discovery)的方法以及发现的是知识(Knowledge)两个方面。相继开展的专题讨论会随后在1991、19
2、93和1994年都举行了KDD专题讨论会,来自各个领域的研究人员和应用开发者集中讨论了数据统计、海量数据分析算法、知识表示和知识运用等问题。,数据挖掘概念的提出,第一届KDD国际学术会议 随着参与科研和开发人员的不断增加,国际KDD组委会于1995年把专题讨论会发展成为国际年会。在加拿大的蒙特利尔市召开了第一届KDD国际学术会。其会议名称全称为“ACM SIGKDD(Special Interested Group on Knowledge Discovery in Databases)International Conference on Knowledge Discovery and Da
3、ta Mining”在这次会议上“数据挖掘”(Data Mining)概念第一次由Usama Fayaad提出。Usama Fayaad 对数据挖掘概念的界定 数据挖掘指的是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、有效的、新颖的、潜在有用的、并且最终可理解的模式的非平凡过程。SQLServer2005 数据挖掘指的是分析数据,使用自动化或半自动化的工具来挖掘隐含的模式。数据挖掘技术:市场营销、销售与客户关系管理领域的应用 数据挖掘指的是一种态度,它表明商业活动应该基于认知,分析获得的决策比没有任何分析所得的决策好得多,经过测算的结果更有利于商业盈利。SAS 软件研
4、究所对数据挖掘所下的定义是:数据挖掘是按照既定的业务目标,对大量的企业数据进行探索、揭示隐藏其中的规律性并进一步将之模型化的先进、有效的方法。,Past KDD(Knowledge Discovery and Data Mining)Meetings,KDD-2007,13th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,San Jose,California,Aug 12,2007 KDD-2006,12th ACM SIGKDD International Conference on
5、Knowledge Discovery and Data Mining,August 20-23,2006,Philadelphia,PA,USA.KDD-2005,11th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,August 21-24,2005,Chicago,IL,USA.KDD-2004,10th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,August 22-25,20
6、03,Seattle,WA,USA.KDD-2003,9th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,August 24-27,2003,Washington,DC,USA.KDD-2002,8th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,July 23-26,2002,Edmonton,Alberta,Canada.KDD-2001,7th ACM SIGKDD Intern
7、ational Conference on Knowledge Discovery and Data Mining,August 26-29,2001,San Francisco,CA,USA.KDD-2000,6th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,August 20-23,2000,Boston,MA,USA.KDD-99,5th ACM SIGKDD International Conference on Knowledge Discovery and Data Mini
8、ng,August 15-18,1999,San Diego,CA,USA.KDD-98,4th International Conference on Knowledge Discovery and Data Mining,August 27-31,1998,New York,NY,USA.KDD-97,3rd International Conference on Knowledge Discovery and Data Mining,August 14-17,1997,Newport Beach,CA KDD-96,2nd International Conference on Know
9、ledge Discovery and Data Mining,August 4-8,1996,Portland,OR KDD-95,1st International Conference on Knowledge Discovery and Data Mining,August 20-21,1995,Montreal,Canada KDD-94 workshop,Seattle,WA,July 31-Aug 1,1994 KDD-93 workshop,Washington,D.C.,July 11-12,1993.KDD-91 workshop,Anaheim,CA,July 14-15
10、,1991.KDD-89 workshop,Detroit,MI,August 20,1989.,其它数据挖掘年会,PAKDD(Pacific-Asia conference on knowledge discovery and data mining)亚太平洋地区数据挖掘年会,从1997年开始,每年召开一次,至今已召开了14届,其中1999年的PAKDD在我国北京召开,2007年的也在我国南京召开,最近一届于2010年6月21-24日在印度的Hyderabad召开。PKDD(European symposium on principles of data mining and knowled
11、ge discovery)欧洲数据挖掘会议,也是从1997年开始,每年召开一次,至今也已召开了14届,最近一届于2010年9月2024日在巴塞罗那召开。SIAMData Mining(Society for Industrial and Applied Mathematics)SIAM组织召开的数据挖掘讨论会,2001年4月召开第1届讨论会,专注于科学数据的数据挖掘,以后每年召开一次,至今已召开了10届,第十届SIAM数据挖掘国际会议于2010年4月295月1日在美国Columbus召开。,国外数据挖掘工作组(较早),R.A grawal领导下的IBM Almaden实验室的数据挖掘工作组 J
12、.Han带领下的SFU工作组 Stanford大学的Ullman领导的关联规则研究小组Minnesota大学的Kumar领导的并行数据挖掘研究小组 新西兰Ian H.Witten教授领导下的Weka工作组,国内数据挖掘研究进展,数据挖掘讨论组(可能已关闭)数据挖掘研究院中文站论坛,中国人民大学统计学院开辟了“统计学与数据挖掘”研究专栏厦门大学计划统计系数据挖掘中心(Data Mining Center,DMC),是在台湾辅仁大学统计资讯学系谢邦昌教授的大力倡导下,于2007年底成立的学术研究单位。厦门大学朱建平教授专著数据挖掘的统计方法与实践于2005年12月由中国统计出版社出版,国内数据挖掘
13、研究进展,1993年国家自然科学基金首次支持我们对该领域的研究项目。2002年度的国家社会科学基金在统计学类中首次对该领域的研究予以支持。全国数据库学术会议(NDBC,National DataBase Academic Conference)重要的杂志有计算机学报、软件学报和计算机研究与发展等。,数据挖掘功能,功能分类预言(Predication):用历史预测未来描述(Description):了解数据中潜在的规律功能特征描述关联分析聚类分析离群点分析分类和预测,数据挖掘学科性质,数据挖掘学科性质,数据挖掘是“智能化的统计”,应用理论,数据挖掘过程(jiawei Han),数据清理(消除噪声
14、或不一致数据)数据集成(多种数据源可以组合在一起)数据选择(从数据库中检索与分析任务相关的数据)数据变换(数据变换或统一成适合挖掘的形式)数据挖掘(使用各种方法提取数据模式)模式评估(使用某种度量,识别真正有趣的模式)知识表示(使用可视化和知识表示技术,向用户提供挖掘的知识data mining concepts and techniques,从系统设计看数据挖掘过程模型,一种是 Fayyad 等人总结的过程模型另一种是遵循 CRISP-DM 标准的过程模型,Fayyad过程模型,CRISP-DM(Cross-Industry Standard Process for Data Mining)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 挖掘 应用 概述
链接地址:https://www.31ppt.com/p-6296658.html