数据仓库与数据挖掘1简介.ppt
《数据仓库与数据挖掘1简介.ppt》由会员分享,可在线阅读,更多相关《数据仓库与数据挖掘1简介.ppt(45页珍藏版)》请在三一办公上搜索。
1、数据仓库与数据挖掘Data Warehouse and Data Mining,2,数据仓库与数据挖掘,动机:为什么要进行数据挖掘数据挖掘的步骤数据挖掘在什么数据上进行数据挖掘功能和分类一些新的研究方向,3,动机:需要是发明之母,数据爆炸问题自动的数据收集工具和成熟的数据库技术导致大量数据存放在数据库、数据仓库和其它信息存储器中我们正被数据淹没,但却缺乏知识解决办法:数据仓库与数据挖掘数据仓库与联机分析处理(OLAP)从大型数据库的数据中提取有趣的知识(规则,规律性,模式,限制等),4,什么是数据挖掘,数据挖掘(数据库中知识发现)从大型数据库中提取有趣的(非平凡的、蕴涵的、先前未知的且是潜在有
2、用的)信息或模式其它名称数据库中知识发现(挖掘)(Knowledge discovery in databases,KDD),知识提取(knowledge extraction),数据/模式分析(data/pattern analysis),数据考古(data archeology),数据捕捞(data dredging),信息收获(information harvesting),商务智能(business intelligence)等,5,数据挖掘可能的应用,数据库分析和决策支持市场分析和管理:针对销售(target marketing),顾客关系管理,购物篮分析,交叉销售(cross se
3、lling),市场分割(market segmentation)风险分析与管理:预测,顾客关系,改进保险,质量控制,竞争能力分析欺骗检测与管理,6,数据挖掘可能的应用,其它应用文本挖掘(新闻组、email、文档资料)流数据挖掘(Stream data mining)Web挖掘DNA 数据分析,7,数据仓库与数据挖掘,动机:为什么要进行数据挖掘数据挖掘的步骤数据挖掘在什么数据上进行数据挖掘功能和分类一些新的研究方向,8,数据挖掘的过程,数据挖掘:KDD的核心,9,数据挖掘的过程,数据挖掘:KDD的核心,10,KDD的步骤,学习应用领域相关的先验知识和应用的目标创建目标数据集:数据选择数据清理和预
4、处理(可能占全部工作的 60%!)数据归约与变换发现有用的特征,维/变量归约,不变量的表示选择数据挖掘函数汇总,分类,回归,关联,聚类,11,KDD的步骤,选择挖掘算法数据挖掘:搜索有趣的模式模式评估和知识表示可视化,变换,删除冗余模式,等发现知识的使用,12,典型的数据挖掘系统结构,知识库,13,数据仓库与数据挖掘,动机:为什么要进行数据挖掘数据挖掘的步骤数据挖掘在什么数据上进行数据挖掘功能和分类一些新的研究方向,14,数据挖掘在什么数据上进行,平面文件关系数据库包括面向对象和对象-关系数据库事务(交易)数据库异种数据库和遗产数据库,15,数据挖掘在什么数据上进行,数据仓库,16,数据挖掘在
5、什么数据上进行,数据仓库,网页,17,数据挖掘在什么数据上进行,数据仓库,Top tier:前端工具,Middle tier:OLAP server,Bottom tier:数据仓库server,数据,18,数据挖掘在什么数据上进行,多媒体数据库,空间数据库,19,数据挖掘在什么数据上进行,时间序列数据库,20,数据挖掘在什么数据上进行,文本数据库,WWW,21,数据仓库与数据挖掘,动机:为什么要进行数据挖掘数据挖掘的步骤数据挖掘在什么数据上进行数据挖掘功能和分类一些新的研究方向,22,数据挖掘的功能,概念描述:特征和区分概化,汇总,比较数据特征,如干燥和潮湿的地区关联(相关和因果关系)多维和
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 数据 挖掘 简介
链接地址:https://www.31ppt.com/p-6578338.html