数据仓库与数据挖掘技术第1章.ppt
《数据仓库与数据挖掘技术第1章.ppt》由会员分享,可在线阅读,更多相关《数据仓库与数据挖掘技术第1章.ppt(31页珍藏版)》请在三一办公上搜索。
1、数据仓库与数据挖掘技术,第1章 数据仓库与数据挖掘概述,1.1数据仓库引论11.1.1为什么要建立数据仓库11.1.2什么是数据仓库21.1.3数据仓库的特点71.1.4数据进入数据仓库的基本过程与建立数据仓库的步骤111.1.5分析数据仓库的内容121.2数据挖掘引论131.2.1为什么要进行数据挖掘131.2.2什么是数据挖掘181.2.3数据挖掘的特点211.2.4数据挖掘的基本过程与步骤221.2.5分析数据挖掘的内容261.3数据挖掘与数据仓库的关系281.4数据仓库与数据挖掘的应用311.4.1数据挖掘在零售业的应用311.4.2数据挖掘技术在商业银行中的应用361.4.3数据挖掘
2、在电信部门的应用401.4.4数据挖掘在贝斯出口公司的应用421.4.5数据挖掘如何预测信用卡欺诈421.4.6数据挖掘在证券行业的应用43思考练习题一44,1.1.1为什么要建立数据仓库,数据仓库的作用 建立数据仓库的好处,1.1.2 什么是数据仓库,1数据仓库的概念 在Building the Data Warehouse中定义数据仓库为:“数据仓库是面向主题的、集成的、随时间变化的、历史的、稳定的、支持决策制定过程的数据集合。”即数据仓库是在管理人员决策中的面向主题的、集成的、非易失的并且随时间而变化的数据集合。“DW是作为DSS基础的分析型DB,用来存放大容量的只读数据,为制定决策提供
3、所需的信息。”“DW是与操作型系统相分离的、基于标准企业模型集成的、带有时间属性的。即与企业定义的时间区段相关,面向主题且不可更新的数据集合。”数据仓库是一种来源于各种渠道的单一的、完整的、稳定的数据存储。这种数据存储提供给可以允许最终用户的可以是一种他们能够在其业务范畴中理解并使用的方式。数据仓库是大量有关公司数据的数据存储。仓库提供公司数据以及组织数据的访问功能,其中的数据是一致的(consistent),并且可以按每种可能的商业度量方式分解和组合;数据仓库也是一套查询、分析和呈现信息的工具;数据仓库是我们发布所用数据的场所,其中数据的质量是业务再工程的驱动器(driver of busi
4、ness reengineering)。定义的共同特征:首先,数据仓库包含大量数据,其中一些数据来源于组织中的操作数据,也有一些数据可能来自于组织外部;其次,组织数据仓库是为了更加便利地使用数据进行决策;最后,数据仓库为最终用户提供了可用来存取数据的工具。,数据仓库的定义,综合对数据仓库的各种理解以及其特征,我们可以定义数据仓库是一种为信息分析提供了良好的基础并支持管理决策活动的分析环境,是面向主题的、集成的、稳定的、不可更新的、随时间变化的、分层次的多维的集成数据集合。,2与数据仓库相关的几个概念数据(data)是一组表示数量、行动和目标的非随机的可以鉴别的符号,是对客观事物记录下来的,可以
5、鉴别的符号。这些符号包括数字、字符、文字、图形、图像、声音。操作数据原子数据汇总数据特定查询响应,数据仓库环境,数据类型的分类 元数据是指用来描述数据仓库数据库内容的数据。以后将详细讨论元数据。数据库是一组内部相关联的数据集合。其中关系数据库是表的集合,每个表都有惟一的名字,且每个表都由一组字段(属性)所存放的记录组成。数据库管理系统(DBMS)是用来管理和存取数据库的一组软件。该软件具有如下机制:数据库结构定义,数据的存储、并发、共享或分布的数据访问,数据的一致性和安全性。数据库系统是一个由硬件、软件、数据库和管理人员组成的复杂系统。随着信息技术不断的发展,对数据处理的技术和人们对数据的需求
6、也在不断的进化,如图1.2所示的数据库系统及相关技术的演化。数据集市(data marts)通常是指较为小型化、针对特定目标且建设成本较低的一种数据仓库。为了特定的应用目的或应用范围,而从数据仓库中独立出来的一部分数据,也可称为部门数据或主题数据(subject data)。,数据库系统及相关技术的演化,1.1.3 数据仓库的特点,1主题与面向主题2数据仓库数据的集成性3数据仓库数据的不可更新性4DW数据的时态性,1.1.4 数据进入数据仓库的基本过程与建立数据仓库的步骤,1数据进入数据仓库的基本过程操作数据向数据仓库的移动包括以下五个过程:提取、变换、净化、加载和汇总。2建立数据仓库的步骤1
7、)收集和分析业务需求;2)建立数据模型和数据仓库的物理设计;3)定义数据源;4)选择数据仓库技术和平台;5)从操作型数据库中提取、转换和净化数据到数据仓库;6)选择访问和报表工具;7)选择数据库连接软件;8)选择数据分析和数据展示软件;9)更新数据仓库;,1.1.5 分析数据仓库的内容,操作型数据和分析型数据的区别,1.2.1 为什么要进行数据挖掘,1数据挖掘的作用数据挖掘解决诸如欺诈甄别(fraud detection)、保留客户(customer retention)、消除摩擦(attrition)、数据库营销(database marketing)、市场细分(market segment
8、ation)、风险分析(risk analysis)、亲和力分析(affinity analysis)、客户满意度(customer satisfaction)、破产预测(bankruptcy prediction)、职务分析(portfolio analysis)等业务问题提供了有效的方法。,2数据挖掘的背景(1)数据挖掘的商业背景(2)数据挖掘的技术背景(3)数据挖掘的社会背景,3数据挖掘对企业的影响,1.2.2 什么是数据挖掘,1数据挖掘概念定义1 G.Piatetsky 等定义数据挖掘为从数据库的大量数据中揭示出隐含的、先前未知的、潜在有用的信息的非平凡过程。定义2 有人简单认为,数据
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 数据 挖掘 技术
链接地址:https://www.31ppt.com/p-5985363.html