【教学课件】第十章数据仓库.ppt
《【教学课件】第十章数据仓库.ppt》由会员分享,可在线阅读,更多相关《【教学课件】第十章数据仓库.ppt(37页珍藏版)》请在三一办公上搜索。
1、第十章 数据仓库,本章结构,10.1 数据仓库基本概念10.2数据仓库的基本原理10.3多维数据库与OLAP分析 10.4数据仓库模型设计10.5数据仓库的应用,10.1 数据仓库基本概念,10.1.1 数据仓库的产生 企业内部各部门的数据各不相同,利用这些数据进行分析得到的结论也会产生差异甚至截然相反。可见,传统的关系型数据库无法满足分析数据、支持决策的需求。这势必要求分析型数据环境的产生。数据仓库就是在此时产生的,数据仓库的基本原理,多维数据库与OLAP分析,数据仓库模型设计,数据仓库的应用,数据仓库基本概念,10.1.2 数据仓库与数据库的区别,表10-1数据仓库和数据库的区别,数据仓库
2、的基本原理,多维数据库与OLAP分析,数据仓库模型设计,数据仓库的应用,数据仓库基本概念,数据仓库的定义,著名的数据仓库专家 W.H.Inmon 的定义是:数据仓库(Data Warehouse)是一个面向主题的、集成的、非易失的、随时间变化的数据集合,用于支持管理决策。该定义指出了数据仓库的四个特性:,面向主题(Subject Oriented),集成性(Integrated),非易失性(Non-Volatile),时变性(Time Variant),数据仓库的基本原理,多维数据库与OLAP分析,数据仓库模型设计,数据仓库的应用,数据仓库基本概念,10.2数据仓库的基本原理,数据仓库的体系结
3、构,数据仓库的基本原理,多维数据库与OLAP分析,数据仓库模型设计,数据仓库的应用,数据仓库基本概念,数据仓库的相关概念,数据抽取,数据清理,外部数据,数据转化,数据仓库的基本原理,多维数据库与OLAP分析,数据仓库模型设计,数据仓库的应用,数据仓库基本概念,数据提取是指从外部数据源中收集数据,将提取出来的数据进行检测,并修正数据中的错误的过程称为数据清理,将不同格式的数据转换成相同格式过程称为数据转化,外部数据是从系统外部获得的与分析主题相关的数据,历史数据,元数据,数据仓库的基本原理,多维数据库与OLAP分析,数据仓库模型设计,数据仓库的应用,数据仓库基本概念,历史数据是指组织在长期的信息
4、处理过程中所积累下来的数据。一般对业务系统的当前运行不起作用,元数据是关于数据的数据。它是数据仓库中数据综合的一种类型。元数据的存储包括了数据仓库的结构、数据存储信息、数据提取、清洗和转换的规则、数据存取和检索的索引和配置等数据信息,数据颗粒,数据粒度有两种形式。第一种形式的数据粒度是面向OLAP的。粒度的大小反映了数据仓库中数据的综合程度。粒度越小,数据越详细,数据量也就越大,第二种形式的数据粒度是面向数据挖掘的,它反映的是抽样率,数据仓库的基本原理,多维数据库与OLAP分析,数据仓库模型设计,数据仓库的应用,数据仓库基本概念,数据集市(Data Mart),数据集市也叫数据市场,是企业级数
5、据仓库中针对某一主题的数据库,它是企业数据库的一个子集 按照数据集市的数据来源可将数据集市分为独立的数据集市和依赖的数据集市(1)独立的数据集市的数据直接来源于各信息系统。(2)依赖的数据集市的数据直接来源于中央数据仓库,也就是说它是在数据仓库的基础上建立起来的。,解决各别部门比较迫切的决策问题,复杂、难于维护,成本大大增加,高操作的响应速度增强系统易维护性,会增加投资成本,数据仓库的基本原理,多维数据库与OLAP分析,数据仓库模型设计,数据仓库的应用,数据仓库基本概念,操作数据存储(Operational Data Store,ODS),ODS 是用于支持企业日常的全局应用的数据集合。ODS
6、解决的是“日常”性问题,因而具有引入数据是可变的、数据是当前或近期的两个特点 ODS 的应用一般体现在两个方面:,企业级的联机事务处理(OLTP)应用,近期的联机分析处理(OLAP),数据仓库的基本原理,多维数据库与OLAP分析,数据仓库模型设计,数据仓库的应用,数据仓库基本概念,10.3多维数据库与OLAP分析,多维数据库的基本概念,变量,企业要考察过去一段时间销售量的情况,销售量就是变量,维,在分析销售量的时候,可以从商品种类、时间、地区等几个角度考虑,这里面就包含了产品维、时间维和地理维,数据仓库的基本原理,多维数据库与OLAP分析,数据仓库模型设计,数据仓库的应用,数据仓库基本概念,变
7、量是分析数据时要考察的属性,用户分析问题的角度或决策分析的出发点构成了数据仓库中的维,维的层次性,图10-2地理维的层次性,数据仓库的基本原理,多维数据库与OLAP分析,数据仓库模型设计,数据仓库的应用,数据仓库基本概念,数据仓库中的维是具有层次性的。对于不同的层次,由上到下,层次是逐步细化的,维成员,图10-2中“东北地区吉林省”和“东北地区辽宁省”都是维成员,事实,如1999年、上海、产品A的销售量为5643,这就是一个事实,数据仓库的基本原理,多维数据库与OLAP分析,数据仓库模型设计,数据仓库的应用,数据仓库基本概念,维成员是维的一个取值,如果维分成了几个层次,那么维成员就是不同维层次
8、取值的组合,每一个维都取一个维成员,则可得到唯一确定的一个变量值。由各维度的取值和变量值构成了事实,多维数据立方体,数据仓库的基本原理,多维数据库与OLAP分析,数据仓库模型设计,数据仓库的应用,数据仓库基本概念,多维数据立方体对应的是一个多维数组,在多维数据立方体中可以用(维1、维2、维3维n、变量值)表示。用多维数据立方体的形式存储数据,可以节约存储空间,且可以更好地表示数据间的关系,多维数据模型上的OLAP操作,OLAP 技术的核心是多维分析。下面我们具体介绍OLAP 的分析动作(1)切片 对多维数据集(维 1、维 2 维 i 维 n、变量)在维度 i 上选定一个维成员,得到一个 n-1
9、 维多维数据集,称得到的这个 n-1 维多维数据集为原数据集在第 i 维上的数据切片,数据仓库的基本原理,多维数据库与OLAP分析,数据仓库模型设计,数据仓库的应用,数据仓库基本概念,(2)数据切块 在多维数据立方体中,确定某些维度的取值范围,得到一个原立方体的子立方体的过程称为数据切块(3)数据钻取 数据钻取也叫数据下钻,是由概括的数据到详细的数据的过程,比如由“年”数据下钻到“季度”数据,这无疑会得到更详细的数据,数据仓库的基本原理,多维数据库与OLAP分析,数据仓库模型设计,数据仓库的应用,数据仓库基本概念,数据聚集又叫数据上卷,它是数据钻取的逆过程。数据聚集是将详细的数据聚集为较概括的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教学课件 教学 课件 第十 数据仓库
链接地址:https://www.31ppt.com/p-5664642.html