《数据仓库基础知识培训.ppt》由会员分享,可在线阅读,更多相关《数据仓库基础知识培训.ppt(27页珍藏版)》请在三一办公上搜索。
1、数据仓库我们公司数据中心架构指标、维度与报表和OLAP分析主题关系名词解释及缩略语,内部交流,随着信息技术的不断推广和应用,许多企业都已经在使用管理信息系统处理管理事务和日常业务。这些管理信息系统为企业积累了大量的信息。企业管理者开始考虑如何利用这些信息海洋对企业的管理决策提供支持。因此,产生了与传统数据库有很大差异的数据环境要求和从这些海洋数据中获取特殊知识的工具需要。本章目标:(1)了解数据仓库的发展与展望。(2)理解数据仓库的体系结构和参照结构。,数据仓库概述,数据仓库概述,1.1数据仓库的发展与展望1.2数据仓库的体系结构 1.3数据仓库的参照结构,从传统数据库到数据仓库 随着市场竞争
2、的加剧,信息系统的用户已经不满足于仅仅用计算机去处理每天所发生的事务数据,而是需要信息能够支持决策的信息,去帮助管理决策。这就需要一种能够将日常业务处理中所收集到的各种数据转变为具有商业价值信息的技术,传统数据库系统无法承担这一责任。因为传统数据库的处理方式和决策分析中的数据需求不相称。这些不相称性主要表现在决策处理中的系统响应问题、决策数据需求的问题和决策数据操作的问题。,1.1数据仓库的发展与展望,1.决策处理的系统响应问题2.决策数据需求的问题3.决策数据操作的问题4.数据仓库与传统数据库的对比,1.1数据仓库的发展与展望,1.1数据仓库的发展与展望,定义:“一个面向主题的、集成的、随时
3、间变化的、非易失性数据的集合,用于支持管理层的决策过程”。特性:面向主题性数据集成性数据的时变性数据的非易失性数据的集合性支持决策作用。,1.1.2 数据仓库的定义与基本特性,1.2.1 数据仓库的概念结构从数据仓库的概念结构看,应该包含:数据源、数据准备区、数据仓库数据库、数据集市/知识挖掘库以及各种管理工具和应用工具。,1.2 数据仓库的体系结构,1.2.2 虚拟数据仓库结构虚拟数据仓库利用描述了业务系统中数据位置和抽取数据算法的元数据直接从业务系统中抽取查询的数据进行概括、聚合操作后,将最终结果提供给用户,1.2.3 数据集市结构数据集市结构或称为主题结构的数据仓库是按照主题进行构思所形
4、成的数据仓库,没有一个独立的数据仓库。系统的数据不存储在同一数据仓库中,每个主题有自己的物理存储区。,1.2.4 单一数据仓库结构将所有的主题都集中到一个大型数据库中的体系结构。数据源中数据被按照同一标准抽取到独立的数据仓库中,用户在使用时再根据主题将数据仓库中的数据发布到数据集市中。,1.2.5 分布式数据仓库结构在企业各个分公司具有相当大的独立性时,企业总部设置一个全局数据仓库,各个分公司设置各自的局部数据仓库。局部数据仓库主要存储各自的未经转换的细节数据,全局数据仓库中主要存储经过转换的综合数据,站点A 站点B 站点C 站点D,全局数据仓库,总部,1.3数据仓库的参照结构,数据仓库的基本
5、功能包含:数据抽取,数据筛选、清理,清理后的数据加载,设立数据集市,完成数据仓库的查询、决策分析和知识的挖掘等操作。数据仓库的管理层分成数据管理与元数据管理两部分,主要负责对数据仓库中的数据抽取、清理、加载、更新与刷新等操作进行管理。数据仓库环境支持层包含数据传输和数据仓库基础两部分。,1.3.1 数据仓库基本功能层,数据来源主要包含:业务数据、历史数据、办公数据、Web数据、外部数据以及数据源元数据 数据准备区的功能结构部分由数据标准化处理、数据的过滤与匹配、数据的净化处理、标明数据的时间戳、确认数据质量与元数据抽取和创建等操作组成 数据仓库的功能结构部分由数据重整和数据仓库创建以及元数据管
6、理组成 数据集市/知识挖掘库的功能结构与数据仓库的功能结构极为相似 数据仓库的数据存取与使用结构主要为数据仓库的最终用户提供进行决策分析和挖掘知识的功能。数据仓库的数据存取与使用结构应该包含数据仓库存取与检索、元数据管理以及数据仓库分析与报告,1.3.2 数据仓库的管理层,数据管理层中的数据抽取、新数据需求与查询管理主要负责完成从数据源中抽取数据的管理。数据仓库中的数据加载、存储、刷新和更新系统则负责对从数据源中所抽取的数据在完成筛选、净化处理以后,将这些数据加载、存储到数据仓库中;捕获数据源中的数据变化,用最新数据充实数据仓库;根据用户的需求和数据仓库管理的要求对数据仓库进行更新等工作。安全
7、性与用户授权管理系统主要负责数据仓库的安全管理工作。数据仓库的数据归档、恢复及净化系统主要负责定期对数据仓库中的数据进行归档、备份。净化系统则负责对从数据源所抽取的数据进行数据的筛选、数据标准的统一、数据内容的统一等各种求精、重整净化工作的管理。,1.3.3 数据仓库的元数据管理层,负责管理数据仓库所使用的元数据,其中包括:数据仓库、数据集市/知识挖掘库和词汇表管理元数据抽取、创建、存储和更新管理预定义的查询和报表以及索引管理刷新与复制管理,登录、归档、恢复与净化管理,1.3.4 数据仓库的环境支持层,数据传输层包含了:数据传输和传送网络客户/服务器代理和中间件复制系统数据传输的安全保障系统,我们公司数据中心架构,分析型系统架构目标系统架构说明存储区域比较分析ETL过程分析,我们公司数据中心架构,分析型系统架构,我们公司数据中心架构,目标系统架构说明,我们公司数据中心架构,存储区域比较分析,我们公司数据中心架构,ETL过程分析,指标、维度与报表OLAP分析主题关系,名词解释及缩略语,名词解释,名词解释及缩略语,缩略语,名词解释及缩略语,缩略语,内部交流,谢谢!,
链接地址:https://www.31ppt.com/p-6364915.html