数据仓库数据仓库概述课件.ppt
《数据仓库数据仓库概述课件.ppt》由会员分享,可在线阅读,更多相关《数据仓库数据仓库概述课件.ppt(59页珍藏版)》请在三一办公上搜索。
1、1,第1讲 数据仓库概述,2,数据仓库概述,1.1 数据仓库产生的原因1.2 数据仓库的基本概念1.3 数据仓库的体系结构,3,数据仓库概述,1.1 数据仓库产生的原因1.1.1 操作型数据处理1.1.2 分析型数据处理1.1.3 两种数据处理模式的差异1.1.4 数据库系统的局限性,4,1.1数据仓库产生的原因,两者有何不同?数据库:存放数据的地方。数据仓库:存放数据的地方。,5,1.1数据仓库产生的原因,两者有何不同?数据库:存放数据的地方。数据仓库:存放数据的地方。,6,1.1数据仓库产生的原因,两者有何不同?数据库:存放数据的地方。数据仓库:存放数据的地方。,7,1.1数据仓库产生的原
2、因,8,1.1数据仓库产生的原因,9,1.1数据仓库产生的原因,两者有何不同?数据库:存放数据的地方。数据仓库:存放数据的地方。,10,1.1数据仓库产生的原因,数据处理的类型操作型处理(OLTP):数据的收集、整理、存储、查询和增、删、改操作。分析型处理(OLAP):数据的再加工,往往要访问大量的历史数据,进行复杂的统计分析。,11,1.1.1操作型数据处理,是数据库系统的主要应用特点:数据存取频率高、响应时间要快、 存取数据量小、数据存储正确可靠。系统基本架构:,12,1.1.1操作型数据处理,为了有效地对事务进行处理,数据库管理系统在技术和管理上采取了很多措施:提出了事务的概念采用日志、
3、备份等恢复技术和并发控制技术采用索引技术快速定位数据,13,1.1.1操作型数据处理,在数据库设计中广泛采用了规范化理论,消除表中属性间的部分函数依赖和传递函数依赖。消除了数据的冗余,缩短了数据处理时间。,14,1.1.2分析型数据处理,典型的分析型应用就是决策支持系统。需要具备的基本功能是:建立各种数学模型,对数据统计分析,得出有用的信息作为决策的依据。,15,1.1.2分析型数据处理,常规应用实例:某产品的销售经理希望通过调整该产品在各零售店的分配数量来扩大其销售量。需要查询历史数据库中各类零售店最近若干年(例如5年)内每天的销售记录。统计运算计算出近5年来各店的年度销售量。比较确定销售量
4、增长较快的零售店。,16,1.1.2分析型数据处理,决策支持系统:需要花数小时甚至更长时间的处理、需要遍历数据库中的大部分数据,进行复杂的计算,需要消耗大量的系统资源。,17,1.1.3两者数据处理模式的差别,18,1.1.4数据库系统的局限,传统的数据库系统在操作型数据处理应用中取得了巨大的成功。将其应用到分析型数据处理方面却无能为力。,19,1.1.4数据库系统的局限,信息系统建设的阶段性和分布性的特点, 导致“信息孤岛”的存在。,20,1.1.4数据库系统的局限,21,1.1.4数据库系统的局限(续),1)数据的分散联机事务处理系统一般只需要与本部门业务相关的当前数据。企业内部各应用之间
5、实际上几乎都是独立的。,22,2)“蜘蛛网”问题解决数据分散的一种方法就是对数据进行集成抽取程序带来了“蜘蛛网”问题,即需要在抽取的数据中再次抽取,将导致企业数据之间形成错综复杂的网状结构。,1.1.4数据库系统的局限,23,3)数据不一致问题由于数据分散,导致多个应用间的数据不一致:同一字段在不同应用中具有不同的数据类型同一字段在不同应用中具有不同的名字字段名字相同,但含义不同,1.1.4数据库系统的局限,24,4)数据动态集成问题数据集成开销很大。一些应用仅在开始时对进行集成,以后一直以这部分集成数据作为分析基础,称为静态集成。导致决策者使用过时数据。如果希望能够用上最新数据,每次分析之前
6、都进行数据集成,称为动态集成。联机事务处理系统不具备动态集成能力。,1.1.4数据库系统的局限,25,5)历史数据问题联机事务处理一般只需要当前数据,数据库适于存储高度结构化的日常事务细节数据。决策型数据多为历史性、汇总性或计算性数据。,1.1.4数据库系统的局限,26,6)数据的综合问题联机事务处理系统中积累了大量的细节数据,决策支持系统并不对细节数据进行分析。决策分析环境中,细节数据量太大一方面会严重影响分析效率,另一方面这些细节数据会分散决策者的注意力。因此分析前,需要对细节数据进行不同程度的综合。,1.1.4数据库系统的局限,27,结论要提高分析和决策的效率和有效性,必须把分析数据从事
7、务处理环境中提取出来,按照决策支持系统处理的需要进行重新组织,建立单独的分析型处理环境。数据仓库正是为了构建这种新的分析型处理环境而出现的一种数据存储和组织技术。,1.1.4数据库系统的局限,28,数据仓库概述,1.1 数据仓库产生的原因1.2 数据仓库的基本概念1.3 数据仓库的体系结构,29,“数据仓库”一词最早是在1990年,由Bill Inmon提出的。数据仓库的四个基本特征:数据仓库的数据是面向主题的(Subject Oriented);数据仓库的数据时集成的(Integrate);数据仓库的数据不可更新(Non-Volatile);数据仓库的数据时随时间不断变化(Time Vari
8、ant)的。,1.2 数据仓库的基本概念,2022/12/5,30,可编辑,31,数据仓库就是一个面向主题的、集成的、不可更新的、随时间不断变化的数据集合,通常用于企业的决策支持。,1.2 数据仓库的基本概念,32,主题:是一个抽象的概念,是在较高层次上将企业信息系统中的数据综合、归类并进行分析利用的抽象。在逻辑上,它对应于企业中某一宏观分析领域所涉及的分析对象。面向主题的数据组织方式可在较高层次上对分析对象的数据给出完整、一致的描述。,1.2.1 面向主题,33,传统的面向应用的数据组织方式围绕相关的组织、部门进行详细调查,收集数据库的基础数据及其处理过程。掌握企业内数据的动态特征(数据流图
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 概述 课件
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-1559446.html