OLAP-在线联机分析.ppt
《OLAP-在线联机分析.ppt》由会员分享,可在线阅读,更多相关《OLAP-在线联机分析.ppt(50页珍藏版)》请在三一办公上搜索。
1、OLAP,多维数据集,多维数据集提供了一种信息系统结构,这种结构可以使企业灵活地对数据进行访问,可以用多种方法对数据进行切片、分块、动态地考察汇总数据和细节数据之间的关系数据仓库中的细节数据为多维数据集提供了稳健方便的数据源.,多维数据集和数据仓库,数据仓库与多维数据集的区别:多维数据集数据量比数据仓库少一个数据量级数据仓库只适合少量灵活访问,多维数据集适合大量不可预知的访问和分析数据仓库存储很长时间范围内的数据,多维数据集存储较短时间范围内的数据数据仓库只允许分析人员以受限的形式访问数据,而多维数据集允许自由地访问多维数据集和数据仓库有着互补的关系:数据仓库中可以存储非常细节的数据,而多维数
2、据集中往往会对细节数据进行轻度综合,DSS分析人员可以同时获取这二种数据汇总信息在多维数据集中计算和聚集后存储在数据仓库中,维(Dimension),维是人们观察数据的特定角度。例如,企业常常关心产品销售随着时间推移而产生的变化的情况,这时他是从时间的角度来观察产品的销售,所以时间就是一个维(时间维)。企业也常常关心自己的产品在不同地区的销售分布情况,这时他是从地理分布的角度来观察产品的销售,所以地理分布也是一个维(地理维)。,维度,维的层次,人们观察数据的某个特定角度(即某个维)还可以存在细节程度不同的多个描述方面,我们称这个描述方面为维的层次。一个维往往具有多个层次,例如:描述时间维时,可
3、以从日期、月份、季度、年等不同层次来描述,那么日期、月份、季度、年等就是时间维的层次;同样,城市、地区、国家就构成了一个地理维的多个层次。,维成员,维的一个取值就称为该维的一个维成员。如果一个维是多层次的,那么该维的维成员就是不同维层次的取值的组合。例如,考虑时间维具有日期、月份、年这三个层次,分别在日期、月份、年上各取一个值组合起来,就得到时间维的一个维成员,即“某年某月某日”。,多维数组,一个多维数组可以表示为(维1,维2,维n,变量),这样可以构成三维、四维及多维的数据表示结构。其中,变量表示我们所观察的数据对象,维1、维2、维n分别表示我们观察该数据对象的角度。如(时间,商品种类,商店
4、,销售额),从而构成一个有关商品销售额的三维数组。(2000年,家电,南京市,1亿)(2000年7月,女性服装,江苏省,10亿),数据单元(单元格),多维数组的取值称为数据单元。当多维数组的各个维都选中一个维成员,这些维成员的组合就唯一确定了一个观察对象的值,即(维成员1,维成员2,维成员n,对象值)。,立方体和超立方(Cube)多维数据模型的数据结构可以用这样来一个多维数组来表示:(维1,维2,维n,度量值),例如:商品销售数据是按时间、地区、商品种类,加上度量“销售额”组成的一个三维数组:(地区,时间,商品种类,销售额)。三维数组可以用一个立方体来直观的表示,立方体中每一个交点对应于一个事
5、件。一般地多维数组用多维立方体来表示,但数据立方体并不一定限于三维,因此又称为超立方,数据立方体,可以按照产品、日期、商店三个维度任意组合,生成销售情况,OLAP的产生背景,60年代,关系数据库之父提出了关系模型,促进了联机事务处理(OLTP)的发展(数据以表格的形式而非文件方式存储)。1993年,提出了OLAP概念,认为OLTP已不能满足终端用户对数据库查询分析的需要,SQL对大型数据库进行的简单查询也不能满足终端用户分析的要求。用户的决策分析需要对关系数据库进行大量计算才能得到结果,而查询的结果并不能满足决策者提出的需求。因此,提出了多维数据库和多维分析的概念,即OLAP。,什么是OLAP
6、?,OLAP,英文全称为On-Line Analysis Processing,中文名称为联机分析处理,也称为在线分析处理。OLAP允许以一种称为多维数据集的多维结构访问来自商业数据源(如数据仓库)的经过聚合和组织整理的数 据。OLAP是针对某个特定的主题进行联机数据访问、处理和分析,通过直观的方式从多个维度、多种数据综合程度将系统的运营情况展现给使用者。,OLTP与OLAP,随着数据库系统广泛应用,数据库系统记录和处理的数据越来越多,及时地记录和处理企业的各种业务数据,这些系统成为联机事务处理(OLTP)系统。数据库技术的广泛应用和技术的发展,人们已经不再满足于仅仅用数据库系统来记录企业的业
7、务活动数据和对数据的简单处理,人们需要对企业业务活动的数据进行各种分析,以便发现企业业务趋势,这些系统称为联机分析处理(OLAP)系统。,OLTP,OLAP,数据库原始操作,数据库导出数据或数据仓库数据,细节性数据,综合性数据,当前数据,历史性数据,经常性更新数据,不可更新,但可周期性刷新数据,一次性处理的数据量少,一次性处理的数据量多,对响应时间要求高,响应时间合理,用户量大,用户量少,面向操作人员、支持日常操作,面向决策人员、支持管理需要,面向应用、实物驱动,面向分析、分析驱动,OLTP与OLAP对比表,OLAP特性,快速性:用户对OLAP的快速反应能力有很高的要求。系统应能在5秒内对用户
8、的大部分分析要求做出反应。客户/服务器体系结构两层或三层C/S结构。可分析性:OLAP系统应能处理与应用有关的任何逻辑分析和统计分析。多维性:多维性是OLAP的关键属性。系统必须提供对数据的多维视图和分析,包括对层次维和多重层次维的完全支持。信息性:不论数据量有多大,也不管数据存储在何处,OLAP系统应能及时获得信息,并且管理大容量信息。,数据仓库与OLAP,数据仓库是一个包含企业历史数据的大规模数据库,这些历史数据安用十对企业的经营决策提供分析和支持。数据仓库中的数据是不能用于OLTP的,而OLAP技术则利用数据仓库中的数据进行联机分析,将复杂的分析查询结果快速地返回用户。OLAP利用多维数
9、据集和数据聚集技术对数据仓库中的数据进行组织和汇总,用联机分析和可视化工具对这些数据迅速进行评价。,OLAP是DW主要的前端支持工具。在OLAP系统中,客户能够以多维视觉图的方式,搜寻数据仓库中存储的数据。,多维报表饼图直方图柱状图曲线图切片和切块旋转地图,OLAP的基本操作,OLAP的基本操作是指对以多维形式组织起来的数据采取钻取(Drill-up和Drill-down)、切片(Slice)和切块(Dice)、以及旋转(Pivot)等各种分析动作,以求剖析数据,使最终用户能从多个角度、多侧面地观察数据仓库中的数据,从而深入地了解包含在数据中的信息和内涵。,钻取(Drill),钻取:是改变维的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- OLAP 在线 联机 分析
链接地址:https://www.31ppt.com/p-6513225.html