数据仓库解决方案概述.ppt
《数据仓库解决方案概述.ppt》由会员分享,可在线阅读,更多相关《数据仓库解决方案概述.ppt(51页珍藏版)》请在三一办公上搜索。
1、Sybase DW/Business Intelligence,Sybase中国有限公司,Sybase数据仓库解决方案,电信行业,议程,数据仓库解决方案概述Sybase数据仓库技术解决方案数据仓库设计工具抽取、转换、清洗和装载工具数据存储、管理服务器数据分析和展现工具数据字典(元数据)的管理工具,“数据仓库是在企业管理和决策中面向主题的,集成的,与时间相关的和不可修改的数据集合”,Bill Inmon,数据仓库定义,OLTP系统,财务系统,业务系统,计费系统,网管系统,数据仓库是完全不同的数据库系统,操作(业务)系统特性,信息(分析)系统特性,DW/BI 在电信行业的应用-How?,立足于现有
2、的OLTP系统当前数据和历史数据集中整合之后,构建一个庞大的数据仓库面向业务分析和决策层运用多维分析方法,充分挖掘数据中的信息应用DW/BI的三步曲,数据抽取,数据管理,数据分析,INFORMATION,信 息,数据仓库(Data Warehouse)是一种专为联机分析应用和决策支持系统提供数据源的结构化的数据环境数据仓库要解决的问题是从数据库中获取信息的问题。,信 息,INFORMATION,DW/BI 在电信行业的应用-小结什么是数据仓库(Data Warehouse)?,决策支持应用,数据仓库的实际构造示意图,议程,数据仓库解决方案概述Sybase数据仓库技术解决方案数据仓库设计工具抽取
3、、转换、清洗和装载工具数据存储、管理服务器数据分析和展现工具数据字典(元数据)的管理工具,Sybase数据仓库相关产品的技术构成,Relational,Package,Legacy,Externalsource,DataCleanTool,Source Data,DataStaging,WareHouseAdmin.Tools,Enterprise DataWarehouse,Data Extraction,Transformationand load,Datamart,Datamart,Enterprise/Central DataWarehouse,RDBMSROLAP,RDBMS,RDB
4、MS,Star Schema,ArchitectedDatamarts,CentralMetadata,Local Metadata,Local Metadata,Sybase数据仓库相关产品介绍,一个集成化的产品集,集成的主要产品,IntegrateEnterprise ConnectReplication ServerPowerMart,DesignWarehouse Architect,ManageSybase ASIQ,议程,数据仓库解决方案概述Sybase数据仓库技术解决方案数据仓库设计工具抽取、转换、清洗和装载工具数据存储、管理服务器数据分析和展现工具数据字典(元数据)的管理工具,
5、设计:成功的关键,数据库的设计对数据仓库系统的整体性能、装载和建立索引的时间以及数据量的增长等的影响超过任何其它方面。,数据仓库设计工具WarehouseArchitect,为数据仓库的设计提供三大功能:多维建模度量、维、属性事实表,维表维层次表,事实层次表设计向导聚合(Aggregation Wizard)分区(Partitioning Wizard)逆向工程数据源优化代码生成目标数据仓库引擎(IQ,RDBMS)OLAP分析环境,设计:WarehouseArchitect,议程,数据仓库解决方案概述Sybase数据仓库技术解决方案数据仓库设计工具抽取、转换、清洗和装载工具数据存储、管理服务器
6、数据分析和展现工具数据字典(元数据)的管理工具,数据抽取、转换、清洗、集成,挑战多个、多种异构数据源硬件,OS,RDBMS,文件数据不规范,需要做大量的清洗和整合转换规则复杂,繁多繁琐的日常性工作,占80%工作量数据质量保证数据增量抽取抽取工作过程化,自动化,数据抽取、转换、清洗、集成,成功的关键支持多个、多种异构数据源轻松方便地设计数据的清洗,转换和整合规则日常事务性工作自动化完成有完善的数据质量保证体系有完备的数据增量抽取直观,面向过程化设计;自动化的执行开放性,可扩展性,易于实施和维护,数据抽取、转换、清洗、集成,解决的方案手工编程实现使用工具设计和实施PowerMart/PowerCe
7、nter开发环境,一系列工具用于设计、执行和维护数据的抽取、转换和装载流程抽取转换引擎(服务器),自动执行,集成:PowerMart,MappingDesigner,TransformationDeveloper,SybaseInformixOracleMicrosoftIBM/UDBODBCDB2SAPPeopleSoftVSAMFlat FilesWeb LogsXMLIBM MQ Gateways,SybaseInformixOracleMicrosoftODBCIBM/UDBSAP BWPeopleSoft EPMFlat FilesGateways,议程,数据仓库解决方案概述Syba
8、se数据仓库技术解决方案数据仓库设计工具抽取、转换、清洗和装载工具数据存储、管理服务器数据分析和展现工具数据字典(元数据)的管理工具,数据存储、管理,挑战数据规模查询性能装载速度易于管理存取访问,成功的关键快速,高效数据存储技术出色的查询性能-特殊的索引技术,并行查询可伸缩性-GB 到 TB 级易于管理-方便,灵活,GUI存取访问-数据随时可用,数据管理,解决的方案通用的关系数据库系统专门的数据仓库服务器Sybase IQ专门为数据仓库/数据集市设计的关系型数据库专门针对OLAP/DSS而优化的索引和查询处理技术,Adaptive Server IQ,数据存储:Adaptive Server
9、IQ,无处不索引(Index EVERYWHERE)数据压缩(通常达到原始数据的 70-75%)垂直存储技术(Vertical Partitioning)专利的Bit Wise索引技术跨越Bitmap的限制多种索引类型:FP,LF,HNG,HG低级数的限制从100扩充到1000预连接的索引提供额外的显著提高性能手段(Join Index)支持任意设计模式星型、雪花、雪暴、星座模式普通关系模式支持任意加载方式文件、内部数据、外部数据库直接加载开放的接口,计算“NY”州A类商店的平均销售额,当表的记录数从几万条变为千万和上亿条时,传统RDBMS技术面对的问题:表扫描的性能极端低下冗余设计代价高昂、
10、查询读取的无效字段过多低级数类型数据上索引的失效普通索引加载和空间代价,造成不能任意建造即席查询的SQL顺序对性能有显著影响数值型比较和运算,无恰当手段加速处理,传统RDBMS不适合数据仓库,IQ的特殊存储方式-垂直存储(按列存储),Sybase IQ:数据是按列存储的,而不是按行存储,好处:只存取查询所需的数据数据类型是一致的,因而可以很容易被压缩数据库易于修改和管理,Sybase IQ:只读完成查询所 涉及到的列,计算在纽约的“A”类商店的平均销售额,IQ的特殊存储方式-垂直存储(按列存储),“How many MALES are NOT INSURED in CALIFORNIA?,Ge
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 解决方案 概述
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-5738410.html