Oracle的数据仓库解决方案.ppt
《Oracle的数据仓库解决方案.ppt》由会员分享,可在线阅读,更多相关《Oracle的数据仓库解决方案.ppt(101页珍藏版)》请在三一办公上搜索。
1、朱 旻高级技术咨询顾问Oracle 上海分公司,Oracle 的数据仓库解决方案,议程,Oracle 公司简介Oracle 数据仓库系统整体解决方案数据的管理数据的获取数据的展现问题与讨论,Oracle-全球卓越的IT巨人,Oracle 是全球第二大独立软件公司Oracle 是全球第一大数据库软件公司Oracle 是全球领先的电子商务公司Oracle 是北美制造业第一大 ERP公司全球145+個国家及地区设有分支机构Oracle 全球超过42,700名员工全球超过200,000客户Oracle 总部位于加州硅谷,亚太地区总部设于新加坡2003财政年度营业额近 100亿美元,研发经费超10亿美元
2、,Oracle-中国营运概况,1989年进入中国,1991年正式成立“北京甲骨文软件系统有限公司”,是中国最大的国外软件公司之一,技术及咨询人员占员工总数 62%以上提供全方位服务技术支持:技术人员提供专线与到场支持服务教育培训:专业讲师提供丰富课程,并利用互联网提供一致的,全球化的学习咨询顾问:专业顾问提供专业咨询服务在上海、广州、成都等地设有办事处3大培训中心,分别在北京,广州和上海于深圳、北京设立两个全球级研发中心,顾问咨询产品支持教育培训,电子商务套件信息协同套件商业智能,数据库应用服务器数据仓库 工具,Internet 平台,基于Internet的应用产品,服务体系,Oracle 完
3、整的企业、政府机构信息化解决方案体系,合作伙伴,技术发展,80年代早期,80年代后期,90年代早期,90年代后期,早期关系型,客户/服务器方式的关系型,企业级关系型,Internet数据库,简单的OLTP,特殊的 SQL查询,客户/服务器方式的OLTP,数据仓库和高端的OLTP,扩展的关系型,Web方式的应用,集中数据的应用平台,2000,Oracle9i,Internet商务平台,2003,Grid网格计算,Oracle10g,下一代 Internet计算技术,(Source:DM Review,May 2001),Oracle:最大的数据仓库平台厂商,议程,Oracle 公司简介Oracl
4、e 数据仓库系统整体解决方案数据的管理数据的获取数据的展现问题与讨论,数据仓库是一个建设过程,而不是一个产品。,数据仓库是通过对来自不同的数据源进行统一处理及管理,通过灵活的展现方法来帮助决策支持。,数据仓库最新理解,Oracle 数据仓库的完整架构,OWB,项目管理、数据仓库方法论 OPM DWM,业务规划 信息评估 模型设计Oracle Warehouse Builder,管理、开发OEM OWB Oracle9iDS 顾问咨询 知识转移,Discoverer,Report,BI Bean,Portal,TMIS系统,客运系统,外部信息,Oracle 9i,MIS系统,9i AS,随即查询
5、,报表,多维分析/数据挖掘,应用服务器,门户集成,ETL工具,Oracle提供先进的、完善的数据仓库技术平台,议程,Oracle 公司简介Oracle 数据仓库系统整体解决方案数据的管理数据的获取数据的展现问题与讨论,数据集中处理需求,数据量大,并不断增长,数据集中处理需求,数据访问性能要求高,查询统计,数据集中处理需求,对安全,可靠,高可用性的要求高建立集中各业务系统重要数据的备份中心,高效访问大量数据-数据分区技术,可管理性将大的表分割为若干分区,“分而治之”性能“分区忽略”机制提高查询性能基于分区的 join 操作可用性将故障局限在分区中缩短恢复时间多种分区方式范围(Range)分区、散
6、列(Hash)分区、列表(List)分区混合分区,Partitioned Tables with Local Indexes,AUG2002,Load and index new month,.,“滚动窗口”操作-大量数据高速装载,and add new month to table,“滚动窗口”操作-大量数据高速装载,Then remove and archive oldest month,Load and index new month.,.,Partitioned Tables with Local Indexes,保证系统高可用性 综合信息库系统,Oracle Real Applica
7、tion Cluster(Oracle并行服务器,OPS)在Cluster、MPP体系结构中,实现一个共享数据库,支持并行处理,均分负载,保证故障时数据库的不间断运行支持Share Disk 和Share Nothing类型的体系结构多个节点同时工作节点均分负载,DLM,透明的应用失效转移-利用 热失效转移 进行恢复,透明的应用失效转移补全了可用性等级的所有层次将应用和用户自动而透明地重新连接到另一个系统登录的上下文可被保持应用查询不会中断,请求,数据传输,Oracle9i 的完全缓存融合技术提高了性能和可扩展性通过高速互连直接传输数据昂贵的磁盘 I/O被最小化,Cache FusionTM
8、体系结构,面向查询的读共享查询操作需要读某数据块,而该块正好在另一个实例的缓存中面向更改的写共享更改操作需要修改某数据块,而该块正好在另一个实例的缓存中。使用 Cache Fusion,仅当该数据块不在全局共享的缓存中,才会执行磁盘读操作,数据共享问题,Data A-Z,应用,Oracle9i Real Application Clusters-可伸缩性 增加系统扩充能力,增加机器时,系统性能的最佳响应快速增长的集群结构Clusters快速增加节点和硬盘当扩展节点时数据仓库系统无须重新组织和分布数据,#Users,1,026,1,900,3,648,Oracle E-Business Suit
9、e 11i,Oracle9i RAC 可伸缩性,数据库服务器:HP N-Class 6x440MHz CPUs,生产数据库,延迟和零数据丢失模式(Both),物理后备数据库,建立综合信息库高效的备份中心-Oracle9i Data Guard(Oracle Standby database),零数据丢失的灾难保护通过同步/异步的日志 log传输控制排除人为错误通过延迟提交 灵活的切换操作主数据库和备份数据库可以灵活的互换角色Data Guard Manager 在OEM图形界面管理工具内,配置、监控和管理灾难保护系统,物理备份数据库,生产系统,逻辑备份数据库,主备系统双向切换,管理员控制台和统
10、一管理平台(Both),延迟和零数据丢失模式(Both),保持数据库打开状态,SQL提交,附加的索引和物化视图,建立综合信息库高效的备份中心-Oracle9i Data Guard(Oracle Standby database),按固定字段的范围分区、哈希分区、混合分区、列表分区,灵活应用、SQL语句自动重写、自优化能力,高效、灵活、易于使用的OLAP分析、数据挖掘和数据抽取、转换、传输、存储服务,提高索引效率、增强的外连接索引能力,Oracle9i,数据仓库的增强技术,数据分区,物化视图,集成的OLAP、Data Mining和ETL服务,位图连接索引,数据分区,位图索引,真正仓库,物化视
11、图,查询,汇总数据管理-物化视图Materialized View,蚌埠和上海分局在过去三个月的货运总量是多少?,表压缩(Oracle9i,版本 2),表能被压缩 在分区级别上压缩也能具体指定典型压缩比率从 3:1到 5:1压缩由实际数据决定压缩规则基于数据冗余主要好处是节省开销节省 TB级的存储而不影响性能或功能,数据分区,位图索引,真正仓库,物化视图,Oracle9i Database单一的商业智能数据服务器,Metadata,传统的分析服务器,数据仓库引擎,数据整合引擎,OLAP引擎,数据挖掘引擎,Oracle9i 分析平台,Oracle9i,更强大的分析能力,更加安全可靠,部署和管理更
12、加简单,目前业界最先进的OLAP处理方法所有OLAP数据和处理过程都存储在 Oracle9iDB多维结构(维表,cube立方体)存储在数据库中没有外部文件存储或单独的OLAP处理(不同于竞争对手产品)SQL直接访问多维目标、模型、预测等开放的、基于Java标准的 OLAP API利用BI Beans方式加速基于internet的应用开发,Oracle9iDB集成OLAP和Data Mining,OLAP,数据分区,位图索引,真正仓库,物化视图,应用部署,Oracle 9iAS,Java 应用或 Applet,Servlet,PDA,Mobile Phone,PC,Browser,提高了应用的预
13、报和洞察力例如,建立货运量的趋势分析模型Data Mining 嵌入了 Oracle9i Database简单的过程,避免了数据迁移,提供了更好的运行性能和可扩展性开放的、基于Java标准的 API用于开发商业智能的应用,Oracle9i Data Mining,Data Mining,数据分区,位图索引,真正仓库,物化视图,ETL的压力和挑战,短时间内完成大量数据的抽取、转换和装载(ETL)不能影响数据源系统(业务运营系统)和目标系统(分析系统)ETL是分析系统中非常复杂和关键的处理步骤,传统ETL 处理的方法,方式一:数据库外部的ETL方式二:数据上载到数据库的存储区域(Staging)进
14、行ETL,方式一:数据库外部ETL,方式一:数据库外部ETL,主要的风险和缺点扩展性差缺乏数据恢复能力难于维护没有充分利用数据库的处理能力,方式二:数据库Stage中的ETL,方式二:数据库Stage中的ETL,主要的风险和缺点数据库需要存储两份数据:原始数据和中间结果数据数据库工具和语言对处理特殊的ETL问题没有优化,几种高效的ETL技术,获取变化数据(Change Data Capture CDC),从数据源中获取变化的数据异步:Oracle LogMiner 将从归档日志中发现变化数据同步:复制技术CDC 不仅有获取变化数据能力,而且还可提供发布的机制,不同的系统可进行定制特别适合于多个
15、数据集市(Data Mart)的系统,Consumption,Staging,Capture,Oracle Stream,外部表(External Table),外部表(External Table),数据文件作为虚表,就像存储于数据库中的表特点:可直接查询(Select)和连接(Join),并支持并行处理,提高Scalability免去数据装载的过程,提高性能特别适用于外部数据(Flat files)与数据库内数据的频繁交互,多表插入(Multi-Table Insert),可将数据插入多个目标表中;或根据特殊的业务转换规则,将数据插入多个可能目标表中的一个特别有助于数据转换处理包括多个目标
16、表的环境Oracle9i之前,这样的处理必须执行多次Insert操作。即需要处理n次相同的源数据,数据转换将增加n倍的负载。,Upsert 功能,MERGE INTO products tUSING products_delta sON t.prod_id=s.prod_idWHEN MATCHED THENUPDATE SET t.prod_list_price=s.list_ price,t.prod_min_price=s.min_priceWHEN NOT MATCHED THENINSERT(prod_id,prod_name,.,prod_list_price,prod_min_p
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Oracle 数据仓库 解决方案
链接地址:https://www.31ppt.com/p-5442185.html