用户案例数据仓库.ppt
《用户案例数据仓库.ppt》由会员分享,可在线阅读,更多相关《用户案例数据仓库.ppt(65页珍藏版)》请在三一办公上搜索。
1、2023年10月16日,用户案例介绍 Oracle数据中心,内容,法国电信新西兰电信,法国电信数据仓库,法国电信(France Telecom),欧洲第三大电信运营商,2000年营业额为337亿欧元在五大洲220个国家和地区拥有9100多万客户下属Orange是第二大移动运营商,实际的数据仓库案例http:/,Winter VLDB Survey 14 Sep 2005Largest Database Size,Decision Support,Sears Teradata4.63HCIA Informix 4.50Wal-Mart Teradata 4.42Tele Danmark DB2
2、2.84CitiCorp DB2 2.47MCI Informix 1.88NDC Health Oracle 1.85Sprint Teradata 1.30Ford Oracle 1.20Acxiom Oracle 1.13,法国电信:世界上最大的数据仓库,Winter 2003 VLDB SurveyLargest Database Size,Decision Support,数据仓库项目建设目标,建立统一的数据信息平台,实现客户资料和生产数据的集中存储。利用先进的数据仓库技术和决策分析技术为市场营销和客户服务工作提供有效的支撑:流失分析欺诈分析客户发展分析客户关系管理,目前系统规模,包
3、含12个月的话单数据库容量为65TB,其中原始数据为25TB最大的表包含1800亿话单,项目面临的技术挑战,数据存储系统要求存储1218个月的 详单数据数据装载按小时装载详单数据,要求每天在8小时内装载5亿条详单高峰时一个小时装载6500万条详单在8小时内同时完成1亿7000万个汇总操作数据访问支持680个并发用户,支持8000 个系统用户95%的预定义查询操作在5秒钟内完成每秒钟23个查询操作,法国电信选择数据仓库平台的考虑,强大的ETL支持能力支持按小时的数据装载高效的数据访问硬件的支持:多CPU、大内存、并行处理分区技术索引技术数据库内置的分析能力高可用性7 x 24不间断运行软件的成熟
4、性TB级数据仓库用户案例,数据仓库,数据缓冲池和操作数据存储,汇总计算计算 更新,生产数据采集和预处理预处理转换导出新数据,数据仓库系统管理,数据仓库功能管理,系统管理员操作员,错误数据处理,刷新数据集市,数据集市 1,客户资料,客户资料接收和准备质量检查转换,生产系统,数据集市 2,中央数据存储,普通用户,预处理应用,其它界面,WEB界面,高级用户,即席查询应用,应用平台,系统的逻辑结构,系统中使用的Oracle关键技术混合分区,.,.,.,混合分区的设计,按地区建立列表分区按时间建立范围分区一天以上的话单数据按天建立365分区一天以内的话单按小时建立分区,select sum(sales_
5、amount)from sales where sales_date between to_date(01-MAR-1999,DD-MON-YYYY)and to_date(31-MAY-1999,DD-MON-YYYY);,利用分区忽略提高大表的查询性能,分区忽略:只有相关分区被访问,系统测试结果,数据访问:每秒钟23到100个并发查询操作95%的查询在1秒钟内完成,系统中使用的Oracle关键技术可传输的表空间,业务系统,数据仓库,Mar,Feb,Jan,Mar,Feb,操作系统文件的直接复制不需要数据的导入/导出,实现按小时的数据加载,OLTP,Data Warehouse,Data M
6、arts,Archives,Informationdistribution,Staging,可传输表空间在数据仓库中的使用,举例利用可传输的表空间和分区技术实现快速数据装载,详单数据的导出,把需要传输的数据放在单独的表空间CREATE TABLE temp_jan_sales NOLOGGING TABLESPACE ts_temp_sales AS SELECT*FROM sales WHERE time_id BETWEEN 31-DEC-1999 AND 01-FEB-2000;导出数据字典EXP TRANSPORT_TABLESPACE=y TABLESPACES=ts_temp_sa
7、les FILE=jan_sales.dmp 复制数据文件和数据字典到数据仓库服务器,详单数据的导入,导入数据字典IMP TRANSPORT_TABLESPACE=y DATAFILES=/db/tempjan.f TABLESPACES=ts_temp_sales FILE=jan_sales.dmp 通过分区交换,将新数据加入目标表1.ALTER TABLE sales ADD PARTITION sales_00jan VALUES LESS THAN(TO_DATE(01-feb-2000,dd-mon-yyyy);2.ALTER TABLE sales EXCHANGE PARTIT
8、ION sales_00jan WITH TABLE temp_sales_jan INCLUDING INDEXES WITH VALIDATION;,系统测试结果:数据装载,数据装载:装载包含5000万条详单的一个分区和2个索引的一个表空间文件传输:4 50数据导入到Oracle数据仓库:瞬时创建索引:750”预计算及其它运算:14合计:3226”,物化视图提高汇总数据的访问性能,查询,法国和意大利的用户在过去三个月的漫游通话总时长是多少?,使用Oracle内置的SQL分析函数,汇总 ROLLUP&CUBE抽样 Sampling排名 Rank-rank,percentile,ntile,t
9、op,bottom滑动窗口 Moving Window-avg,sum,min,max,count,variance,stddev,firstvalue同比 Period-over-period comparisons时间序列Lag报表函数sum,avg,min,max,variance,stddev,count,ratiotoreport统计函数covariance,correlation,linear regression,TimekeySales Sales_last_year Sales_change98-1 1100-.99-11200110010099-2150014505099-
10、31700135025099-416001700-10099-51800160020099-6150014505099-7130012505099-814001200200,SELECT timekey,sales,LAG(sales,12)OVER(ORDER BY timekey)as sales_last_year,(sales-sales_last_year)as sales_changeFROM sales,举例:使用时间序列函数,系统使用情况,数据汇总:1亿7000万个汇总运算在2个小时内完成不需要专门的服务器数据访问:每秒钟23到100个并发查询操作95%的查询在1秒钟内完成,数
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 用户 案例 数据仓库
链接地址:https://www.31ppt.com/p-6317419.html