电子商务数据仓库.ppt
《电子商务数据仓库.ppt》由会员分享,可在线阅读,更多相关《电子商务数据仓库.ppt(41页珍藏版)》请在三一办公上搜索。
1、数据仓库,数据仓库的定义 数据仓库理论的创始人在其Building the Data Warehouse一书中,给出了数据仓库的四个基本特征:面向主题,数据是集成的,数据是不可更新的,数据是随时间不断变化的。,基本概念,数据仓库定义 数据仓库是一个面向决策主题的、集成的、时变的、非易失、以读为主的数据集合。数据仓库系统的分类Web数据仓库;并行数据仓库;多维数据仓库;压缩数据仓库等。OLAP定义 OLAP是针对某个特定的主题进行联机数据访问、处理和分析,通过直观的方式从多个维度、多种数据综合程度将系统的运营情况展现给用户。,面向决策主题的 数据仓库围绕一些主题,排除对于决策无用的数据,提供特定
2、主体的简明视图。集成的 构造数据仓库是将多个异种数据源集成在一起,确保命名约定,编码结构,属性度量等一致性。时变的 数据存储从历史的角度提供信息.在数据仓库,隐式或显式地包含时间元素。非易失的 数据仓库总是物理地分离存放数据;由于这种分离,数据仓库不需要事务处理,恢复和并发控制。通常数据仓库只需要两种数据访问:数据的初始化装入和数据访问。以读为主的 数据仓库中的数据主要是提供决策进行查询,一般不一定都需要即时更新,可以定期刷新或按需刷新。,数据仓库基本特性,数据仓库项目流程管理及系统性能管理和监控,OLTP,数据源,数据仓库,数据集市,数据采集及整合,数据的映射规则、模型,。,(元数据管理),
3、数据展现及决策,生产,财务,结算,外部,地区,分析,总量,分析,市场,分析,ETL,数据分析、DM,终端用户,终端用户,数据仓库体系结构,数据仓库的结构,早期细节级,当前细节级,轻度综合级数据集市,高度综合级,元数据,操作型转换,数据仓库中的几个重要概念,ETLETL(Extract/Transformation/Load)用户从数据源抽取出所需的数据,经过数据清洗、转换,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。元数据 关于数据的数据,指在数据仓库建设过程中所产生的有关数据源定义、目标定义、转换规则等相关的关键数据。同时元数据还包含关于数据含义的商业信息。Data Mart
4、数据集市-小型的,面向部门或工作组级数据仓库。,Operation Data Store操作数据存储 ODS是能支持企业日常的全局应用的数据集合,是不同于DB的一种新的数据环境,是DW 扩展后得到的一个混合形式。四个基本特点:面向主题的(Subject-Oriented)、集成的、可变的、当前或接近当前的。粒度数据仓库的数据单元中保存数据的细化或综合程度的级别。细化程度越高,粒度级就越小;相反,细化程度越低,粒度级就越大。分割结构相同的数据可以被分成多个数据物理单元。任何给定的数据单元属于且仅属于一个分割。,数据仓库中的几个重要概念(续),操作数据库与数据仓库的区别,操作数据库系统的主要任务是
5、联机事务处理OLTP数据仓库在数据分析和决策方面为用户提供服务,这种系统称为联机分析处理OLAP,采购子系统:订单(订单号,供应商号,商品号,类别,单价。数量,总金额,日期,)供应商(供应商号,供应商名,地址,电话,)销售子系统:客户(客户号,姓名,地址,电话,)销售(客户号,商品号,数量,单价,日期,)库存子系统:进库单(编号,商品号,数量,单价,日期,)出库单(编号,商品号,数量,单价,日期,)库存(商品号,库房号,类别,单价,库存数量,总金额,日期,),商品固有信息:商品号,类别,单价,颜色,商品采购信息:商品号,类别,供应商号,供应日期,单价,数量,商品销售信息:商品号,客户号,数量,
6、单价,销售日期,商品库存信息:商品号,库房号,库存数量,日期,),商品主题域:,采购子系统,销售子系统,库存子系统,3、数据仓库中的数据组织 数据仓库中的数据分为四个级别:早期细节级,当前细节级,轻度综合级,高度综合级。,19851998年销售明细表,19982003年销售明细表,19982003年每月销售表,19982003年每季度销售表,DW中还有一类重要的数据:元数据(metedata)。元数据是“关于数据的数据”(RDBMS中的数据字典就是一种元数据)。数据仓库中的元数据描述了数据的结构、内容、索引、码、数据转换规则、粒度定义等。,4、数据仓库系统结构,RDBMS,数据文件,其他,综合
7、数据,当前数据,历史数据,元数据,抽取、转换、装载,数据仓库,OLAP工具,DM工具,查询工具,分析工具,二、数据仓库设计 数据仓库的设计分为如下三个阶段:,数据仓库建模 分析主题域 确定粒度层次 确定数据分割策略 构建数据仓库 数据的存储结构与存储策略 DSS应用编程,三、操作数据存储(ODS)在许多情况下,DB-DW的两层体系结构并不适合企业的数据处理要求。因为,虽然可以粗略地把数据处理分成操作型和分析型,但这两种处理处理并不是泾渭分明的。ODS(Operational Data Store)作为一个中间层次,一方面,它包含企业全局一致的、细节的、当前的或接近当前的数据,另一方面,它又是一
8、个面向主题、集成的数据环境,适合完成日常决策的分析处理。,四、数据仓库的实现 数据仓库的工具主要有:数据预处理工具,数据分析(OLAP)工具,数据挖掘工具,OLAP服务器。,数据仓库和OLAP工具基于多维数据模型(在数据仓库中,通常以多维方式来存储数据。)。基本概念 维:人们观察数据的特定角度。维的层次:人们观察数据的特定角度可能存在细节程度不同的多个描述方面,我们称其为维的层次。多维分析的基本动作 切片,旋转,上卷,下钻。,Sales volume as a function of product,month,and region,Product,Region,Month,Dimension
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 电子商务 数据仓库

链接地址:https://www.31ppt.com/p-6130826.html