数据仓库建模方法论.ppt
《数据仓库建模方法论.ppt》由会员分享,可在线阅读,更多相关《数据仓库建模方法论.ppt(47页珍藏版)》请在三一办公上搜索。
1、数据仓库建模方法论,数据仓库概念 数据仓库数据架构 逻辑数据模型 数据模型标准化工艺流程,主题,数据仓库领域的两位大师,Bill Inmon数据仓库之父,数据仓库概念的创始人理论:Corporate Information Factory(CIF)主要著作:数据仓库、企业信息工厂,主要著作:数据仓库工具箱维度建模的完全指南、数据仓库生命周期工具箱 设计、开发和部署数据仓库的专家方法,Ralph Kimball数据仓库方面的知名学者理论:Mutildimensional Architecture(MD),企业数据仓库EDW,数据仓库的特点,企业信息工厂,数据仓库总线,企业总线,总线架构矩阵,多维
2、体系结构与企业信息工厂体系结构比较,OLTP与OLAP,针对特定问题的联机数据访问和数据分析技术 满足对数据进行多角度、快速、一致、交互、深入观察 使用预定义的多维数据视图对数据进行分析处理,支持对数据的切片、切块、钻取。多维数据库是一种以多维数据存储形式来组织数据的数据管理系统,在使用时需要将数据从关系数据库中转载到多维数据库中方可访问。,也称为面向交易的处理系统,其基本特征是顾客的原始数据可以立即传送到计算中心进行处理,并在很短的时间内给出处理结果。这样做的最大优点是可以即时地处理输入的数据,及时地回答。也称为实时系统(Real time System)。衡量联机事务处理系统的一个重要性能
3、指标是系统性能,具体体现为实时响应时间(Response Time),即用户在终端上送入数据之后,到计算机对这个请求给出答复所需要的时间。OLTP 数据库旨在使事务应用程序仅写入所需的数据,以便尽快处理单个事务。,On-Line Analytical Processing,On-Line Transaction Processing,OLTP与OLAP,ROLAP表示基于关系数据库的OLAP实现(Relational OLAP),MOLAP表示基于多维数据组织的OLAP实现(Multidimensional OLAP),ROLAP vs MOLAP,数据仓库概念 数据仓库数据架构 逻辑数据模型
4、 数据模型标准化工艺流程,主题,数据架构形态,各数据架构比较,数据集市类型,活期存款,定期存款,零售信贷,公司信贷,债券投资,票据信息,同业拆借,储蓄国债,衍生品,储蓄国债,参与者,交易流水,会计单元,理财产品,风险缓释,市场数据,计量结果,公共信息,数据挖掘模型,风险引擎数据接口,星型模型,报表模型,多维分析模型,风险计算引擎,信用风险,绩效衡量和资本分配,合规性与披露,市场风险,操作风险,流动性风险,防欺诈和反洗钱,Enterprise Date Warehouse,ODS,风险计量结果返回ODS,多维分析,汇总层,应用层,监管报表,风险数据集市数据架构,风险数据集市建设目标,数据仓库概念
5、 数据仓库模型 逻辑数据模型 数据模型标准化工艺流程,主题,为什么需要逻辑数据模型,为复杂的数据仓库系统实施提供了规范和基础结构蓝图促进业务部门用户和IT分析人员之间的有效沟通明确业务需求解决业务问题形成对重要业务定义和术语的统一认识具备跨部门,能够表达所有的业务,技术缓冲层 ETL专用的纯技术层完全与源系统结构一致,近源模型层 基本依照源系统建模尽量保持业务系统原貌,整合模型层 面向整合主题设计提供规范和共享,应用集市层面向应用按需定制多维建模汇总数据,.,.,数据挖掘模型,风险引擎数据接口,星型模型,报表模型,多维分析模型,汇总层,当事人,财务,产品,资产,事件,内部机构,协议,计量结果,
6、市场数据,LDM在数据仓库系统中的地位,设计思路比较,EDW逻辑数据模型设计目标,中性的,共享的:不针对某个特别的应用而设计;灵活的,可扩展的:存放最详尽的历史数据,业务发生变化时易于扩展,适应复杂的实际业务情况;稳定的,经得起考验的:能够在很长时间内保持稳定性,回答不断产生、不断变化且无法预先定义的业务问题;规范的,易懂的:使用业务语言进行模型设计,易于让业务人员理解和使用,有助于IT和业务部门人员的沟通,25,逻辑视图(第三级),逻辑数据模型的不同级别,逻辑数据模型的主题域,主题域模型案例-市场风险数据集市,主题域模型案例-信用卡数据集市,主题域模型优点 指导业务数据模型开发 有助于数据一
7、致性,避免冗余。当确定一个新的实体时,基于定义可以确定实体的恰当地主题域。根据主题域划分工作量,可使重复工作量最小化,并有利于相互协调 指导数据仓库项目选择 为基于数据的项目分组提供了一种高层次划分方法。在确定项目开发顺序时,应该同时考虑业务优先级、技术实现难度、人员可用性等信息 指导数据仓库开发 有助于确定哪些相关的业务专家,主题域模型目标 提供广泛的理解提供对每一个主题域的理解,包括各个主题域的名称和定义,通过业务规则将这些主题域联系起来,形象地表达这些主题之间依赖关系和规则。因为在主题域层次,所以,主题域模型更容易覆盖广泛的领域。业务规则使主题域模型增加更多的准确性和清晰性。确定范围通过
8、形象地表达主题域和他们的业务规则,我们能够更容易地识别出将要分析的模型的范围。指引方向主题域模型能够提供全景视图,可以帮助我们确定:计划中的应用程序和现有的应用程序将怎样共存。下一步,企业将需要什么样新功能。主题域模型提供方向和指南。建立对业务的高层次理解,为逻辑数据分析和建模打下基础,主题域模型,概念模型,影响数据仓库粒度级别的主要因素,汇总数据汇总数据能够改善数据交付处理性能,汇总数据不会节省存储空间,因为创建汇总的细节可能会继续被保留。汇总提供的好处主要包括:在线存储需求减少 分析的标准化以及数据交付性能的改善 合并实体通过减少连接操作的数量,提高了数据交付处理的性能,并且可以增强一致性
9、。分离数据根据稳定性和用法来分离数据。稳定性分析根据各个数据属性是否经常变化的特性将这些属性进行分组。,数据仓库粒度级别,逆规范化指南,风险数据集市-汇总层,风险数据集市-应用层,数据仓库概念 数据仓库数据架构 逻辑数据模型 数据模型标准化工艺流程,主题,数据模型标准工艺概述,项目准备与策划,在项目准备与策划阶段,模型设计人员的主要职责是参与制定模型相关的项目实施策略,包括确定数据源范围,明确最终提交物和项目日程等。此外,模型设计人员在进场前可参与提出客户相关资料的具体需求,包括一些参考模板,以保证后续工作的输入。,确定项目人员本阶段将确定参与项目实施的所有人员名单,包括全职和兼职人员。其中,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据仓库 建模 方法论
链接地址:https://www.31ppt.com/p-6296234.html