EDW (DM数据仓库数据建模)模型设计ppt课件.pptx
《EDW (DM数据仓库数据建模)模型设计ppt课件.pptx》由会员分享,可在线阅读,更多相关《EDW (DM数据仓库数据建模)模型设计ppt课件.pptx(60页珍藏版)》请在三一办公上搜索。
1、BI.Insurance i.DWM for P&C 模型设计说明,日程,为什么需要模型模型的组织结构模型实施方法模型设计策略Q & A,|,日程,为什么需要模型模型的组织结构模型实施方法模型设计策略Q & A,|,EDW体系架构,源系统层,ETL层,数据仓库层,ETL层,数据集市层,应用层,展现层,手工数据,外部数据,数据仓库,保险数据模型,核心业务,财务系统,再保险系统,人意险系统,精算系统,客户关系管理OCRM,客户讯息ECIF,业务量分析数据集市,业务持续性分析数据集市,ALM数据集市,财务分析数据集市,车险承保分析通用承保分析,风险管理应用,ALM应用,财务分析应用,aCRM 数据集
2、市,aCRM报告,大客户分析管理系统,aCRM引擎,数据挖掘引擎,数据挖掘应用,企业信息门户,企业统一分析平台,元数据库,监管报表,管理报表,运营报表,仪表盘,随机查询,多维分析,“数据和信息集成平台”“统一的分析平台”“唯一的信息出口”,为什么需要企业模型?,EDW 数据模型在项目实施中的作用,DWM数据仓库模型,BAM业务分析模型,运营型业务系统,数据仓库,数据集市,报表分析型应用,BSA业务模版应用,日程,为什么需要模型模型的组织结构模型实施方法模型设计策略Q & A,|,模型总体结构EM & DataMarts,核心原子数据,事实表和维度,企业模型,营销管理快速入门,客户细分和管理,保
3、险盈利性分析,潜在客户管理,数据集市,导出,业务数据模型,映射,指标要素,需求模型,财务报表数据集市,中介绩效分析数据集市,健康险盈利性管理数据集市,DWM 数据模型逻辑结构,BI.Insurance i.DWM for P&C,底层数据模型主题域说明:Agreement:保单、批单申请及管理;Claim:理赔Financial Transaction:应收应付、实收实付以及交易关联Party:当事方,包括当事方的组织结构、角色结构及类型Money Provision:资金管理Specification And Product:规范及产品管理Place:地点Code:标准代码Activity:
4、活动管理Physical Object:实物、标的管理,BI.Insurance i.DWM-Agreement,BI.Insurance i.DWM-Claim,BI.Insurance i.DWM-Physical Object,日程,为什么需要模型模型的组织结构模型实施方法模型设计策略Q & A,|,步骤:,流程:,产出:,原则:,需求文档:1.报表需求2.功能需求3. 非功能需求,1.目前的报表2.想做的报表3.想做的功能,1.数据筛选清单2.数据源报告:3.数据质量分析报告4.代码清单,Mapping文档: 源-模型对应关系,A筛选:去掉ETL需要而模型不需要的字段,1.逻辑模型2.
5、物理模型3 逻辑物理数据元素对照表,设计文档:1.Mapping流程图2.数据元素Mapping文档,A:数据源报告:1.主要功能2.历史数据情况3.与其它系统关系4.联系人,B:数据质量报告:1.数据类型2.值分布3.关联情况,B映射:1.映射到EM2.结合性能考虑3.结合实现考虑,数据筛选:1.程序控制,计算,通讯,安全控制配置,日志2.汇总类结果一般不要3.可以由其它字段算出的字段一般不要4.从其它系统导入的数据不要.5.代码表不要。6.单纯的险种定义信息不要,但是具体保单中涉及的险种定义信息可以要。,1.多维模型设计文档:维度指标派生指标2.需求-模型映射文档3.报表样张4.操作说明,
6、EDW具体实施流程,日程,为什么需要模型模型的组织结构模型实施方法模型设计策略Q & A,|,Hash code,问题的提出: 进行增量加载时无法快速判断对表的原有记录是否新插入。例如:1. 理赔案件发生的时候,增量文件会把保单数据也传来 2. 保单增量过来,可能只是投保人的信息改了,而目标保单表所需信息并没有改变 解决方案:使用增量的比较字段生成 Hash code。在对表进行增量加载时,对增量文件中的每一条记录生成 Hash code将生成完的 Hash code 与原表中同一anchor id并且最新的记录的 Hash code 进行比较如果一致的话,即不动作;如果不一致的话,即新插入。
7、使用示例:在 individual agreement 表中使用各个需要保留历史信息的字段生成 hash code。在增量加载时,使用业务增量文件中的字段生成 hash code。与 Individual agreement 表中同一agreement id的最新记录的hash code 进行比较。如果一致,即不动作如果不一致,则插入新记录。备注:relationship表是要根据业务去判断是否关系已经存在,然后,如果有其他属性(如:Role player - Physical object Rlship.Usage),才需要用hashcode判别是否重复。,|,Hash code字段组成规则
8、,带anchor的实体带status表的实体(Commercial agreement、Group agreement、Individual agreement、Claim folder、Elementary claim)除表的主键、type id、Partition key、Status、Status date、Status reason、 Valid from date、Valid to date、Effective from date、Effective to date、 Population timestamp之外的所有字段不带status表的实体除表的主键、 type id、 Par
9、tition key、 Valid from date、Valid to date、Effective from date、Effective to date、 Population timestamp之外的所有字段不带anchor的实体原则上不需要保留历史,一般执行Update操作。如果有需要的,ETL Mapping特别指明关联实体对于需要保留历史的关联类型,除Identifier、Partition key、Nature id、 Left anchor identifier、 Right anchor identifier、 Left entity identifier、Left ent
10、ity type id、Right entity identifier、Right entity type id、Valid from date、Valid to date、Effective from date、Effective to date、Population timestamp之外的所有字段,|,Partition key,问题的提出: 在进行多表关联时,所涉及的关联表行数巨大,关联速度达不到要求。解决方案:在所有大表中建立 Partition key, 按照该键的键值对表进行物理分区。Partition key 从Partition config 表中获得。分区策略是按照分公司进
11、行分区。使用示例:表 A 与表 B 进行关联时,如下进行select A.column1, B.column2 from A, B where A.foreign_key=B.Primary_key and A.partition_key in (select Storage partition from Partition config where Branch company id=xxxx) and B.partition_key in (select Storage partition from Partition config where Branch company id=xxxx
12、xxx),|,|,对保单和理赔状态的特殊处理,问题的提出:保单在承保和保全的整个过程中状态变化比较多,如按照 IIW 的原有设计,保单表中的会有巨量的历史记录;理赔在报案、立案和估损的整个过程中状态变化较多,如按照 IIW 的原有设计,理赔表中会有很多的历史记录。解决方案:将保单的状态变化过程剥离出来单独建表,在该表中保留与保单的关联;当有新状态插入时,更新对应的保单表中的状态。将理赔的状态变化过程剥离出来单独建表,在该表中保留与理赔的关联;当有新状态插入时,更新对应的理赔表中的状态。使用示例:增加Commercial agreement status,Group agreement stat
13、us,Individual agreement status表,分别记录 Commercial agreement , Group agreement ,Individual agreement 的状态变化历史。当前面状态发生该变时,在status表中插入新记录,更新对于原表中的状态字段。,对保单和理赔状态的特殊处理示例,|,Individual agreement,Individual agreement status,Left/Right Entity ID in Relationship or Role Entity,问题的提出在IIW中的不同subject area的实体关联通常是走关
14、联实体的,例如:Physical object - Agreement Rlship。在关联实体中是以anchor id进行连接的。在分析的时候,通常是应该按照当时的状况进行分析才有意义。由于EDW是保留历史信息的,同一个Physical object或Agreement会有多条记录,如何找到当时的记录,必须通过effective from/to date的比对才能实现,这非常影响效率。解决方案在关联实体中增加Left/Right entity identifier,Left/Right entity type idLeft/Right entity type id是指具体基础表的id号例如:
15、Road vehicle(2001260001)Left/Right entity identifier是指具体基础表中记录的主键id值例如: Road vehicle中牌照号沪A000001车辆的第一条记录的Road vehicle id值适用范围:FS RolePhysical object - Agreement Rlship,|,Sample of Left/Right Entity ID in Relationship or Role Entity,|,Road vehicle,Individual agreement,Agreement,Physical object,Physic
16、al object Agreement Rlship,被保标的,Party role in operation/Internal person,问题的提出在业务中有很多操作员角色,只有工号、姓名信息,没有身份证等其他信息;一个操作员在一个业务流程中会同时扮演不同角色,如在A保单核保中他是录入人,在B保单核保中他是复核人或者可能出现在A保单核保中他既是录入人又是复核人解决方案建立Internal person表保存业务员、公司管理人员的个人信息,这些信息质量较差建立Party role in operation表保存操作员角色信息,每次都生成新记录。录单员冗余到保单中,理赔的操作员也冗余到cla
17、im folder中,|,关联实体的版本问题,由于关联实体本身没有对应的anchor实体,不存在版本问题,但是关联存在有以下两种变化情况。人“王五”拥有一栋房屋,在2007/1/1卖掉了。更新原有的Role player physical object Rlship记录的valid to date:if 源系统有系统更新日期,则更新日期1;else,则“2006/12/31”effective to date: “2006/12/31”人“王五”拥有一栋房屋,在2007/1/1卖掉50的产权。更新原有的Role player physical object Rlship记录的valid to
18、date:if 源系统有系统更新日期,则更新日期1;else,则“2006/12/31”effective to date: “2006/12/31”(Ownership percentage: 100)插入新的Role player physical object Rlship记录valid from date:if 源系统有系统更新日期,则更新日期1;else,则“2007/1/1”effective from date: “2007/1/1”Ownership percentage: 50,|,Financial Services Role,问题的提出Person存放人的基本信息,Ext
19、ernal organisation和Internal organisation存放机构的基本信息一个人和机构在不同环境下分别扮演不同角色,所以Financial Services Role存放与保单(各种协议)相关的金融服务角色,如保单持有人,被保险人,受益人等。Channel role存放中介渠道角色信息,如营销员、收展员在分析集市中需要获取保单与业务员的关联信息,IIW原连接方式如图:,|,Financial Services Role(Financial services role player id),Person(Role player id),Channel role(Chann
20、el role player id),优点:结构清晰统一缺点:渠道角色信息关联的太远,需要Financial Services Role+Channel role+Person,影响效率,Person(Role player id),External organisation(Role player id),Financial Services Role,解决方案Financial Services Role用把basis role player type id确定应连接Person 还是External organisationFinancial Services Role用把basis r
21、ole player id确定Person或External organisation中记录的role player idFinancial Services Role用把basis role player entity identifier确定Person或External organisation中记录的person id或External organisation id使用示例,|,Financial Services Role(Financial services role player id),Person(Role player id),Channel role( Role pla
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- EDW DM数据仓库数据建模模型设计ppt课件 DM 数据仓库 数据 建模 模型 设计 ppt 课件
链接地址:https://www.31ppt.com/p-1376037.html