数据治理平台统简介课件.ppt
《数据治理平台统简介课件.ppt》由会员分享,可在线阅读,更多相关《数据治理平台统简介课件.ppt(55页珍藏版)》请在三一办公上搜索。
1、,国家开发银行,数据治理平台系统简介,2008,年,11,月,数据治理项目组,议题,1.,系统目标与定位,2.,技术实现架构,3.,数据标准管理子系统,4.,元数据管理子系统,5.,数据质量管理子系统,6.,数据服务子系统,7.,统一认证与用户管理模块,2,数据治理平台项目组,建设背景,?,数据平台一期已构建完成并投入使用,所面临的问题:,?,?,?,?,?,数据标准缺乏结构化管理,源数据变化造成数据平台数据混乱,对数据平台数据问题如何快速定位原因?,如何有效监控和改善数据平台数据质量?,。,?,建设一个完整的数据治理平台,作为数据平台的管控系统,从制度、标准、监,控、流程几个方面提升开行的数
2、据信息管理能力,解决目前所面临的数据标准,问题、数据质量问题、元数据管理问题和数据服务问题。,3,数据治理平台项目组,项目目标,围绕国开行数据平台建设,提供针对数据生命周期的管控机制,体现为以下几个,出发点:,?,数据标准规范化,-,规范化管理构成数据平台的业务和技术基础设施,包括数据管,控制度与流程规范文档、信息项定义等。,?,数据关系脉络化,-,实现对数据间流转、依赖关系的影响和血缘分析。,?,数据质量度量化,全方位管理数据平台的数据质量,实现可定义的数据质量检核,和维度分析,以及问题跟踪。,?,数据服务电子化,-,为数据平台提供面向业务用户的服务沟通渠道。,4,数据治理平台项目组,数据治
3、理平台构成与定位,数据服务,分析类应,用系统,提供平台,沟通渠道,数据提供,数据平台,数据集市,管理会计,核心业务,系统,信贷业务,系统,信用风险管,理系统,风险,数据流,管理平台,数据质量,数据质量,管理,数据抽取,Schemas,ODS,管理行内,数据标准,系统,管理平台元数据,,进行数据影响、,血缘分析,5,数据标准,元数据管理,数据治理平台项目组,对数据平台业务的支持,数据标准,?,查询数据标准,以开发符合数据标,准的应用,?,提交标准代码比对文档,应用开发者,?,维护数据标准,?,制订、发布标准,?,应用系统代码标准比对,?,查询数据标准规范,,反馈建议,数据标准子系,统,数据标准管
4、,理员,?,提出数据标准需求,申请,业务部门,6,数据服务,数据治理平台项目组,对数据平台业务的支持,元数据,数据平台,数据源系统,数据抽取,?,查询数据平台相关元数,应用开发者,据,为开发应用提供参考,元数据管,理员,元数据子系统,?,数据变更影响分析,?,数据问题血缘分析,?,数据变更影响评估申请,数据服务,7,数据治理平台项目组,对数据平台业务的支持,数据质量,?,针对数据质量问题,提出完善建议,应用开发者,?,定义检核需求与规则,?,分析数据平台数据质量,?,发现、发布数据检核问题,业务部门,?,了解本机构特定系,统数据质量,?,提出业务数据质量,检核需求,数据质量,检核,数据质量管,
5、理员,8,数据治理平台项目组,对数据平台业务的支持,-,数据服务,?,数据平台服务申请,应用开发者,?,提供数据平台服务,?,数据平台服务申请,?,与数据平台有效沟通,业务部门,数据服务,数据服务单管,理员,9,数据治理平台项目组,数据治理相关系统关系,数据治理平台,登录认证,AD(,目录,),系统,单点登录与,角色管理,统一认证,与用户管,理模块,执行检核,数据服务子,系统,数据质量管理,子系统,提供检核系,统元数据,提供库表结,构元数据,数据平台,用户与机构,信息同步,统一用户,管理系统,元数据子,系统,数据标准,子系统,提供标准相,关元数据,10,数据治理平台项目组,议题,1.,系统目标
6、与定位,2.,技术实现架构,3.,数据标准管理子系统,4.,元数据管理子系统,5.,数据质量管理子系统,6.,数据服务子系统,7.,统一认证与用户管理模块,11,数据治理平台项目组,客户层,表现层,业务层,Import,Export,集成层,资源层,Database,Operation,Engine,Objects,Relation,Analysis,Engine,ORM,Hibernate,外部数据,XML,文本,EXCEL,应用系统,Management&Control,Security,Task/Trans,Log,Driver,&,Adapter,Web,Browser,HTM,L/A
7、,JAX,/HT,TP,ExtJS,I,n,t,e,r,f,a,c,e,Lists,Serialize,JDBC,ODS,DataMart,UA,12,数据治理平台项目组,议题,1.,系统目标与定位,2.,技术实现架构,3.,数据标准管理子系统,4.,元数据管理子系统,5.,数据质量管理子系统,6.,数据服务子系统,7.,统一认证与用户管理模块,13,数据治理平台项目组,功能需求,?,管理全行数据相关的标准和规范,提供数据标准的查询与反馈等功能。,功能定义,数据标准文档管理,数据标准文档制订,数据标准文档发布,数据标准文档版本管理,数据标准信息项管理,标准代码定义,主数据定义,数据标准查询与反
8、馈,数据标准文档查询与反馈,数据标准信息项查询,应用代码标准符合性检查,新应用开发者将本应用代码与标准代码进行匹配,提交,系统检查,维护数据标准公共代码。,维护主数据标准,维护数据标准相关文档类信息,对数据标准相关文档进行发布管理,对数据标准相关文档的历史版本信息提供查看功能。,14,数据治理平台项目组,应用界面,15,数据治理平台项目组,应用界面,?,数据标准文档管理,?,数据标准制订,?,数据标准导入,?,数据标准文档,版本管理,16,数据治理平台项目组,应用界面,?,数据标准信息项管理,?,公共代码管理,?,数据标准管理,17,数据治理平台项目组,应用界面,?,数据标准反馈意见,?,查看
9、反馈意见,?,反馈意见,18,数据治理平台项目组,逻辑架构,19,数据治理平台项目组,议题,1.,系统目标与定位,2.,技术实现架构,3.,数据标准管理子系统,4.,元数据管理子系统,5.,数据质量管理子系统,6.,数据服务子系统,7.,统一认证与用户管理模块,20,数据治理平台项目组,功能需求,?,对源系统、数据平台以及数据治理项目中的相关的技术、业务元数据进行统一,的归集管理,实现数据间的血缘分析和影响分析。,功能定义,完成情况,技术元数据,源系统数据结构定义,主数据,ER,模型,数据与映射关系定义,数据影响与血缘分析,数据变化对比分析,业务元数据,代码定义,报表表头定义,报表指标定义,报
10、表指标勾稽关系分析,定义数据平台公共代码及其与源系统代码的关系。,定义数据平台业务报表的构成元素与结构。,定义数据平台业务报表中指标的计算规则。,已完成,已完成,已完成,导入源系统数据字典,并以系统,-,表,-,字段的层级关系展现,已完成,各级数据关系。,导入主数据,ERwin,模型,解析生成模型各层级关系。,已完成,定义数据平台各部分,以及源系统间的数据关联映射关系。,已完成,依赖所定义的数据平台各部分,以及源系统间的数据映射,已完成,关系,图形化展现数据变化影响和数据问题溯源。,针对元数据不同版本进行差异部分识别与比较。,已完成,定义数据平台业务报表中指标间的依赖关系,并进行影响,已完成,
11、与血缘分析。,21,数据治理平台项目组,功能需求,功能定义,系统管理,完成情况,元数据手动采集,手工上传元数据定义文件,已完成,提供针对不同目标应用的适配器,实现定时的自,已完成,但需数据平,元数据自动采集,动采集,台提供采集支持,接,口方式尚需确定。,版本管理,提供元数据定版、批量定版、版本回溯的功能,已完成,访问控制管理,提供针对元数据细节操作的访问控制,已完成,22,数据治理平台项目组,应用界面,23,数据治理平台项目组,应用界面,?,业务元数据,报表清单,?,报表表头,报表表样导出,报表表头定义,24,数据治理平台项目组,应用界面,?,业务元数据,?,报表指标,查看指标相关,ER,图,
12、25,数据治理平台项目组,应用界面,?,技术元数据,?,影响分析,26,数据治理平台项目组,逻辑结构,27,数据治理平台项目组,采集适配器,?,?,元数据采集适配器是一种驱动和解析器,用来接收、解析各种不用类型数据源的数据,,将有效的元数据存入模型,并建立关系。,在本期项目中,元数据管理系统的接口提供以下几种适配器:库表结构适配器、,PowerCenter,适配器、,E/R Win,适配器、数据平台血脉分析适配器、指标适配器、代码适,配器、表头适配器等。,数据平台,数据模型,数据集市,存储,过程,存储过程,数据模型,应用,表头,指标,代码,E/R Win,模型,元,数,据,ETL,PowerC
13、enter,Mapping,文件,接,口,区,文本文件,XML,文件,EXCEL,文件,元,数,据,管,理,平,台,图例:,采集流,适配器,数据库,解析流,数据流,28,数据治理平台项目组,元数据存储结构,?,元数据存储模型层包括两部分内容:,?,元模型定义,即通过,XML,实现对象、对象关系及对象行为等的定义。,?,元数据实例存储,元数据实例存储到关系数据库中。,XML,定义模型,对象属性,对象行为,对象定义,对象关系,实例关系,实例,属性值,所属对象,编号,实例编号,所属实例,对象,对象,关系,顺序,超过的属性,目标对象,属性,1,打散,/,纵向,存储,属性,值,目标实例,属性,2,属性,
14、3,属性,4,属性,5,属性,6,29,数据治理平台项目组,议题,1.,系统目标与定位,2.,技术实现架构,3.,数据标准管理子系统,4.,元数据管理子系统,5.,数据质量管理子系统,6.,数据服务子系统,7.,统一认证与用户管理模块,30,数据治理平台项目组,系统目标,?,根据“数据质量检核管理办法”中,PDCA,方法论,基于现有数据平台,对其上数,据进行全质量生命周期的管理,包括质量问题的定义、检核监控、发现分析、,跟踪反馈。,?,检核需求,?,检核指标,检核对象,检核调度,收集需求,分析规则,规则库,?,修正,数据质量,知识库,?,检核调度,管理,问题数据,执行,数据质量,问题管理,数据
15、质量,检核分析,数据质量,趋势分析,31,?,数据治理平台项目组,数据质量度量分类,大类,细类,正确性,唯一性检查,非空检查,类型检查,格式检查,值域检查,代码检查,指标标准偏差检查,数据集市指标准确性检查,完整性,外键约束检查,一致性,业务规则检查,及时性,数据平台数据生成及时性检查,32,数据治理平台项目组,功能需求,功能定义,数据质量检核定义,完成情况,对纳入数据质量管理需求的系统、数据表纳入检,已完成,核范围,并定义相关信息,按数据质量度量标准,为各类检核指标定义相关,检核指标与规则定义,已完成,属性和数据检查规则。,为数据质量检核指标类和业务方案定义灵活的检,检核调度策略定义,已完成
16、,核策略,检核系统定义,数据质量检核执行,检核控制引擎,检核执行处理器,调度符合执行策略数据质量检核指标,并分派给,已完成,对应的处理器,对数据质量检核指标执行特定于其指标类的检查,已完成,程序,33,数据治理平台项目组,功能需求,功能定义,数据质量检核分析,对数据质量检核的结果按机构、系统、数据质,量问题三个维度进行分布分析,对数据质量检核的结果按时间维度分析,判断,问题趋势分析,质量改善情况,对同一检核指标的不同批次进行对比,分析质,检核指标批次对比,量改善情况,检核执行报告,对特定日期的检核结果,形成统计报表,问题分布分析,数据质量问题管理,问题发现,问题发布,问题处理,问题归档,数据质
17、量知识管理,知识库维护,知识库查询,归集数据质量的特定问题,以及特定的解决方,案,形成知识信息,查询数据质量知识信息,查询符合特定条件的数据质量检核问题,将需处理的数据质量检核问题归集到一个问题,单,并发布给特定的机构,跟踪问题单的处理情况,对处理完结的问题单进行归档处理,完成情况,已完成,已完成,已完成,已完成,已完成,已完成,已完成,已完成,已完成,已完成,34,数据治理平台项目组,应用界面,?,检核系统管理,35,数据治理平台项目组,应用界面,?,检核指标管理,?,主键唯一,36,数据治理平台项目组,应用界面,?,检核调度策略管理,?,业务解决方案,37,数据治理平台项目组,应用界面,?
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 治理 平台 简介 课件

链接地址:https://www.31ppt.com/p-3763711.html