《数据管控总结》PPT课件.ppt
《《数据管控总结》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《数据管控总结》PPT课件.ppt(54页珍藏版)》请在三一办公上搜索。
1、数据管控交流,Agenda,数据管控元数据管理数据质量管理数据标准,我们通常提到数据管控数据综合治理能够想到的数据质量问题,源系统业务人员录入正确性问题。工行案例:企业财务报表录入日期源系统多系统之间数据不一致的问题。工行案例:对公企业行业分类问题光大案例:客户证件类别操作性业务系统规范对后台分析系统的影响。工行案例:增量完整性浦发案例:前台系统的数据质量建议方案业务统计口径不一致的问题。信用卡案例:睡眠卡的定义,解决这些数据问题的手段,我们需要有一个尺度作为判断的依据来衡量数据标准我们需要有一个侦测、报告、协助分析治理数据问题的平台:数据质量管理我们需要对数据问题影响进行分析,我们需要对数据
2、进行统一的版本管理和规范管理控制。元数据管理我们需要数据治理是一个工程。,我们需要有侦测、分析、解决方案评估、执行的完整流程。我们需要有以下人员的参与:科技部门业务系统的开发人员数据治理的专职人员分析系统的开发人员业务部门,解决这些数据问题的手段,Governance=People,Processes,Technology,针对数据管控我们还能想到什么?,时效性问题?数据的安全?隐私问题?数据的生命周期管理问题?。,数据管控机制的建立,数据管控的定义管控结构组成部分1.管控任务和指导原则2.管控的组织结构 3.业务改善和结果追踪4.数据管理的落地功能5.用户的支持和参与6.SLA,有效的管控6
3、个组件,每个阶段的执行情况覆盖了所有的开发周期,Plan,Analyze,Design,Build,Implement,Manage,Governance Program Structure,User Support&Involvement,Data Certification&Management,Service LevelAgreements,Mission,Policies,Guiding Principles,Incremental Project Planning&Implementation,Opportunity Scoping&Results Tracking,建立数据管控的考
4、核指标和落地功能,DG-KPI,DG-KPI载体或工具,三大功能和相互关系,管控体系中的数据标准、数据质量和元数据之间有着紧密的关系,三者的关系如下:数据标准向元数据提供业务元数据的标准定义,并可以通过元数据平台进行维护;数据标准定义了符合进仓数据的标准和依据,指导数据质量进行有效的质量监测和检查;另一方面,通过数据质量具体的操作来促进数据标准的执行情况;元数据作为数据质量的数据提供者,向数据质量提供包括表、字段、代码等元数据对象及其属性定义,能够帮助仓库的使用者更好的发现数据的质量问题;,数据管控应用框架,0,数据治理组织架构与,岗位职责,数据治理模板,(,流程、定义、发布,),数据治理认责
5、,与考核办法,元数据分类模式及属性举例,分类,属性,元数据管理的架构,元数据的基础功能,元数据查询浏览:侧重于对元数据的内容展现和查询方式支持 元数据数据分析:侧重于基于元数据的分析功能,从数据中提取对技术、业务用户有用的信息 元数据管理:元数据平台的管理功能 BI元数据和企业级元数据的互动:企业级元数据经ETL平台加工整理进入仓库,形成BI元数据,可通过血缘分析和影响分析功能查看两者的互动关系;,历史对象,元数据浏览的灵活性,元数据对象关系呈立体网状看本体查看对象本身定义,例如表的名称、注释等信息。向上看查看对象所属对象的定义,例如表所归属的数据库。向下看查看对象包含的对象的定义,例如表所包
6、含的字段、索引等。向前看查看对象的上游信息对象,例如该表的数据的来源表。向后看查看对象的下游信息对象,例如该表的数据的目标表。看历史查看对象的历史变更信息。例如该表在上一个版本中的内容。看友邻查看与对象有关系的其他对象,例如涉及该表的脚本等信息。,所属对象,包含对象,目标对象,来源对象,本体对象,元数据主要分析功能,影响分析向下分析一个元数据对象对下游对象的影响。血缘分析与影响分析的方向相反,向上追溯一个对象的数据来源。全链分析从某对象出发,向上下游双方向进行分析。活力分析分析一个数据库对象被访问的频度。孤立对象分析分析数据准备区(SData)、物理模型区(PData)中的孤立元数据对象。一致
7、性分析定期分析元模型中的元数据是否与实际情况一致。版本比对选择任意两个时点的版本进行比对。质量分析分析数据仓库中的元数据的质量。,如何元数据技术的价值,元数据技术发展方向任何事物的发展都是从粗放型到精细型,元数据的发展也不例外。元数据是关于数据属性的管理系统,针对数据属性的管理需要从“定量化”技术指标到“抽象化”的业务指标的管理。元数据的应用需要从简单的技术应用模式到复杂的分析应用模式的转型。元数据发展目标:元数据的完整性元数据的精细化实现元数据的双向驱动为目标工商银行业务元数据价值的探讨工商银行元数据应用的价值举例:基于元数据的数据质量评估模型基于元数据的数据温度评估模型基于元数据的数据生命
8、周期管理机制基于元数据的ETL作业调度优化基于元数据的物理模型优化,真正发挥元数据的协助数据管理的职能,数据质量维度,必须有一个跨部门以上领导的重视和牵头必须有一个专门负责解决数据质量问题的组织必须有一个专门负责解决数据质量问题的平台必须有一个专门负责解决数据质量问题的流程必须有一个专门负责侦测数据质量问题的工具,数据质量的5个“一“工程,完整的数据质量解决方案,数据质量改进标准流程,21,数据质量平台功能,管理配置平台:质量规则的管理维护,支持用户界面手工编辑方式进行维护或者文件方式批量导入 检查执行平台:数据质量知识库中抽取相关质量规则,以检查脚本为载体,通过ETL服务器任务调度,完成数据
9、检查,并将检查结果保存进数据质量知识库 质检报告展示平台:以WEB页面或者文件方式查看质量检查结果,数据标准框架,数据标准定义,数据标准执行,数据标准映射,数据标准管理流程,数据项的主题、分类数据项的业务属性数据项的技术属性,数据标准执行的架构数据仓库差异和改进建议源系统差异和改进建议,数据标准与源系统的字段级映射数据标准与数据仓库的字段级映射,日常维护更新执行和效果追踪,标准定义,标准映射,标准执行,管理流程,管理工具,业务数据标准的问题,困难实施难易度容易,高实施迫切性 低,公共数据规则示例,电话号码,建议采用正则表达式进行系统固化,例如:/(0+d2,3-)(0d2,3)-)?(d7,8
10、)(-d3,)?$/合法范例:,021-27765466-201,非法范例:未以-分隔,以及所有含非数字字段电话号码,例如0a0*11233323,手机号码,建议采用正则表达式进行系统固化,例如:/0*(13|15)d9$/合法范例:,非法范例:非13或15开头,长度不为11位以及所有含非数字字符的号码,例如:1300006454a,行政区划(省、市),数字代码采用三层六位层次码结构省、自治区、直辖市、特别行政区的字母用两位大写字母表示市、地区、县级市、市辖区的字母用三位大写字母表示,地址,地址信息之不允许包含省份、城市和区县的信息应该按照下列顺序依次填写街道、门牌号、单元室号等信息,邮编,采
11、用四级六位编码制,前两位表示省、市、自治区,第三位代表邮区,第四位代表县、市,最后两位代表投递邮局建议采用正则表达式进行固化,例如:/0-96$/,邮件地址,建议采用正则表达式进行固化,例如:/_a-z0-9+(_a-z0-9+.)+a-z0-92,3$,工作目标和重点,产品,客户,渠道,交易,客户资产,机构,财务,协议,营销,地址,公共代码,业务主题,公用,三期(2010/01-2010/06),一期(2008/02-08),建立兼职数据标准小组建立数据管理流程建设管理工具,兼职:每部门1人,基础框架客户、产品主题公共代码,ECIF的客户模型相关系统的产品,统一的客户视图数据标准实施蓝图和路
12、线图,二期(2008/09-2009/12),规划的实施路线图,1.定期复审数据标准,评估前期成果合理及适用性,推动必要修正,保证数据标准的有效性2.定期审视前、中、后台操作/管理系统有无不符合数据标准指导原则部门,评估修正可能3.定期审视现有操作流程评估数据标准使用的合理性,作为未来修改、新增操作流程依据,落地建议仅供参考,不作为本项目的交付,标准的维护和更新,一期项目标准定义(1):客户主题,客户定义与分类,客户信息模型,产品定义及原则,一期项目标准定义(2):产品主题,产品清单,产品分层,产品信息模型,产品特征定义,产品与特征的映射,一期项目标准定义(3):标准代码(I),完成199个公
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据管控总结 数据 总结 PPT 课件

链接地址:https://www.31ppt.com/p-5519648.html