银行金融行业数据脱敏解决方案课件.pptx
数据脱敏,银行,解决方案,目录,CONTENTS,01,数据脱敏的建设目标,银行机构应规避信息风险,加强数据、文档的安全管理,对客户的敏感信息提供完善的保护,对用于测试开发的生产数据要进行脱敏、变形、实现有效保护,逐步建立信息资产分类分级保护机制,完善敏感信息存储和传输等高风险环节的控制措施。,大数据及云平台的发展,最终目的在于提高信息的利用率、数据的流通性、进一步挖掘数据的价值,尤其是在金融领域长期积累的数据,其本身的价值也越来越高。,数据脱敏是什么-客户角度,1,业务快捷办理,资产增值保值,数据脱敏是什么-个人隐私,1.大量积累的业务数据,在用与防之间的流转过程中,如何保障个人隐私?随着金融业务的快速发展,业务生产系统积累了大量包含客户账户等敏感信息的数据。而在业务分析、开发测试、审计监管,甚至是外包业务等金融业的工作场景中,工作人员使用的都是真实数据。如果这些数据发生泄露、损坏,不仅会带来经济损失,更重要的是会大大影响用户对该金融机构的信任度,如何保证生产数据安全已成为银行必须面对的一个重要问题。,数据脱敏是什么-数据合规,2.上级主管部门不断推出针对性的政策法规,如何确保自身数据合规?金融行业是高度信息化的行业,在人们的日常生活中扮演着重要的角色,同时也积累了大量的用户个人数据,如何保证生产环境数据安全已经成为一个行业难题。,数据脱敏是什么-技术规范,3.现有技术明显跟不上业务发展的需要,输出包含有个人隐私数据的过程不够规范。(1)备份恢复手段直接获得测试数据优点是简单快捷;弊端却是隐私数据毫无保留地被泄露。(2)由开发商负责脱敏看似对数据进行了处理,但实际上执行者是开发商,真实数据同样已外流;效率低下,占用大量人力和时间;规则简单,通过逆向运算即可得到真实数据,并且简单的规则还会导致数据大量失真,仿真度太低,影响测试效果。(3)写程序、脚本或命令对数据进行脱敏,效率不高,准确率无法判断对客户员工的技术水平要求较高;不成熟的算法导致测试数据质量同样不高。,数据脱敏是什么-银行角度,银行产品营销,网点智能管理,数据脱敏的建设目标,线上线下渠道协同,业务办理效率提升,精准客户营销,资源管理与配置,数据治理意义、作用和价值,数据战略,数据应用与服务,数据管理,保障机制,促进,支撑,实现,支撑,数据战略与规划,数据组织与职责,数据制度与管理流程,数据服务管理,数据需求管理,应用系统建设,数据服务,数据架构与模型管理,数据标准管理,数据质量管理,元数据管理,主数据管理,数据保留与归档管理,数据安全管理,内容管理,数据治理框架,数据调度与处理,大数据平台,数据结构化转换,大数据分析计算,分布式数据库,分布式文件系统,数据生命周期管理,数据平台,数据传输,数据服务,数据集市,数据质量检核,元数据管理,数据管理平台,数据应用,统计报表,基础数据平台,贴源层,整合层,汇总层,数据切分,数据源,业务系统,物联网,互联网,数据交换平台,内部数据,外部数据,其他系统,数据接口,数据架构,数据挖掘,高管驾驶舱,一、应用(需求)驱动主导数据平台的实现,加强业务的关注和参与,二、初期能够快速见效并体现建设价值,不盲目投入,三、借鉴同业的成功经验和成果,选择成熟技术架构和解决方案,四、重视内部人员培养,建设配套运营制度和管理体系,解决在金融生产环境与非生产环境敏感隐私数据的使用过程中,如何保护个人隐私数据的难题,实现金融业务与管理无缝对接,快速高效地实现生产环境数据向非生产环境的过渡。,实施周期不易过长,规模不易过大,能够快速的见到数据总线带来的效果和价值。,尽量参考同行业、同规模、同类型企业行的建设经验,适当创新。,前期让公司内IT人员尽量更多、更深入的参与到数据总线的建设中,后期角色以管理为主,尽量与合作伙伴共同建设二期以上。配套的管理规范、技术规范、运营体系。,数据平台建设原则,第一步:为生产数据建立一套隐私数据的模型和关系,同时支持自动定义和手工定义两种模式;,第二步:通过内部保存的生产数据模型,从生产系统周期性地抽取真实数据;,第三步:根据隐私数据模型,将抽取到的真实数据进行漂白脱敏,生成伪数据,这样测试数据就准备好待用,由于方案设计的平台是封闭系统,整个过程能够很好地避免数据泄露事件的发生;,四步:当需要使用样例数据时,用户并不会直接访问内部数据,而是使用有限权限的帐号登录并将数据高速装载到外部的某个数据库中。,数据平台建设步骤,02,数据脱敏解决方案,数据脱敏整体解决方案,功能与业务流程,据自身记录的生产系统的元数据定义,从生产系统数据库当中抽取数据,抽取的数据源支持主流的数据库系统及文件。为安全起见,隐私数据在完成漂白之前,非数据管理员看到的都是空表。,数据自动抽取,面向不同的元数据,可以提供丰富多样的数据分发方式,同时支持对目标源的自动校验,最大限度保障用户数据的安全。,数据智慧装载,自动扫描并定位银行生产数据中的敏感数据,建立隐私数据模型,自动识别表与表之间的关联关系,利用自身独一无二的深度内容识别技术,在敏感数据智能发现上具有独一无二的竞争优势。,数据智能发现,根据隐私数据模型进行敏感数据匹配,定位哪些表哪些字段为隐私数据,属于哪种隐私数据,同时对于出错的数据进行进一步梳理,剔除错误数据,保证隐私数据模型的准确;,数据梳理识别,数据漂白会自动根据元数据中隐私数据的定义,内置丰富的隐私数据模型规则,同时也可以自定义修改脱敏规则,对相应的数据进行脱敏变形。,数据高效脱敏,01数据脱敏-系统架构图,核心,CRM,银联,互联互通平台,01数据脱敏-网点设备智能化,设备端加装人脸识别摄像头,柜面及自助设备增加人脸采集绑定流程后台部署人脸识别系统,设备端加装阵列麦克风,后台部署语音识别系统,指静脉识别(活体检测)声纹识别等,二维码扫描,01数据脱敏-网点设备智能化_刷脸交易,用户,设备,摄像头,刷脸取款,输入手机号,人脸比对,人脸比对系统,账号选择,密码验证,出钞,输入金额,01数据脱敏-网点设备智能化_语音交互场景,用户,设备,设备展示,语音识别,语音识别系统,请说:取款转账取款500,欢迎光临请说出您要办理的业务,靠近,展示,取款500,指静脉识别,指静脉设备(活体样例),出钞,数据应用现状分析-总体情况,行领导,?,综合业务系统,信贷管理,国际业务系统,债券管理系统,数据交换平台,综合报表平台,财务会计部,信贷管理部,国际业务部,资金计划部,.,业务职能不清晰或相互重叠,观察数据视角不尽相同,缺少数据标准与业务统一定义,语轨不一致,IT架构中中都是以部门级应用为主(如计财、资金计划部等),缺乏从大的管理职能(财务、风险、运营等)综合方面的数据整合、数据标准和统一业务定义,缺乏数据梳理,造成行领导看到的数据相互冲突和矛盾,由于业务系统输入的随意性,导致部分关键业务数据质量较差,业务人员,X?567,数据应用现状分析-数据架构方面,由于全行的数据散落在各个业务系统中,没有进行有效整合,形成竖井式架构,造成多个信息孤岛,整体架构缺少一个稳定的、抗源变化的保存最细粒度历史数据的数据层。无法支撑未来共享性应用。,集市层,客户风险,客户一部,中间业务,汇总数据层,主题层,报表应用共用主题数据,客户风险报表,客户一部报表,中间业务报表,支付报表,支付业务,ODS层,DEP层,BDS层,其它报表,业务表现信息孤岛数据冗余共享性差历史数据缺失问题数据分散,难以管理没有一个稳定的,抗源变化的数据层,综合业务,信贷管理,国际结算,债券核算,源系统,竖井式架构,造成信息孤岛,缺少一个稳定的、抗源变化的数据层,客户管理,绩效考核,没有进行整合,无法共享,不能支持如客户管理等共享性应用,数据应用现状分析-数据应用难题,业务表现各集市系统指标存在重复各集市系统在保有存量的同时,不断产生新的指标(增量)集市指标派生无法实现指标逻辑视图(指标分类)不一致问题重复投入数据不一致指标设计、口径不一致指标难以共享,客户风险集市,客户一部集市,资金计划部,借据号,期末余额,。,借据编号,期末贷款余额,总资产,用户,我想看本期贷款余额,看哪个呢?,主营业务收入,负债总额,活期存款流水采集单,G21流动性期限缺口统计表,。,我想看客户经营情况信息,有哪些呢?,用户,活期存款指标数据怎么不一致呢?,活期存款,缺少统一的应用分析标准,数据应用现状分析-数据应用难题,业务表现各系统存在冗余数据各系统存在业务含义一致,名称定义不一致的属性各系统存在含义不一致,名称定义一致的情况业务代码定义混乱问题重复投入数据不一致、不准确难以利用和管理各系统数据难以共享,缺少统一的基础数据标准,核心贷款分户账表,贷款主档代码,贷款余额,。,五级分类标志,计息方式,信贷管理借据表,贷款账号,贷款余额,。,5级分类标志,借据计息周期,业务含义一致,名称定义不一致,数据冗余,相同业务代码定义不一致,数据应用现状分析-数据质量方面,没有归纳并总结数据质量问题,缺少反馈机制,导致长期存在各类数据质量问题。,业务表现指标难以共享数据不一致、不准确问题部分关键业务数据缺失源系统校验关系缺失及业务人员操作随意,30,非现场监管报表,统计各省分支机构每笔借据的五级分类,信贷管理源系统操作错误,贷款质量五级分类情况简表,信贷管理客户表,核心客户表,由于信贷管理系统业务人员没有填写或填写错误借据的五级分类信息,导致报表数据不准确,需要手工补录修改,不同系统相同客户号对应的客户简称不一致,数据应用现状分析-总结,随着业务的不断发展和信息化的不断深入,需建设的业务系统越来越多,随着业务系统的数据种类不断丰富完善,数据量的不断增大,如果不采取有效手段解决数据架构、数据标准、数据质量问题,随着信息化建设的深入,这些问题将像雪球一样越滚越大,越积越多。,02数据脱敏-线下渠道精准营销,后台建设精准营销系统线下渠道设备通过前置对接精准营销系统,精准营销广告投放精准营销产品购买入口,02数据脱敏-线下渠道精准营销场景,用户,设备,身份识别,精准营销系统,大堂经理,推送重要客户,排队机,取号机,用户,设备,身份识别,自助设备,营销展示,营销交易入口,03数据脱敏-线上线下渠道融合,后台部署互联互通平台服务器构建网点设备群组,手机银行、微信银行等线上渠道与线下自助渠道通过互联互通平台对接打造高效客户体验,03数据脱敏-线上线下渠道融合场景,用户,手机,开卡申请,开卡,资料填写,生成二维码,发卡区,扫码二维码,提交申请,身份证核查,拍照,电子签名,发卡,线上申请开卡,04数据脱敏-线下渠道互联互通,线下渠道对接互联互通平台,成为群组一员通过互联互通平台实现消息传递与数据共享,实现线下渠道统一部署和管理线下渠道共用同一套业务功能APP,业务流程模块化、参数化,04数据脱敏-线下渠道互联互通场景,用户,设备,选择金额,非现金设备,大额取款,10000,20000,30000,40000,50000,身份审核,生成取款二维码,大额取款区,扫码二维码,输入密码,出钞,05数据脱敏-相关技术方案,跨操作系统:支持Windows、Linux、Android运行渠道统一:同一套平台及应用代码,无需重复开发和测试部署灵活:支持CS、BS及混合架构部署模式极致客户体验:UI独立运行,支持跨浏览器,线上线下渠道全打通支持集群部署设备端业务流程时序数据同步,05数据脱敏-相关技术方案,统一管理各类型自助设备集成各类管理系统:无纸化、冠字号、安全管理统一用户入口:PC、智能手机、pad,开放性接入接出:支持多种协议、多种报文格式、支持交易透传多渠道交易共享:实现渠道无关性高效开发工具,真正意义上的跨平台,05数据脱敏-统一应用平台,05数据脱敏-统一应用平台,UI交互系统:提供界面展示及人机交互,APP应用服务层:提供应用服务级封装及接口,APP应用:提供APP应用加载、UI系统接口调用、APP应用服务平台接口调用,WSAP+架构-WSAP5.0运行展示,ANDROID PAD,WINDOWS/LINUX,05数据脱敏-统一应用平台,05数据脱敏-互联互通平台,用户终端,互联互通平台,PAD,基础通讯服务,业务逻辑路由服务(控制服务),连接第三方系统平台服务,管理台服务器(终端管理群组管理交易监控报表管理),实时数据,总行,控制管理台,历史数据,网银系统,手机银行,CRM,大数据平台,手机,监控管理台,分行,机器人,ATM,自助终端,大堂移动端,排队机,VTM,呼叫系统,其它终端,控制管理台,网点,05数据脱敏-互联互通平台,单个银行网点的所有设备(自助设备),排队机,柜员等,可以组成一个群组,实现网点内消息的交互。场景1:客户进入网点后,机器人通过语音识别出客户需要办理的业务后,可以根据客户业务类型,提示用户到自助终端办理还是到柜台办理.如果到柜台办理,机器人可以通过互联互通系统获取当前用户办理业务当前排队人数,并将信息提示给用户.场景2:用户在自助终端上办理需要大堂经理授权的业务时,系统会自动提示大堂经理当前客户要办理的业务及授权类型。大堂经理授权结束之后,用户可以继续进行业务办理。,05数据脱敏-互联互通平台,管机员可以通过移动终端实时查看自助终端的运行状态,当终端出现故障后,管机员可以实时了解设备故障修复情况。经过授权的管机员可以在移动端对终端进行修复等操作。,05数据脱敏-互联互通平台,一次服务可以调用多个业务渠道的资源。通过互联互通,让自助设备、客户设备、银行客服协作,为用户提供统一服务。,05数据脱敏-统一前置平台,共享,共享,共享,共享,共享,共享,BPE交易共享,CUP,BSM渠道,HOST,第三方业务,ATM渠道,VTM渠道,05数据脱敏-统一前置平台,05数据脱敏-统一前置平台,统一平台运营管理集中监控,1,品牌:日立、NCR、迪堡、广电、长城,解决监控的“各种烦恼”,ATM/CRS,填单机/BSM/智能大屏,TCR,STM,发卡机,05数据脱敏-统一运营管理平台,统一平台运营管理系统-移动互联,采用富客户端技术,统一了PC桌面、平台电脑、智能手机三大用户入口!,05数据脱敏-统一运营管理平台,数据平台逻辑架构,数据调度与处理,元数据管理,数据传输,数据生命周期管理,非现场报表,财会报表,客户风险报表,.,机构客户账户.,非现场监管集市财会报表集市风险报表集市高管驾驶舱集市.,数据仓库,源数据,数据应用,贴源层,整合层,汇总层,集市层,数据管理系统,综合业务系统,CM2006,国际结算系统,债券管理系统,ETL,ETL,数据切分,作业调度,作业调度,作业调度,ETL,CBS,CM2006,EE,BOND,PE,FES,MCS,数据平台部署架构,数据平台项目建设目标,目标建设方法-发现数据质量问题,建设内容,分析源系统表数据,从及时性、完整性、准确性、有效性、一致性方面对源系统数据进行数据校验,发现并记录数据质量问题,生成数据质量问题报告,建设数据质量检核系统,对源系统基础业务数据的进行全面的数据质量检查,并实现重要业务数据质量的周期性动态检查,对发现的数据质量问题生成数据质量报告,反馈给业务部门,目标建设方法-发现数据质量问题,源系统分析阶段,全面分析主要源业务系统,数据质量问题检查阶段,根据制定的检查规则编写程序,对源系统数据进行检查,数据质量问题分析阶段,分析有质量问题数据对现有应用的影响;提出解决措施,1,2,3,工作阶段,源系统分析阶段,产出物,源系统表结构,包括主键、外键、唯一性约束源系统表间关系源系统字段长度和类型,数据质量检查阶段,数据质量分析阶段,数据质量反馈系统概述,建设目标,对业务数据进行数据质量检核,准确掌握业务系统各种数据质量问题,促进基础业务数据质量的提高,建设内容,质量检查规则定制 实现质量检查规则的灵活定制数据质量检查 系统按照预定义的数据质量检查规则,对数据的准确性、有效性、关联性、一致性、及时性进行检查,生成并保存的数据质量检查信息。数据质量分析报告 生成不同类型的数据质量检查报表,对不同的数据质量问题进行分析和展示,架构和功能,系统架构,数据质量检核与反馈系统,检核对象管理导入、查询、修改、删除检查对象,检核规则管理新增、删除、修改检核规则,检查频度管理制定检查周期和时间,权限管理,用户建立,权限管理,问题报告问题查询规则查询打包下载.,问题管理维护并管理发现的数据质量问题,日志查询,报告管理,系统功能,调度管理,整合层,汇总层,集市层,贴源层,数据质量检查及反馈系统界面,数据质量管理建议,通过逐套的解决报表数据质量问题,以数据标准为依据,来切实解决基层手工修改报表的问题,源头负责制,谁录入谁修改,操作层面,数据纠错,管理层面,形成数据质量管理的机制:发现问题,定位问题,解决问题的管理流程,IT系统建设层面,将数据质量问题检查规则固化到系统中,形成数据质量台账,为解决数据质量问题和考核提供依据,数据平台项目建设目标,数据标准梳理及归纳,基础数据标准,指标数据标准,数据标准梳理及归纳,对我行日常业务开展过程中所产生基础性数据,从业务方面、技术方面、管理三个方面,对数据的业务表达、数据格式、数据关系等方面进行一致约定,从而规范数据在全行内外共享和使用中的一致性和准确性,对数据的管理、应用过程进行统一和规范,明确数据的定义、格式、规则以及数据与数据间的关系为系统开发实施提供全行统一的规范准则为数据加工和应用提供统一来源和依据,作用,定义,定义,通过对我行经营管理资料的分析,并参考同 业的类似成果以及监管部门要求,梳理 和筛选出直接反映我行业务经营管理 状态的重要指标,并对指标的业务 含义、业务规则、统计口径等内 容进行标准化定义,形成全行一 致的指标数据标准,作用,统一全行对各项经营指标的理解和 认识,促进各项经营指标在经营管理 决策中的运用;统一全行指标标准的业务含义、计算口径等内容,从而解决我行取数口径不一致、业务含义不清晰、指标分类不清晰的情况,促进部门间数据共享,目标建设方法-数据标准解决的问题,数据孤岛数据质量,制定了全行统一的标准,实现了业务数据信息统一定义,统一命名、统一来源,对于数据质量造成的数据准确性、一致性等问题,找出造成这些问题的原因,违背业务和约束的数据不进入标准体系中,举例,例如:在标准制定过程当中,对于业务数据之间关联不上的问题,首先要找出关联不上的原因,之后通过和业务人员的有效沟通,制定出以哪一类数据为准的标准,比如信贷管理系统的贷款余额和核心系统的贷款余额不一致,在制定“协议金额”标准的过程当中,必须明确以那个系统的贷款余额为准,且以此贷款余额制定全行标准,从而解决此类问题。,例如:不同部门的贷款余额由于取数来源不同而造成差异,通过建立完整的分析数据标准体系后,统一了业务定义和取数口径,有利于全行范围内重复利用,杜绝出现各业务部门多次重复定义类似的指标,并且因为标准的权威性和标准的严格管理,有效防止指标定义和口径的二义性。,目标建设方法-数据标准-建设步骤,基础数据标准,指标数据标准,分析数据标准发布执行,标准映射,数据源和基础标准数据映射,数据源和分析标准数据映射,标准执行,标准定义,数据标准,基础数据标准发布执行,业务定义、业务规则、业务含义、计算口径,业务含义、业务规则、业务描述、数据来源,目标建设方法-数据标准-建设内容,目前存在问题业务访谈系统调研结合最佳实践分析、诊断,形成标准化定义初稿和框架对定义初稿征求意见和讨论根据意见反馈和讨论结果和修正并形成数据标准,确定映射的系统范围制定源系统与标准的映射规则根据数据验证映射规则,提出标准在未来各影响面执行的遵循原则就标准与现状的实际差异给出具体的执行建议,目标建设方法-数据标准-基础数据标准调研,调研分析,业务字段,源业务系统,分析调研记录,实体属性,模型匹配整合,1、名称不同,业务含义相同,2、名称相同,业务相同,3、名称相同,业务含义不相同,目标建设方法-数据标准-基础数据标准框架梳理,基础数据标准框架梳理,参考补充,分析调研记录,标准分类,标准主题,参考:1、同业标准体系框架2、TD模型的结构与分类,目标建设方法-数据标准-基础数据标准定义及确认,标准分类,标准中文名称,标准信息类,业务规则,业务描述,数据类型,长度,标准依据,相关标准,标准英文名称,业务含义,源系统,标准管理部门,数据格式,技术人员,业务人员,沟通.确认,基础数据标准化方案,目标建设方法-基础标准-制定框架,基础数据标准框架属性参考人民银行标准规范文档和他行标准,由3部分22个属性项组成,分别为业务属性、技术属性、管理属性。,目标建设方法-基础标准-指标标准建设思路,目标建设方法-基础标准-指标标准筛选方法,经营管理资料:行领导讲话我行各业务部门的业务经营分析报告我行的各类管理报表筛选原则:反映我行规模、风险、盈利、业务增长等各方面业务状况的典型指标口径稳定不易变化的指标,外部资料:同业相关建设资料城商行银行国有银行建设银行人民银行、银监会监管指标要求筛选原则:监管部门有强制监管要求的指标同业用到,与我行业务有关的指标,筛选、确认方式:项目组内部讨论筛选外部需求调研,进行补充和确认,目标建设方法-基础标准-指标标准框架制定方法,设计依据:指标的业务共性的归纳及提炼参考行内资料我行业务分类源业务系统操作手册及业务简介文档统计集中系统指标分类参考外部资料监管部门的管指标及指标分同业相关资料的指标分类设计原则分类体系覆盖筛选出的所有业务指标,并能为每个指标确定唯一的分类易于根据业务和指标变化进行扩展,设计依据:人民银行JRT 0105-2014银行数据标准定义规范外部资料设计原则:可以从业务、技术、管理不同角度对标准进行全面定义对指标标准必须清晰、明确满足未来对满足标准进行管理的需要,目标建设方法-基础标准-指标数据标准框架,指标数据标准框架,业务属性,技术属性,管理属性,指标中文名称,指标英文名称,指标范围类别,计算公式,业务规则,相关指标标准,是否手工录入,显示精度,指标落地系统,数据来源系统,数据源表,数据格式,度量单位,取值范围,归口业务部门,业务负责人,技术负责人,反馈结果描述,指标编码,指标别名,指标定义,指标大类,指标小类,指标来源,口径明细,取数口径,相关基础类数据标准,指标生成频度,取值精度,指标应用-高管驾驶舱,从经营概况到具体指标分析,今日快报全行7项核心业务指标的展现和分析最重要3项监管指标进行展现和分析,指标总览按分类展现全部指标的本期值及与往期的比较值的列表,经营概览对某一具体指标进行比较、结构、趋势等方面的分析,专项分析从业务角度对一组反映类似业务的指标进行分析,热点地图显示全国地图,可以展示各一级分行重要的经营简报数据,我的指标,规模分析,利润分析,风险分析,主驾驶舱选取13个行领导重点关注的指标展示,我的指标根据用户对指标的重视程度,实现指标的个性化定制,功能简介,指标应用-高管驾驶舱-界面截图,数据平台项目建设目标,数据仓库层次架构,主题,逻辑视图,实体,属性,共性提炼分类分层,数据仓库层次架构,风险评级,内部机构,对公客户,对公客户信息,对公客户管理信息,不良贷款信息,对公客户领导信息,对公客户资本金构成,财务信息,机构信息,数据仓库模型设计方法,模型映射,目标的建设方法-数据仓库模型框架,整合层模型设计-基础模型(业务匹配)基础模型是TD模型在我行进行初步客户化后的产物。将TD模型的主题和实体,与我行的实际业务行的实际业务进行对比分析,根据匹配结果对TD模型进行裁剪、合并和扩充,形成匹配我行实际业务的情况的模型框架。,营销主题,当事人主题,Teradata金融模型10.0,当事人资产主题,产品主题,事件主题,协议主题,地址主题,渠道主题,内部组织主题,财务主题,基础模型,我行无关业务,我行现有关务,我行未来关务,我行现有业务,我行无关业务,我行未来业务,对公客户,合同,机构,个人业务,营销活动,保险投资,合并,当事人主题,当事人主题,保留,内部组织主题,营销主题,保留,增加,代码主题,数据质量反馈,业务匹配,目标的建设方法-数据仓库模型框架,整合层模型设计-属性匹配 对源业务系统的字段进行梳理分析,筛选出具体业务价格的字段,将业务字段与基础模型的主题、实体和属性进行匹配分析,根据匹配结果对基础模型的实体、属性进行增删。,实体属性,基础模型,源业务系统,业务字段,分析匹配,?,新增属性,实体属性,保留(整合)并映射,新增并映射,?,未来业务相关则逻辑化保留,未来业务无关则删除,数据仓库模型,逻辑模型设计-主题划分,当事人,逻辑模型设计-当事人主题,当事人是一个独立的人或者一组人组成的机构、团体等,主要分为个人、机构和家庭,他们是和我行有往来或者出于营销、管理等各种需要希望关心和分析的个体或人群。从模型角度考虑,应该包括以下当事人信息:在我行登记注册开立账户的对公普通客户;我行担保客户和我行有业务往来的其他金融机构;机构的内部组织(如分支机构、部门等);机构的员工(含我行柜员、员工等);,协议,地址,产品,当事人,渠道,反馈域,财务,事件,当事人资产,代码,逻辑模型,逻辑模型设计-代码主题,代码:是指将源业务系统所涉及到的所有代码进行整合,在整合层模型中统一存储,依据前端应用需求的需要,将代码主题的整合分为两大类:简单代码表和复杂代码表,简单代码表指的是只需要关注代码值和代码值业务含义描述;复杂代码表指的应用需求除关注代码值和代码值业务含义描述外,该代码表的其他属性也有应用需求,同样需要关注,这样的码表将作为普通的数据表对待;自定义代码,是属于简单码表的一种。,公共类代码表,协议类代码表,分类模式编码表,协议,地址,产品,当事人,渠道,反馈域,财务,事件,当事人资产,代码,逻辑模型,逻辑模型设计-协议主题,协议,地址,产品,当事人,渠道,反馈域,财务,事件,当事人资产,代码,协议是指金融机构与当事人之间针对某种特定产品或服务而签立的契约关系,如账户、客户和银行签订的合同等。当金融机构与客户之间针对某种产品或服务的条款和条件达成协议时,一个协议(Agreement)就会被开立,因此协议是客户和银行往来的重要载体,我行模型包括以下协议信息:我行涉及金额、期限、利率等的具体协议细项的金融账户我行与当事人之间针对某种特定产品或服务而签立的金融合约我行在支付结算业务中使用到的各种银行票据:汇票,逻辑模型,抵质押合同,贷款借据,项目额度申请,贷款申请,项目贷款,贷款合同,抵质押合同押品信息,借据还款计划,逻辑模型设计-事件主题,事件:可以记录各种与银行相关的活动的详细情况。既可以与资金相关,也可以与资金无关;既可以有客户参与,也可以没有客户参与;既可以与帐户相关,也可以与帐户无关;可以由客户发起,也可以由银行发起。总之它可以记录的范围非常广泛,包括交易数据,比如存款、提款、付款、收取信用卡年费、计算利息和费用、投诉、查询产品、查询地址、查询余额、网上交易等。我行模型包括以下事件信息:存款信息、贷款信息;库存管理、现金管理、账户管理、资产管理;资金调拨、支付结算、现代化支付;报文清算、国际业务;外汇、票据、市场交易、十二级分类、核心账务。,商品棉贷款信息采集,粮油库存核查,同业定期存款汇入,同业定期存款汇出,新棉收购进度采集,棉花农资库存变动,协议,地址,产品,当事人,渠道,反馈域,财务,事件,当事人资产,代码,逻辑模型,逻辑模型设计-财务主题,财务:主要包括银行的总账信息,是描述科目组织、控制、内部核算等银行核心科目账务以及预算管理有关的内容。该主题抽象地描述了银行内部账务的组织模式,能够适应不同的科目组织体系。我行模型包括以下财务信息:总账(分户)总账明细科目/科目组/科目类:对于科目的层次级别设置和管理财务预算,总账日旬余额,总账月余额,协议,地址,产品,当事人,渠道,反馈域,财务,事件,当事人资产,代码,逻辑模型,逻辑模型设计-当事人资产主题,当事人资产:描述当事人的所有资产,该主题包含两大类的资产,既包含我行自有资产又包含客户所拥有的资产。一个资产可以被多个当事人所拥有,一个当事人可以与多个资产有关。资产可分为实物资产、金融资产与无形资产。客户资产信息的来源很多情况下是在客户申请贷款时所提供的各种担保品信息、抵质押品信息等。我行模型包括以下资产信息:银行自有资产,具体又细分为:银行自有无形资产、固定资产、经营性租赁资产、其他资产等;客户自有资产,具体又细分为:客户抵债资产、客户担保资产、金融资产、实物资产、无形资产等。,客户担保资产,金融资产,客户抵债资产,实物资产,抵质资产房产信息,交通运输设备,协议,地址,产品,当事人,渠道,反馈域,财务,事件,当事人资产,代码,逻辑模型,数据映射和ETL开发,源表,映射文件,目标表,开发规范,合并,拆分,复制,ETL,业务含义不同,名称相同,进行拆分,业务含义相同、名称不同,进行合并业务含义相同、名称相同,进行合并,转换,生成新键值代码值转换数据类型转换值域转换值转换,ETL开发人员按照映射文件中规定的映射逻辑要求,结合开发规范,编写作业,通过数据源分析,制定加载策略,开发JOB调度,直接拷贝,加载策略,数据源分析,常量,赋固定值,1,表间关联/单表操作(LeftJoin,InnerJoin,FullJoin,Union),映射文件,通过映射文件,确定表间关系,感谢聆听,