河北省工行数据仓库方案.docx
《河北省工行数据仓库方案.docx》由会员分享,可在线阅读,更多相关《河北省工行数据仓库方案.docx(31页珍藏版)》请在三一办公上搜索。
1、河北省工商银行数据仓库系统建设方案建议书北京世纪明日网络科技有限公司二零零零年三月河北省工商银行数据仓库系统建设方案目 录第一章 前言1.1 数据仓库发展史1.2 竞争日趋激烈的金融市场1.3 中国专业银行面临的挑战1.4 中国专业银行实施数据仓库的意义1.5 中国专业银行实施数据仓库已具备的条件第二章 数据仓库总体概述 2.1 数据仓库基础 2.2 数据仓库技术概述 2.3 一个可扩展数据仓库的基本框架 2.4 一个数据仓库实施流程第三章 系统体系结构设计 3.1系统设计指导思想 3.2 方案总体框架图 3.3 系统体系结构设计 3.4 系统方案的组成第四章 银行数据仓库的建设 4.1 面向
2、应用的OLTP系统和面向主题的OLAP系统 4.2 个性化服务的定义 4.3 业务探索/业务发掘 4.4 建立市场客户信息基础 4.5 利用数据仓库实现的基本模块 4.6 更高层次的开发应用 4.7 综合信息发布第五章 方案实施建议 5.1 开发模式 5.2 组织机构 5.3 项目实施进程 5.4 项目进度计划第六章 产品报价 6.1 软件产品报价 6.2 硬件产品报价 6.3 项目开发实施费用第一章 前言1.1 数据仓库发展史 相对于许多行业而言,信息处理技术还是一门新兴的技术,但是其发展速度却几乎是最快的。随着计算机硬件技术的飞速发展,软件技术也是日新月异。许多企业和机构已经建立了相对完善
3、的OLTP(联机事物处理)系统。随着时间的推移,这些系统中积累了大量的历史数据,其中蕴含了许多重要的信息。通过对这些历史数据的分析和综合处理,可以找到那些对企业发展至关重要的业务信息,从而帮助有关主管和业务部门作出更加合理的决策。70年代中期出现的MIS(管理信息系统)实际上就是在这种背景下产生的。但MIS具有极大的局限性。首先,它是按预先定义好的流程对数据作相应的处理,因此只能对预先描述好的业务问题进行回答。其次由于开发工具的限制,对它的修改也不大方便,特别是业务流程发生变化,模型需要调整,这种修改更加困难。最后数据的不断积累和数据量迅速增加,普通的商用数据库(即OLTP数据库)难以处理,系
4、统的扩展存在很大限制。在这种情况下MIS逐步发展到了数据仓库。世界上最早的数据仓库是NCR公司为全美、也是全世界最大的连锁超市集团Wal*Mart在1981年建立的,经过二十年的发展,该系统已经非常完善,数据量扩展到27TB,成为迄今为止世界上最大的数据仓库。 1.2 竞争日趋激烈的金融市场 根据Tower Group公司1998年10月的研究,1999年全球金融机构将投资54亿美金实施数据仓库系统,其中欧美地区占八成的市场份额,其次为亚太地区,在美国实施数据仓库的单位以大型银行为主,基础上启动的资金为五百万美金以上;1998年在全球前500家银行中已经有近九十家的数据仓库数据量超过500GB
5、,预测在1999年将有150家,2000年有260家;数据仓库是金融机构实现客户关系管理(Customer Relationship Management)的核心技术,也是金融业竞争优势的来源,主要的应用业务部门为信用卡部、信贷部、市场部和零售业务部等,应用领域是以客户为中心的分销渠道管理、客户利润分析、客户关系优化和风险控管。 造成欧美地区金融机构采用数据仓库技术,提供以客户为中心的个性化服务(One to One Marketing)的背景原因如下:1) 金融服务市场的开放竞争。如AT&T电话公司的电话卡可以透支打电话、福特汽车公司的购车信用分期付款、零售业的透支分会员卡和贵宾卡、信用卡公
6、司发行信用卡、ESD建立ATM网、GE公司的贷款服务,保险公司的储蓄型保险单和保单贷款等,允许银行业的并购,影响银行的业务收入和利润。2) 上述的开放市场,业者会推出多样化的产品和服务,让顾客有更多的比较和选择的机会。造成顾客购买的因素,除了价格以外,还应考虑方便性、可用性等,形成个性化服务的需求。银行需要更进一步了解客户,才能满足客户需求,进而留住客户,增加利润。3) 信息技术(如海量并行处理的技术)的突飞猛进,使得快速地分析客户详细的历史交易数据成为可能,从而可以更好地了解、模拟和预测客户的消费行为、偏好等。另外移动通信技术的进步,让客户访问信息服务的方式不受时空的限制。这些技术让银行业务
7、用户可以及时响应各种突发的复杂的经营问题。4) 银行现有的管理制度和业务流程,都是以产品(Product)为中心来进行客户服务,不同的帐号信息分散在不同的计算机系统内,缺乏对客户统一的全面了解。现有的生产系统是银行营运和客户的基础设施,无法提供多用户对大量历史数据同时进行突发的复杂的决策分析,所以建立另外一套以客户为中心的数据仓库决策支持系统是实现个性化服务的必要手段。1.3 中国专业银行面临的挑战 1984年人民银行成为中央银行的角色,成立了四家国有专业银行:工商银行、农业银行、中国银行和建设银行。后来又成立交通银行、中信实业银行、光大银行等十一家股份制商业银行。1996年改组城市信用合用社
8、建立股份制城市商业银行。国有专业银行长期在计划体制下运转,其经营行为和经营意识带有很强的行政色彩,正向商业银行化进行过渡。随着经济的增长和国民生活水平的提高,社会保障制度的改革,政府扩大内需的政策等,国有专业银行和股份制商业银行的零售业务,如住房贷款、退休养老金、消费贷款和信用卡业务等,将成为银行业务和利润的增长点。如何争取零售业务的市场机会,发掘信用好风险低的客户已成为银行关注的焦点。在未来零售业务的迅猛发展,改善银行的获利能力,将加速国有专业银行转型成为商业银行的进程。 在现阶段,主要是国有专业银行和股份制商业银行、邮政银行之间的竞争,其他服务业和外资银行尚未构成全面性的威胁。虽然,国有专
9、业银行具有覆盖全国营业网点的优势,但受历史包袱的影响,期待扩大零售业务,以提高获利能力;股份制商业银行规模相对小,只能提供地区性的服务,零售业务是主要的收入来源,从国有专业银行和邮政银行中争取更多的新客户,将是主要的经营策略;邮政银行的优势在营业网点、客户基础和更多的增值服务,竞争的策略是留住有利润的客户和争取新客户,所以邮政银行也将是现阶段国有专业银行和股份制商业银行的重要竞争对手。 1999年11月15日,中国与美国签署加入世界贸易组织的双边协议,中国将自加入世界贸易组织起,逐步开放金融市场,入世两年后开放外资银行经营对公业务,五年后开放对私业务和设立营业网点。在可预见的未来,国内的金融机
10、构将同世界级的外资银行发生面对面的激烈竞争。届时,客户有更多的选择,竞争会更加的激烈。世界级的外资银行为加速取得和扩大在中国的市场份额,将引进其在国外实施多年的以客户为中心的数据仓库决策支持系统,推出更多样化的金融产品和服务来争取高利润的客户。因此,了解客户需求和客户对银行的利润贡献度、提供有竞争性的产品或服务、经由客户喜好的渠道、在适当的时机对客户进行销售或服务,这种个性化服务的策略将是国内商业银行在目前竞争优势的来源,同时也是未来与外资银行竞争必备的武器。如何建立个性化服务的数据仓库系统,已经成为国内银行现阶段最重要的课题。1.4 中国专业银行实施数据仓库的意义 从现在和将来专业银行所面临
11、的市场环境来看,实施以客户为中心的数据仓库决策支持系统,将对国内银行业现在和未来的发展产生深远的影响,且具有重大的战略意义。 首先是增强国内银行的竞争力,在激烈的竞争中维持获利。无论现在或是未来,银行将面临着一个激烈竞争的态势,必须对市场多变的需求作出及时响应,才能持续生存和发展。根据国外商业银行的经验,在金融市场开放环境中,银行竞争优势的来源是对每一位客户提供个性化服务。然而银行有数以千百万计的客户,如何将客户细分到以客户为中心的客户单一市场呢?也就是如何设计大量个性化的产品或服务。银行只有通过以客户为中心(Customer Centric)的决策支持系统,才能使用科学的方法实现个性化服务。
12、数据仓库系统存放每一位客户同银行往来的详细的历史交易明细数据,对客户有统一的视图,能帮助银行业务用户以科学的手段快速地分析、模拟和预测客户的个性化需求,进而设计符合客户需求的产品或服务。通过客户喜好的渠道完成交易,是增强专业银行竞争能力最有效的手段。 其次是提高专业银行整体运作与管理水平。数据仓库决策支持系统是专业银行管理模式发展的结果。随着各个历史时期经济金融环境的变化,专业银行的经营管理模式在演变,最初强调资产管理,是因为来源比较狭窄,主要是活期存款,而工商企业的资金需求也较简单,采用会计记帐设备提高生产力;到了六十年代,产生负债管理理论,强调要通过负债管理保持银行的流动性,主动从市场、银
13、行业来调剂资金余缺,开始引进会计系统计算机化;七十年代末期,出现了资产负债综合管理理论,重点在资产负债风险管理、信贷风险管理、投资风险管理和外汇交易风险管理,MIS和分行自动化成为核心系统;九十年代,金融市场的开放,低利率和信用扩张刺激消费,零售业务成为银行的主要业务和收入,客户对金融产品和服务的要求越来越高,银行业务部门和管理层首要关心的问题在于如何降低风险和增加利润,以客户为中心的数据仓库决策支持系统可以快速地了解每一项交易、每一个帐号、每一个分销渠道、每一位客户的风险和利润,让银行作出正确的业务决策,及时响应每一位客户的现在和未来需要,提高整体运作和管理水平。 最后是增强专业银行应变能力
14、。订立金融市场开放时间表,让国内银行有充分的时间准备来提高自己的竞争实力,以应付外资银行在将来的竞争。人民银行会逐步放松管制政策和增加国内银行可以经营的业务范围,让国内银行熟悉市场经济的运作规则。当外资银行可以在国内经营零售业务时,如果国内银行已经完全掌握客户的行为和需求,了解各种金融产品的的操作和管理,那么对国内银行的冲击就比较小。问题在于,国内银行如何在这么短的时间内完成这么多的事情。如果没有足够的企业和客户信息,国内银行如何了解人民银行推出的新政策对银行的影响呢?又如何向人民银行建议新业务和服务呢?或是对付外资银行的竞争呢?企业级的数据仓库系统,存放银行各种主题,如客户、帐号、部门、金融
15、产品、商业活动、位置、渠道和交易事件等,可以快速地分析、模拟和预测新业务和新政策对银行整体的影响,让银行的领导及时制定策略和战术,应变突发的复杂的经营问题。1.5 中国专业银行实施数据仓库已具备的条件 近年来,中国专业银行在管理上已逐步形成了一套快速适应市场变化、满足用户需求的内部运行机制。概括来讲,中国专业银行实施个性化服务数据仓库系统具备了以下条件:1) 企业有一支较高素质的管理人才和技术队伍,具备参与信息建设的丰富经验,为基础上实施提供了人才的保证。2) 完善的信息技术基础设施,如ATM网络、电话银行、传真服务、呼叫中心、网上服务、POS系统、企业内部网、人行的电子清算系统等,确保交易信
16、息源能及时的获得,数据仓库建成后使用方便。3) 企业已建设或正在建设的全行范围的业务系统,包括储蓄、定期、贷款、汇款、外汇、信用卡、支票、信用证、国际业务等,已积累了完整而且详细的客户交易记录,为数据仓库的启动提供了基本的数据来源。4) 多数的企业有实施先进管理制度和思想的经验,如成立市场部统筹银行的形象和市场定位的宣传与规划、经营效益与员工收入挂钩、服务时效的承诺、客户满意调查等,容易接纳新知识,对数据仓库的实施和推广应用起到积极的作用。第二章 数据仓库总体概述2.1 数据仓库基础数据仓库的概念最早将数据仓库提升到理论高度加以论述的是著名学者、被尊称为数据仓库之父的Bill Inmon。他对
17、数据仓库所下的定义是:数据仓库是面向主题的、集成的、稳定的、随时间变化的数据集合,用以支持管理决策的过程。由此可见,数据仓库是一个综合的解决方案,是对原始的操作数据进行各种处理并转换成有用信息的处理过程,它主要用来帮助有关主管部门作出更符合业务发展规率的决策。数据仓库的查询特点 针对生产系统的查询都非常简单,一般不会使用表的连接操作,每次返回的数据量很小,这类问题的特点是知道自己要找什么。数据库大小对系统性能影响不大。数据仓库系统的查询大都非常复杂,主要有两种:一种以报表为主,从数据库中产生各种形式的业务报表。这种查询是预先规定好的(Pro-defined Query)。另一种查询是随机的、动
18、态的查询(Ad-Hoc query),对查询的结果也是不能预料的。数据仓库中的查询由于其复杂性,会经常使用多表的联接、累计、分类、排序等操作,这些大都要对整个表进行搜索(Full Table Scan)。每次查询返回的数据量一般很大,对于动态查询而言,经常需要根据上次查询的结果进行进一步的搜索,这个过程称为数据挖掘(Data Mining)。根据这些特点,数据库大小对数据仓库的性能影响很大。当数据仓库投入使用后,各业务部门的要求会越来越多,使得数据仓库中数据量的增长很快。因此设计数据仓库时,系统的可扩展能力是必须考虑的重要因素之一。系统的并行处理能力是另一个要考虑的重要因素。因为查询的复杂性,
19、每个查询将占用很多的系统资源,如果系统资源不够、并行处理能力不强,当多个用户同时发出事物请求时,响应时间很长令人无法容忍。数据仓库应单独建立。因为如果在生产系统上再实施数据仓库,由于数据仓库的查询常常占用很多系统资源,将严重影响生产系统的运行2.2 数据仓库技术概述 作为决策支持系统(DSS)的一种有效、可行的体系化解决方案,数据仓库包括了三个方面的内容:数据仓库技术(DATA WAREHOUSE,DW)、联机分析技术(ONLINE ANALYTICAL PROCESSING,OLAP)、数据挖掘技术(DATA MINING,DM)1) 数据仓库技术(DW)需要以下数据库技术的支持:高性能数据
20、库服务器 数据仓库的应用不同于传统数据库的OLTP应用。传统数据库的应用是操作型的,而数据仓库的应用是分析型的,它需要高性能的DBMS核心的支持,以便较快地获得分析结果,这通常需数秒至数分钟的时间。虽然比OLPT的响应时间长一些,但由于分析型应用涉及的数据量大,查询要求复杂,因此对DBMS核心的性能要求更高,同时,DBMS必须具有良好的查询优化机制并行数据库技术 数据仓库中的数据量大,而且随着时间的增长,新的数据还会不断进入,基本成指数增长。数据仓库中的数据库通常是GB甚至TB级的,可谓是超大规模数据库(VLDB)。而并行数据库技术是存储管理VLDB,并提供对VLDB复杂查询处理的有效技术。数
21、据库互操作技术 数据仓库中的数据大多来自企业或行业中业已运行的OLTP数据库或外部的数据源。这些数据库常常是异构的,甚至是文件系统中的数据。数据仓库必须从这些异构数据源中定期抽取、转换和集成需要的数据,并把它们存入数据仓库中。因此,异构数据源之间的互访和互操作技术是必需的。2) 联机分析(OLAP)技术 OLAP是一种实现多维分析的工具。简单地可以理解为它是位于数据仓库基础之上的一个多维立方体,它面向分析决策所关心的综合性数据,以便从更高层次、多个维度来了解数据。它从逻辑上或物理上以多维方式从数据仓库里提取数据并组织数据,便于前端用户进行多维数据分析。 根据实现技术和存储数据的位置不同,又可分
22、为多维数据库OLAP(MDB-OLAP)、基于关系数据库的OLAP(ROLAP)和桌边形的OLAP(DESKTOP OLAP)。OLAP的目的是为了提高多维分析的速度。3) 数据挖掘(DM)技术 数据挖掘是从数据仓库中发现并提取隐藏在其中的信息的一种新技术。目的是帮助决策者寻找数据间潜在的关联,发现被忽略的要素,这些信息对预测趋势和决策行为也许是十分有用的。 数据挖掘技术涉及数据库、人工智能、机器学习和统计分析等多种技术。数据挖掘技术使决策支持系统跨入了一个新阶段。传统的决策支持系统通常是在某个假设的前提下通过数据查询和分析来验证或否定这个假设,而数据挖掘技术则能够自动分析数据,进行归纳性推理
23、,从中发掘出潜在的模式,或产生联想,建立新的业务模型,帮助决策者调整市场策略,并找到正确的决策。总结 数据仓库技术是以数据仓库为基础、以OLAP和数据挖掘工具有手段的一整套可操作、可实施的方案。 建立一个数据仓库是一个比较复杂的过程,它需要精心的规划、渊博的知识、丰富的行业管理经验、极强的业务沟通能力和全面的IT要素。建立数据仓库要选择合适的数据仓库引擎、硬件平台、软件工具、应用程序和行业专业服务2.3 一个可扩展数据仓库的基本框架操作数据/源数据 提取 过滤 净化 家庭关系识别 加载企业中央数据仓库复制与传播从属数据集市数据转换数据挖掘 分类 统计 人工智能 决策树信息存储工具业务用户 IT
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 河北省 工行 数据仓库 方案
链接地址:https://www.31ppt.com/p-1671425.html