上海移动容灾系统方案设计报告 .doc
《上海移动容灾系统方案设计报告 .doc》由会员分享,可在线阅读,更多相关《上海移动容灾系统方案设计报告 .doc(146页珍藏版)》请在三一办公上搜索。
1、上海移动容灾系统方案设计报告IBM 公司上海分公司Version 5.0IBM专有信息声明本设计报告属商业机密文件,书中的所有信息均为IBM机密信息,仅供上海移动容灾项目使用。务请妥善保管并且仅在与项目有关人员范围内使用,未经IBM 公司明确做出的书面许可,不得为任何目的、以任何形式或手段(包括电子、机 械、复印、录音或其他形式)对本文档的任何部分进行复制、存储、引入检索系 统或者传播。尽管IBM已经尽力保证本文档内容的完整性和有效性,但仍可能存在某些方 面不够准确的地方或印刷错误。若需求有所变化,IBM将对有关内容进行相对应 的调整,并在本报告的未来版本中体现。IBM是国际商业机器公司的注册
2、商标。本文档提及的其他公司、产品和服务 的名称,可能是其他公司的商标或服务的标志。Copyright IBM China Company LimitedAll rights reserved关于本文档文档信息文档名称上海移动容灾系统方案设计报告作者IBM全球服务部说明本文档是上海移动容灾系统方案设计报告,由IBM公司上海分公司和上海移动容灾系统项目组共同编写。文件名称上海移动容灾系统方案设计报告 v5.0.doc怱订历史 (REVISION HISTORY)RevSectionTypeDateAuthorRemarks1.0AllNew2004-09-13IBMSHMCCteam创 建 方 案
3、 第 一 版本。2.0AllRevised2004-09-22IBMSHMCCteam根据客户反馈怱改而成3.0-3.1AllRevised2004-09-27IBMSHMCCteam根据客户反馈怱改而成,增加存储管 枞 和 灾 难 恢 复 计 划,网络设计考虑多种方案4.0ALLRevised2004-10-08IBMSHMCCteam整枞版本5.0AllRevised2004-10-25IBMSHMCCteam加入摘要,加强存储管枞内容。内容范围本文档是上海移动容灾系统方案设计报告,属于机密文件。 适用的对象本文档适用于参与上海移动容灾项目组的决策者、评估者。目录1摘要72容灾系统建设意义
4、83容灾技术方案选型123.1容灾系统架构方案设计范围123.2容灾技术方案设计方法123.3容灾系统建设目标123.4容灾 7 层技术模型介绍133.5容灾技术方案选型考虑164容灾系统方案设计234.1上海移动系统现状234.2容灾架构整体设计244.3容灾系统详细设计314.3.1本地数据库容灾313.3.2容灾系统主机设计324.3.2容灾系统存储设计463.3.4容灾系统网络设计534.4容灾系统备份方案设计714.4.1数据备份概述714.4.2备份系统现状分析734.4.3容灾备份系统逻辑设计754.4.4容灾备份系统配置设计824.4.5容灾备份系统专业服务844.5容灾系统管
5、理方案设计864.5.1存储资源管理864.5.2存储网络管理915容灾系统实施计划945.1灾难恢复计划945.2上海移动容灾项目实施计划956附录966.1机房工程技术说明966.2上海移动业务支撑系统平台现状概况一览表。1056.3IBM 项目管理服务1076.4支持多厂商的网络存储通用管理软件 SANavigator 版本1146.5容灾系统管理方案设计1216.5.1系统管理现状1216.5.2系统管理需求1226.5.3系统管理架构建议1236.5.4事件管理1266.5.5网络管理1286.5.6数据库管理1296.5.7主机系统监控1316.5.8SLA 管理1336.5.9B
6、OSS 应用管理1346.5.10流程管理1341 摘要一、项目背景随着电信市场的开放以及中国加入 WTO 进程的进行,中国移动通信面临着前 所未有的发展机遇和挑战。作为一个电信运营商,其 IT 系统的应用直接关乎管 理、服务、成本、效率等各个重要环节,并最终全面影响运营商的竞争力。电信 行业是一个讲究系统高可用性的行业,它要求关键应用服务器必须 247 的不间 断运行,以满足超大量用户的实时访问,任何潜在的单点故障都有可能导致整个 系统的瘫痪。为了保证信息系统的稳定和数据的安全,提高业务运营系统的服务 质量,确保在日益激烈的市场竞争中确立主导地位,上海移动决定在现有业务运 营支撑系统的基础上
7、,结合自身的特点和实践经验进行上海移动业务运营支撑容 灾系统工程的建设。本次上海移动业务运营支撑容灾系统工程的目标,是按照移动集团公司 BOSS 系统容灾备份技术规范和业务规范,主要考虑中国移动业务支撑网中的 BOSS 系统,兼顾经营分析系统。对于 BOSS 系统,将主要考虑其中的营帐子系统, 计费子系统,充值子系统,1860 子系统,综合结算中的网间结算子系统。整个容灾系统建设将遵循统一规划,分步实施的原则。二、本设计报告内容结构本容灾设计报告主要分为四大部分:容灾系统建设意义、容灾技术方案选型、 容灾系统方案设计以及容灾系统实施计划。容灾系统建设意义部分主要从行业竞争需要、业务稳定需要和企
8、业管理需要 三方面阐述了容灾系统的建设意义。容灾技术方案选型部分主要根据上海移动 BOSS 系统的现状和将来的发展并 满足对应用和在用系统影响最小以及生产系统变动的需要推荐使用存储层+数据 库层的复合容灾方案。容灾系统方案设计部分主要针对上海移动 BOSS 系统的各个子系统提出了各 自的容灾架构设计,根据各子系统的实时性恢复要求提出对于营帐数据库,充值 数据库和 1860 数据库实施两层容灾设计;对于计费,经营分析,网间结算,批 价等提出存储层的容灾设计。另外还从容灾系统的主机、存储、网络、备份方案 以及存储资源和存储网络管理方案方面作了详细的设计。容灾系统实施计划部分介绍了如何系统的实施灾难
9、恢复计划以保证灾难发 生时业务操作地连续性。2 容灾系统建设意义中国有句古话叫做“天有不测风云,人有旦夕祸福”,充分说明灾难的不可测性。911 事件是对这句话的最好注脚,在里面办公的 286 家公司的 5 万多名员 工是根本不会想到好端端的坐在办公室里居然会有飞机撞过来。在这种近乎毁灭 性的局部灾难面前,是否有异地容灾系统就变成了关乎企业生存的现实问题。最 近国内也发生了类似灾难,大连某个银行的生产中心突然着火,因为没有灾备系 统,造成全部业务停止两天,这还是不幸中的万幸,因为绝大多数机器设备经过 修复还可以使用,尤其是存储设备,否则,后果真是不堪设想。很多企业是从 911 事件后开始真正认真
10、考虑容灾的,以往容灾系统的建设往 往被视为锦上添花的项目而不是一个业务可持续性运行的必须项目。我们可以吸 取的教训是一定要建立核心数据和业务的容灾系统,并且平时要加强管理和演 习,加强人员的培训,核心管理人员和技术的分散,以提高计算机系统因为天灾 或人为因素等意外事故导致系统毁坏无法运行时的抵御能力,至少将局部地区核 心业务支持在系统故障时的损失减至最小。无论是国内还是国外的用户,无论是政府还是企业,现在都在思考这样一个 问题,那就是,假设我们的企业发生了类似的情况,我们是否有足够的备份措施, 企业的数据是否有足够的保障?在美国、日本等一些发达国家,对于关乎国计民 生的行业,有专门的法律要求该
11、企业必须有灾难保护方案,(如美国是 BCC 177) 并且每年都会进行审计和稽核。国内因为目前还没有类似的法律约束,很多企业 对于应用比较重视,但是对于整体系统的可用性考虑得不多,甚至是一些金融企 业,当有类似数据库出错等故障发生时,还依然只能通过倒磁带的方式恢复数据。 这种情况下,丢失数据就是不可避免的了,并且由于恢复时间的漫长,对广大客 户承诺的服务水平又如何能够达到?现在,随着中国加入 WTO,一些国内先进的 有前瞻性的企业也在这方面给予了足够的重视,如上海移动等单位。随着上海移动业务的飞速发展,业务对 IT 系统的依赖性也随之增加,越来 越多的业务集中到生产主机上,对主机和存储设备都造
12、成了较大的压力。当一个 单位越来越依赖于数据处理去进行它的业务行为时,数据处理的高可靠性和高可 用性就尤为关键,大部分单位的业务处理需要数据处理的高可用性。用户发现如 果没有了数据处理,业务的开展变得极端困难,也许手工操作还可以使用,但那 只能用于短期的应付,一个计算机系统的长期停止运转将直接导致明显的业务后 果,也许还会被追究管理责任。更为重要的是,一旦数据由于某种原因永久性丢 失,不但会给企业的运作带来极大的困难,企业的商业信誉必将受到致命的打击, 在竞争中处于劣势,造成不可估量的后果。基于这种考虑,中国移动总部提出了在各省建设 BOSS 系统容灾备份的要求, 这个报告书就是为上海移动的容
13、灾系统进行方案设计。本方案中将重点讨论 BOSS 系统的详细容灾方案,兼顾其他业务系统,同时根据上海移动的实际情况分步实现。当然,我们考虑容灾系统建设时,也应该实事求是,从实际出发。能够防御 所有灾难的方案是不存在的,也是不现实的。我们认为,计算机系统的灾难定义 是可以由用户自己来定义的,各个行业可以有不同的要求。设计容灾系统时,应 该基于一个合理的前提假设,譬如,在主机房发生故障时,备份机房可以保证数 据的完整性,并且可以在最短时间内完成应用、网络和数据的接管。本方案中的 容灾系统正是基于这种前提来设计,我们暂不考虑那种同时损坏主备机房的可能 性。让我们再来看看容灾系统建设的意义,这个在移动
14、总部的容灾系统建设规范 中也有多次强调:行业竞争的需要美国明尼苏达大学研究机构的统计结果表明,对于银行,金融,证券,电信等行业的企业而言,如果业务停顿时间长达两天或更长,那么 25% 的企业将立 刻因信誉和业务问题而倒闭,40% 的企业将因为受不断的后续因素的影响导致综 合竞争力的下降而在今后两至五年内被淘汰,五年以后仅有 7% 的企业能够继续 在此行业内生存。目前,在国内,通讯行业内的竞争本来就很激烈,加之 WTO 之后,国外实力 雄厚的企业对国内市场的窥视,将不可避免地造成企业争夺客户群的白热化的局 面,因此企业总体服务的水平将是影响竞争结果的重要因素。试想,一个时不时 就会抱歉地对客户说
15、:“对不起,由于我们的主机系统有问题,您要求的业务暂 时无法办理”的企业将无法赢得挑剔的客户的芳心。即使在发生众所周知的 灾害,如果系统也是长时间的无法恢复,也会带来极严重的后果。所以,IT 系 统的完善程度是激烈竞争的一个最重要的前提,在此基础上,企业才能开发丰富 多样的业务品种,提供高质量的服务水平,在竞争中取得优势。不久前发生在南 京的“爱立信跳槽事件”已经表明了中国加入 WTO 后行业竞争的残酷性和现实性。 根据业务的不同,对各种程度的中心系统可靠性要求也不同,如从最高等级 的XX服务,到在指定时间内恢复。为了满足这些要求,更好地为客 户服务,上海移动应当未雨绸缪,尽早制定和建立完备的
16、灾难恢复计划系统,以增强系统的抗灾能力,最大限度地减小损失。业务稳定的需要时至今日,企业业务运营对信息系统的运作的依赖性越大,就对信息系统运作的稳定性和可靠性的要求越高。 而信息系统可用的定义已不再局限于主机设备的可用,而是从主机,存储,用户终端,网络设备整体的物理可用,到系统,数据库,应用软件,用户数据的 逻辑可用。然而,由于各种因素的影响,小至一般性的硬件故障,大到区域性的自然灾 害,从物理的设备不可用,到逻辑的人为失误和破坏,都可能造成整个信息系统 的全面瘫痪,从而导致业务运营的停顿。因此,同一机房中的双主机恢复系统有 很多企业已经觉得不能满足需求,特别是因为应用的要求而作了区域集中或全
17、国大集中的企业,在享受数据集中带来的诸多好处时,同时也承担着数据丢失或者IT 系统不可用带来的巨大风险。从以下这份国外的研究报告中我们可以知道这 些担忧不是杞人忧天。这是 1996 年 Source ContingencyPlanning Research Inc。 对于各种因素包括自然灾害:水灾、风灾、地震、大雪、野火 结构破坏:电力中断、火灾、爆炸 操作问题:硬件问题、病毒入侵、操作失误、人为破坏。让我们暂时抛开满脑子的灾难,来考虑一下即使是机器没有发生故障是否也是 7小时可用呢?我们认为,现实环境中,这种情况也是不现实的,我们 经常会进行一些正常的日常维护活动。假设我们认为,所有灾难都是
18、属于非计划 中的系统不可用,那么还有很大一部分系统不可用时间是属于计划中的,从下图 中我们可以看到非计划宕机只是占了 IT 系统不可用的 10%,而计划中的宕机占了 90%。 如果我们有了容灾系统,起码我们可以将很多计划中的停机事件避免,如数据备份,完全可以在容灾中心进行,同时,我们可以利用容灾中心做许多诸如新 的应用程序测试,压力测试等等,若是结合第二份数据镜像功能,我们完全可以 轻松自如的在容灾中心进行数据查询,数据挖掘等业务。当然,这些业务在只有 一份远程镜像时也可以实现,只是需要较为仔细和复杂的操作,并且有可能暂时 中断镜像等,相比之下没有前者操作方便简单,对生产系统的冲突更小。Def
19、inition of OutagesMost Customer Outages are caused byData Base Backup andChange ControlPlannedOutages90.0%UnplannedOutages10.0%DBBackup52.0%Operations25.0%Software30.0%Other9.0%Application8.0%Hardware8.0%Software13.0%Network10.0%Hardware15.0%Other3.0%Application27.0% l a n n e d n p la n n e d 图:造成系
20、统不可用的因素企业管理的需要美国 911 恐怖袭击事件之后,华尔街上几乎所有的金融机构都未受到致命的影响,这都要归功于企业制定的业务持续性计划。企业管理标准要求,每个企业 应该具备一套保证企业在发生紧急事故时能够从容应对的管理计划,这就是业务 持续性计划。这套计划将使得客户能够在灾难时启动相关的备份设备,协调人员 流动,应对媒体访问,确保业务的正常运营。作为业务持续性计划的一部分,信息系统的灾难恢复计划的制定是非常重要 和关键的,它将直接决定企业业务应用的恢复时间,制定信息系统的容灾计划也 是对现有投资的保护。信息系统设备,软件的购买和应用是为了能更好的处理业 务,由此获得的客户满意和竞争实力
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 上海移动容灾系统方案设计报告 上海 移动 系统 方案设计 报告
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-4153113.html