IDP异地容灾方案模板 .doc
《IDP异地容灾方案模板 .doc》由会员分享,可在线阅读,更多相关《IDP异地容灾方案模板 .doc(52页珍藏版)》请在三一办公上搜索。
1、A公司异地容灾系统建设项目设计方案编 制 单 位:北京众志和达信息技术有限公司编 制 日 期:2010年04月目 录目 录I第一章 概述4第二章 企业灾备系统建设面临的问题52.1 企业容灾系统建设现状52.2 几类导致数据失效的原因以及现有容灾方式的不足62.3 设计灾难复制系统面临的问题7第三章 容灾方案设计分析93.1 容灾系统策略类型说明93.2 几种数据容灾技术方案比较103.2.1 远程容灾技术介绍103.2.1.1 远程数据库复制技术103.2.1.2 基于逻辑磁盘卷的远程容灾技术123.2.1.3 基于智能存储的远程容灾技术133.2.1.4 基于智能虚拟磁带库(VTL)间的远
2、程容灾复制技术133.2.1.5 基于智能系统的持续数据保护和远程容灾复制技术153.2.2 各种技术的优势与劣势比较分析163.2.2.1 远程数据库复制技术优劣势分析163.2.2.2 基于逻辑磁盘卷的远程容灾技术优劣势分析173.2.2.3 基于智能存储的远程容灾技术优劣势分析173.2.2.4 基于智能虚拟磁带库(VTL)间的远程复制技术优劣势分析183.2.2.5 基于智能系统的持续数据保护和远程容灾复制技术优劣势分析19第四章 A公司容灾系统建设规划204.1 容灾设计综述204.2 用户需求分析204.3 数据容灾设计目标和初步方法214.4 应用容灾设计目标和初步方法224.5
3、 容灾流程设计224.6 本项目中需要注意的几个要点234.7 系统设计原则254.8 推荐解决方案原理示意图264.9 推荐解决方案原理说明274.9.1 “一键式”裸机恢复原理说明284.9.1.1 对核心业务服务器的系统保护284.9.1.2 对个人电脑的系统保护294.9.1.3 系统的远程恢复294.9.2 真正的CDP实现“任意时间点”恢复RPO接近于0304.9.3 异地CDP复制和应用级DR,RTO和RPO都接近业界极限314.9.3.1 远程CDP复制保护314.9.3.2 远程故障切换334.9.4 远程接管服务器虚拟化方案说明334.9.5 虚拟磁带库工作原理说明334.
4、9.6 带宽管理及容灾智能评估系统原理说明34第五章 灾备系统管理355.1 建立灾备的专门机构或工作小组355.2 定期检查灾备数据复制情况355.3 定期检查生产中心备份情况365.4 数据恢复管理365.5 数据恢复的周期性演练制度37第六章 项目售后服务体系396.1 总体目标396.2 运行维护计划396.2.1 运行维护队伍396.2.2 运行维护内容406.2.2.1 存储系统维护406.2.2.1.1 例行检查服务406.2.2.1.2 系统运行维护服务406.2.2.2 备份系统维护416.2.2.2.1 监测服务416.2.2.2.2 数据库备份和恢复416.2.2.2.3
5、 性能调整416.2.2.2.4 故障排除416.2.2.3 其他服务内容416.2.3 运行维护制度建设416.3 服务保障计划426.3.1 项目实施阶段426.3.1.1 服务方式426.3.1.2 责任和承诺426.3.2 免费维护阶段436.3.2.1 服务方式436.3.2.2 责任及承诺446.3.2.3 服务内容446.3.3 收费服务阶段456.3.3.1 可选择的服务方式456.3.3.2 可选择的服务内容456.4 故障响应计划466.4.1 技术支持服务流程466.4.1.1 设备维修与更换处理流程476.4.1.2 系统故障报告与预防处理流程486.4.1.3 突发事
6、件处理流程496.4.1.4 突发事件处理流程496.4.1.5 定期进行预防性系统维护506.4.1.6 软件版本升级与增强506.4.2 客户服务响应方式516.4.2.1 电话、传真和网络516.4.2.2 现场响应服务516.4.2.3 定期巡检516.4.2.4 技术业务咨询与培训516.4.2.5 网站服务516.4.2.6 客户服务中心526.4.3 维护响应计划526.4.3.1 故障级别526.4.3.2 响应时间52第一章 概述随着企业信息化建设的不断完善,人们对信息的依赖性也就越来越强,目前企业数据都向着集中存储、集中管理方向发展,而大集中带来优化管理的同时也意味着数据的
7、风险在集中,又让我们无法回避另一个话题灾难备份。追述2001年震惊世界的“9.11”事件,随着纽约世贸大厦的轰然倒塌,使1000多家公司蒙受毁灭性打击,造成的直接经济损失超过1000亿美元。在1000多家公司中,凡是做了异地备份的,当天就在其他地方恢复办公,没有做备份的,有的当时就消失了,有的逐渐倒闭和消亡。统计表明,至少有一半以上的没做备份的公司经过这场灾难后完全跨掉了。与此同时,世界金融界也创造了两个奇迹,这就是位于世贸大厦第25层的摩根斯坦利(Morgan Stanley)银行,尽管其一层楼面都被花为灰烬,但它却在第二天神话般地宣布全线营业,追其原因是因为该银行在离纽约数英里的新泽西州的
8、蒂内克建立了一个完善的“灾难备份中心”,凭借着该中心的完整无缺的数据挽救了摩根斯坦利银行的生命。作为灾难备份系统的另一成功案例是德意志银行,尽管9.11恐怖袭击摧毁了德意志银行设在纽约世贸大厦的办公中心,这家德国银行业巨擎顿时失去了与世界金融市场的业务联系,不过几乎与此同时,它远在爱尔兰的备份系统立即启用,德意志银行就在当天继续完成了超过3000亿美元的巨额交易。上述两个案例都雄辩地说明了“灾难备份系统”所发挥的巨大威力。人类无法避免天灾人祸,而当信息系统日益成为国家的重要基础设施时,任何天灾人祸对信息系统的破坏都有可能影响到国家安全、人民利益、社会稳定,关系到每一个老百姓的切实生活。第二章
9、企业灾备系统建设面临的问题2.1 企业容灾系统建设现状由于容灾体系建设是一个复杂的系统工程,涉及到网络、主机、存储、数据库、数据备份、应用系统、运维管理、灾难恢复和业务连续性等诸多业务和技术的方方面面。特别是与A公司核心业务应用系统的架构设计、数据库系统的结构设计、应用结构设计以及业务系统容灾系统维护管理人员的技术素质有极大的相关性。目前,各企业及政府部门在容灾系统建设方面均刚刚起步,缺乏建设和维护经验,特别是在容灾系统运行管理和灾难恢复方面的经验更加欠缺,业务系统更是如此。另外,业务系统的容灾体系建设又有其特殊性。第一,由于业务核心业务处理均集中在公司总部的数据中心。所以,数据中心将面对公司
10、总部和各地分公司数据中心的多个系统进行灾备,形成“一备多(多点、多系统)”的格局,容灾的复杂度高,难度大。第二,硬件平台的非统一性。由于目前各省主机、存储设备的异构性,特别是今后主机、存储平台进行招标采购的不确定性,难以保证主机、存储平台的同构。这大大增加了容灾技术方案制定、实施以及运维管理的难度和复杂度。第三,A公司核心业务应用系统的业务整合程度、系统整体架构、数据库设计、子系统数量等均不可知。因而,容灾系统设计的不确定因素诸多。第四,由于容灾系统建设尚处开始阶段,系统内严重缺乏有较深造诣的数据库管理、数据备份技术、远程数据备份管理软件和主机、存储方面的技术力量,这将使得容灾系统的建设、系统
11、实施、运维管理和灾难恢复等诸方面工作难度加大。2.2 几类导致数据失效的原因以及现有容灾方式的不足(1) 计算机系统的故障分类以及故障发生的概率分析 A类:计算机软硬件故障 发生概率:对于企业,发生可能性最大,也最频繁,是经常发生的一类故障; 预防方法:本地双机热备,实现系统冗余,增强业务系统的高可用性。 B类:人为操作故障 发生概率:对管理较严、人员素质较高,偶尔发生;对管理较松、人员培训不足,会经常发生; 预防方法:提高系统自动化运行管理水平,做好本地数据冷备份,减少人的操作与干预,或制定严格的管理规范,避免误操作。 C类:资源不足引起的计划性停机 发生概率:对于企业,随着业务的快速增长,
12、平均每年均会发生如软、硬件升级、系统资源扩充等事件,业务增长越快的企业,发生亦越频繁; 预防方法:本地双机,系统冗余。 D类:客户端的灾难 发生概率:对于企业,发生概率较大; 预防方法:灾难恢复中心。E类:病毒的入侵 发生概率:对于中、大型企事业单位,没有统一的杀毒软件和病毒服务器,发生概率较大; 预防方法:安装网络版防病毒软件,定时升级,加强管理(2)现有备份方式的不足 几年前我们主要采用主机内置或外置的磁带机对数据进行冷备份或者没有备份系统,这种方式在数据量不大,操作系统种类单一,服务器数量有限的情况下,不失为一种既经济又简明的备份手段。但随着计算机规模的扩大,数据量几何级的增长以及分布式
13、网络环境的兴起,企业将越来越多的业务分布在不同的机器、不同的操作平台上,这种单机的人工冷备份甚至是无备份的方式越来越不适应当今分布式网络环境,存在以下种种弊端: 1.数据管理工作难以形成制度化,数据丢失现象难以避免; 2.数据分散在不同的机器、不同的应用上,管理分散,安全性得不到保障; 3.难以实现数据库数据的高效在线备份; 4.运行着的系统使得维护人员寸步难离,业务人员工作效率下降; 5.存储媒体管理困难,如今,用来存储数据的介质越来越多,各种不同系统下存储产生的软盘、磁带、光盘将给管理带来很大的困难; 6.历史数据保留比较困难; 7.来自非计算机系统因素的隐患,如火灾、地震等灾难后的系统重
14、建和业务数据运作。 2.3 设计灾难复制系统面临的问题用户在选取远程数据保护系统时,主要需要面对的问题有:l 是否支持异构存储系统,保护投资,大大降低其成本l 是否受距离的限制l 是否受带宽限制,节约带宽的方案显然非常受欢迎l 是否需要对原有系统进行比较大的改动l 恢复时间如何l 管理是否方便l 是否与当前存储网络的体系方便集成由于对网络安全的考虑是随着数据的重要性和数据量而不断发展的,因此用户可能保留有多种品牌、多种档次的磁盘存储介质,因此能够在容灾系统中能够使用它们,对企业在构造容灾系统时节约成本非常有帮助;而且,由于容灾数据中心的使用率非常低,因此如果能够在容灾数据中心采用较低档次的存储
15、备份系统,也能够大大降低其成本。容灾方案如果能够克服距离的限制,就能够比较好地帮助很多企业选择分支机构作为容灾数据中心,减少建设新的容灾中心的成本;主数据中心和容灾数据中心之间的数据传输带宽,往往占整个方案中一个非常大的比例,因此,节约带宽的方案显然非常受欢迎;当原始数据中心的数据出现一些问题时,从容灾数据中心恢复数据的速度,是考量容灾方案中一个非常重要的部分;管理容灾方案的可操作性和简便性,是容灾方案成功的一个关键,因为真正出现灾害情形时,复杂和难于执行的方案,会大大增加系统恢复的所需时间;新的容灾方案是否能够与现存的网络体系非常吻合,非常容易地进行集成而不影响现有系统的工作,是用户需要仔细
16、考量的一个重要环节,很多重要的系统具有连续运行的高可靠性,系统维护时间非常少。第三章 容灾方案设计分析3.1 容灾系统策略类型说明根据容灾系统的原始数据中心和容灾数据中心复制的数据之间时间长短的差异,我们可以将容灾系统分成以下几种:同步系统准同步系统异步系统时间点系统同步系统:将每一个写盘指令同时发送到主从存储系统,并在得到两个存储系统的应答后,才进行下一次的写盘操作;所以同步系统的优点就是主从存储系统的数据在灾难发生的时刻,是完全一样的。为了保证整个存储系统的高效率,因此一般来说,要求主节点和从节点采用相同档次的高速磁盘系统,并且是高速连接,从而距离会有严格的限制;准同步系统:将每一个写盘指
17、令同时发送到主从存储系统,只需要主节点的应答后,就进行下一次的写盘操作,但是间隔一定次数写操作后,需要从存储系统的应答;准同步系统由于加大了从存储系统的应答间隔,所以从技术上可以使容灾数据中心与主数据中心的距离能够进一步扩大,减少大型灾难发生时整个系统数据完全失效的可能性,同时增大了建立容灾数据中心可以选择的范围;异步系统:将每一个写盘指令同时发送到主从存储系统,只需要主存储系统的应答后,就进行下一次的写盘操作,从存储系统不需要应答;异步系统与同步系统相比较,由于不需要从存储系统的应答,因此技术上可以使容灾数据中心与主数据中心的距离能够大大增加;其带来的问题是,灾难发生时可能造成的数据丢失的时
18、间间隔也更大,丢失的事务数也更多;总之,不管是同步系统还是异步系统,由于是将写磁盘的数据完全发送到从存储系统,所以需要传送的数据量仍然非常大,对传输的带宽要求很高。时间点系统:是定期将主存储或备份系统的映像复制到各地市分公司存储(备份)系统,根据实际的情况,时间点之间的间隔可以从数秒钟到数小时不等。由于时间点的间隔选择可以调整,因此,传输的数据量也可以随着间隔的变化而变化,以适应不同的带宽条件。同样,时间点系统支持的传输距离也因此能够大大增加。比较起来它是四种系统中,灾难发生时可能丢失的事务数是最大的。一般会丢失12个小时的数据。所以,这四个不同的容灾系统,以同步系统数据最精确和全面,以时间点
19、系统的数据差异为最大。但是,同步系统支持的主从存储系统间的距离最小,带宽要求最高;时间点系统支持的主从存储系统间的距离最大,带宽要求最灵活。通常,用户需要根据自己的情况,选择某一种系统。不能在一个系统中,同时拥有多种系统的技术特点。3.2 几种数据容灾技术方案比较为防范由于自然、人为等因素所引发的灾难而导致信息系统严重故障或系统瘫痪的风险, A公司将建设核心生产业务应用系统的容灾体系,以保证灾难发生时,核心生产业务应用系统能够不间断运行。容灾体系建设的成功与否首先取决于容灾系统建设关键技术路线的选择。因此,一条正确的容灾系统建设关键技术路线是容灾体系建设的基础。关键技术路线的确定涉及多方面的因
20、素,既要考虑备份技术本身的科学性、成熟性和先进性,同时又要结合业务系统的实际情况考虑它的可行性、可靠性和实用性,二者不可偏废。只有这样才能确保容灾体系建设的成功。3.2.1 远程容灾技术介绍3.2.1.1 远程数据库复制技术远程数据库复制技术是由数据库重做日志(RedoLogs)来实现数据库的远程复制和同步。即:将生产数据库产生的归档日志实时传输到灾备端,利用日志向备份数据库追加数据,保持备份数据与生产数据同步。在复制过程中,使用自动冲突检测和解决的手段保证数据一致性不受破坏。基于数据库的复制方式可分为实时复制、定时复制和存储转发复制。主流产品有DataGuard、GoldenGate、Sha
21、rePlex等,其中DataGuard是传输日志到灾备端,然后在灾备端通过数据库前滚进行恢复,网络上传输的是归档日志,而以GoldenGate、SharePlex为代表的备份软件是在生产端解析日志,通过网络把解析出的SQL语句传输到灾备端执行,相比之下备份软件更加节省带宽,操作更为灵活。1.实时复制:当生产中心的数据库内容被修改时,容灾中心的数据库内容实时地被修改,此种复制方式对网络可靠性要求高。2.定时复制:当生产中心的数据库内容被修改时,容灾中心的数据库内容会按照时间间隔,周期性地按照生产中心的更新情况进行刷新,时间间隔可长(几天或几个月)可短(几分钟或几秒钟)。3.存储转发复制:当生产中
22、心的数据库内容被修改时,生产中心的数据库服务器会先将修改操作Log存储于本地,待时机成熟再转发给容灾中心。远程数据库复制的实质是实现主、备用系统的数据库的数据同步(实时或者准实时同步)。即是将主用系统数据库操作Log实时或周期性地复制到备用系统数据库中执行,实现二者数据的一致性。远程数据库复制对主机的性能有一定影响,可能增加对磁盘存储容量的需求(包括对Log的存储)。为远程数据库复制逻辑结构(举例)示意。图1:远程数据库复制示意图远程数据库复制需要主机同构,存储可异构,数据库、操作系统其中ORACLE DATA GUARD要求数据库和操作系统同构,而以Golden Gate、SharePlex
23、为代表的备份软件支持操作系统异构,中间件版本必须同构。3.2.1.2 基于逻辑磁盘卷的远程容灾技术将物理存储设备划分为一个或者多个逻辑磁盘卷(Volume),便于数据的存储规划和管理。逻辑磁盘卷可以理解为在物理存储设备和操作系统之间增加一个逻辑存储管理层。基于逻辑磁盘卷的远程容灾是指根据需要将一个或者多个卷进行远程同步(或者异步)复制。该方案的实现通常通过软件来实现,基本配置包括卷管理软件和远程复制控制管理软件。远程复制控制管理软件将主用节点系统的卷上每次I/O的操作数据实时(或者准实时、或者延时)复制到远程节点的相应卷上,从而实现远程两个卷之间的数据同步(或准同步)。主、备节点之间通常需要配
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- IDP异地容灾方案模板 IDP 异地 方案 模板

链接地址:https://www.31ppt.com/p-4241134.html