两地三中心容灾解决方案.doc
《两地三中心容灾解决方案.doc》由会员分享,可在线阅读,更多相关《两地三中心容灾解决方案.doc(18页珍藏版)》请在三一办公上搜索。
1、两地三中心容灾解决方案2010-12-26目 录1“两地三中心”容灾系统建设的功能目标32两地三中心”容灾系统技术方案42.1总体设计方案42.2容灾方案实现52.2.1同城应用级容灾方案52.2.2异地数据级灾备方案63基于SHAREPLEX的容灾方案73.1SharePlex for Oracle产品介绍73.2Shareplex主要技术指标84成功案例104.1银联数据104.2山西移动124.3北京地税154.4SharePlex国内部分客户181 “两地三中心”容灾系统建设的功能目标理想目标:在确保系统稳定安全的前提下,颠覆“切换时长、数据丢失,平时不用、浪费投资,决策困难、影响巨大
2、,演练复杂、风险增加”的传统“灾备”模式,创建全新“容灾”理念,使新增投资平时发挥生产效力、实现容纳各种灾难、确保业务连续和数据安全的崭新模式。同城应用级容灾:覆盖能被客户直接感知的各类业务,平时与主机房同时运行,负载均衡使用,可分担各查询业务流量。当容灾机房或主机房任何一处出现灾难造成的非计划内停机,则另一个机房都能在保证不丢失数据的前提下,继续对外提供同样的服务,对业务或对客户的感觉影响极低。异地容灾;异地容灾机房,存放一台存储设备和一台核心业务验证服务器,异步存储数据,容许0-15分钟数据丢失。发生城市级灾难时仍可以有效恢复生产系统核心数据和,。最终实际目标:以系统稳定、安全、高效为基本
3、前提,经严格论证和实测,可以逐步退守,直至实现一定投资下“高可用性和高安全性”的平衡。容灾系统将能够应对下述的灾难和风险,确保数据安全性和业务连续性:2 两地三中心”容灾系统技术方案2.1 总体设计方案生产系统的容灾系统拟建成“两地三中心“模式。同城双中心是指在同城或邻近城市建立两个可独立承担关键系统运行的数据中心,双中心具备基本等同的业务处理能力并通过高速链路实时同步数据,日常情况下可同时分担业务及管理系统的运行,并可切换运行;灾难情况下可在基本不丢失数据的情况下进行灾备应急切换,保持业务连续运行。同城应用级容灾的主要目标为业务连续性,同城双中心需要数据实时同步或准同步,RPO=0,同城范围
4、有效保证了数据的安全性和业务连续性; 异地灾备中心是指在异地的城市建立一个备份的灾备中心,用于双中心的数据备份,当双中心出现自然灾害等原因而发生故障时,异地灾备中心可以用备份数据进行业务的恢复。异地灾备系统的主要目标为数据安全性,复制距离较远,容灾距离:一般200公里以上。主要应对地区级数据风险。本方案中计划在海口建立异地的数据备份中心。在异地复制方案中,一般采用异步复制技术,需要尽可能降低数据丢失机率;带宽要求低,减少维护性成本; l 数据库同步方案在本方案中,建议使用SharePlex for Oracle 软件来实现生产系统数据库到同城灾备中心和异地灾备中心的数据准实时同步。l 非结构化
5、数据同步方案对于目前生产系统中的非结构化数据,同城的灾备中心可使用同时上传的方式,即应用程序每次将文件上传时,要求必须同时上传到生产中心和同城的灾备中心,以保证应用切换后,所有非结构化数据均可在同城容灾中心访问。异地的灾备中心,因仅需要实现数据的异地备份功能,则可以考虑使用脚本定期将生产系统产生的非结构化数据传输到异地灾备中心的方式实现,文件的更新频率可根据生产系统业务量,以及容灾需求来确定,本方案中建议每30分钟同步一次增量的文件。同步方式可使用FTP脚本或其他第三方文件同步工具实现。2.2 容灾方案实现2.2.1 同城应用级容灾方案由于目前生产系统才用的均为C/S结构的应用,因此,本方案中
6、,同城的应用接管建议使用网络层面的切换来实现。当生产中心数据库主机出现系统级故障,暂时不可用时,可使用网络设备,通过地址或域名解析的方式,将所有终端客户重新指引到同城的灾备中心数据库服务器,实现业务的全面接管。l 切换决策本方案中建议采用专用的负载均衡设备来实现地址或主机域名的切换,该设备通常可自动检测数据库是否可用等状态,并可实现自动的切换,但本方案中,考虑到整个系统的安全性和稳定性,建议最终的切换决策必须手工确认,如使用网络设备自动实现,则可能在某些特殊的情况下增加以外的切换风险 l 正向接管和反向回切,在出现问题后,SharePlex解决方案可以进行应用接管,而当原系统恢复正常时,可以将
7、接管期间的增量数据反向同步回去,平滑地实现接管和反向回切。l 切换步骤及时间本方案中的应用接管将主要包括网络切换和数据库的切换步骤,网络切换可有硬件设备自动完成,数据库切换则需要在切换前确认容灾数据库的运行状态,并执行一些相关的切换脚本,所有步骤均可在方案部署时统一编写脚本,确保整个切换步骤简单、迅速。根据现有生产系统的实际情况,切换时间可控制在分钟以内l 终端用户影响生产系统现有的用户主要通过C/S方式访问系统,因此,在生产系统数据库出现故障时所有用户会出现数据库连接中断的错误,当灾备数据库实现接管后,仅需要重新连接数据库服务器即可继续使用,不需要任何额外的切换或操作步骤。2.2.2 异地数
8、据级灾备方案生产系统异地灾备系统的设计目标是发生城市级灾难时仍可以有效恢复数据和柜面行内业务,即实现数据安全保护和核心业务的业务连续性,提供可恢复能力。l 数据保护能力建立异地灾备系统最重要的目标是保障核心业务系统的数据安全,规避数据风险,保障数据在任何情况下万无一失。通过SharePlex进行数据复制,目标系统是一个打开的“看得见,摸得着”数据库,不会出现基于硬件方式复制在极端情况下无法打开数据库的风险,可以最大程度地保障宝贵数据的安全性。l 网络带宽使用带宽使用较少不仅可以减少电信网络的租用费用,还可以满意日后数据增长的扩展性需求。通过SharePlex进行数据复制,对带宽使用只有日志文件
9、1/3的内容,而且平均分布到所有时间点,可以极大地节省带宽租用的成本,不仅可以满足现有的需求,还可以满意日后数据增长的扩展性需求。l 复制延迟数据延迟关系到灾难发生时的数据丢失多少,对于异地灾备来说,任何复制技术必然会数据延迟和数据损失,数据损失越少越好。SharePlex解决方案随时解析联机日志,存储到自己的队列并传输到目标系统,然后加载到数据库中,这个过程的延迟非常小。3 基于SharePlex的容灾方案3.1 SharePlex for Oracle产品介绍下图所示为SharePlex for Oracle的基本结构:数据捕获SharePlex for Oracle由捕获进程来收集发生变
10、化的数据,捕获进程驻留在源系统上,自动读取Oracle的在线日志文件。这种读操作是从操作系统的角度来完成的,而不是通过数据库。通过将日志文件作为获取变化信息的源泉,Quest可以完成数据的复制而不会给生产系统带来额外的开销。由于Oracle将所有的事物变化记录到日志中并使用日志文件进行系统恢复,因此Shareplex for Oracle可以通过解析日志文件保障数据的一致性。捕获进程连续监控日志文件用以捕捉变化信息。当日志文件中出现一条新记录时,SharePlex判断其是否属于被复制对象,如果是,则SharePlex为该条记录加入用于决定此记录将被发向那个主机的地址信息并将包含地址信息的记录存
11、放到自己的队列中,存储队列存在于数据库之外。发生改变的数据被立即处理并被发送到目标系统中而不等待提交或回滚动作的完成,因为等待提交或回滚完成将带来延迟。当提交或回滚信息被写入日志文件时,它们也将被发送到目标系统中,从而在目标系统中完成相对应的操作。捕获进程具有如下特点:l 捕获进程从Oracle 日志文件中读取信息,因此复制过程不会给生产数据库实例带来性能问题;l 只有发生改变的数据被传输,而不是日志文件中的全部信息,因此SharePlex的网络负载非常小;l 尽管需要在Oracle数据库中安装少量的对象用来存储有关复制的一些基本信息,但源数据库不需要参与到数据捕获和传输过程中;SharePl
12、ex的捕获进程不但可以读取在线的日志文件,而且可以读取归档日志,甚至当归档日志文件被移动到其它设备上时,SharePlex会发出提示信息。正是这种能力极大地增强了系统的冗余功能。例如,如果捕获进程由于某种原因被停止,当它重新启动后数据同步不会受到影响;数据传输SharePlex for Oracle在基于TCP/IP协议的网络环境完成源和目标系统之间的数据传输。其相关的进程确保数据的正确接收和网络数据包的正确顺序,从而提供网络传输冗余,确保数据的完整。整个数据传输过程无需其它的中间件。应用数据应用进程将传送到目标系统中的信息转化为SQL语句,然后发送给Oracle执行。SharePlex能够实
13、现精确复制的一个重要原因就是其能保证从源数据库到目标数据库的Oracle读一致性,不但按顺序复制事务,而且也复制上下文信息,将源数据库中发生变化的全部事务信息都复制到目标数据库中。3.2 Shareplex主要技术指标Shareplex产品的主要技术指标见下表:指标描述技术原理读取Oracle的日志文件,获取数据的变化信息,传输到目标系统,然后解析成SQL语句,在目标系统中执行复制的基本单位复制的基本单位为表,也可以选定表的行或列进行复制,支持的复制内容见Shareplex的Release Notes。支持的复制模式单向,双向,一对多,多对一,级联复制对DML的支持支持所有DML操作对DDL的
14、支持支持大部分的DDL操作,提供灵活的配置选项,可以设置复制或者不复制相关的DDL操作。对集群和RAC的支持支持各种集群,支持RAC目标系统支持的操作目标系统支持Read-Write操作对系统性能的影响对主系统CPU占用率5%。数据延迟和事物处理的类型、事物量、机器性能、优化配置有关,对于每天日志量40G以内的OLTP系统来说,一般延迟在60s以内。网络资源的使用和复制表的数量有关,传输量最多为日志文件的1/3最大距离没有限制对异构环境的支持支持不同的存储、主机、操作系统、Oracle数据库的不同版本4 成功案例SharePlex for Oracle产品面世已经有十年时间,目前在全球范围内有
15、1000家以上的成功案例,其中中国大陆地区有70家。 4.1 银联数据银联数据服务有限公司是中国银联股份有限公司(简称“中国银联”)的子公司, 公司成立六年来,以银行卡发卡数据处理外包服务为突破口,秉承“市场第一、客户第一、服务第一”的企业理念,积极进取,勇于开拓,赢得了广大客户的信任和尊重,在国内发卡数据处理外包服务市场处于绝对领先地位。截止2009年6月30日,公司已经与兴业银行、民生银行、华夏银行、中国邮政储蓄银行、花旗银行、东亚银行等境内外66家机构签署发卡外包服务合同,其中58家机构已经在银联数据发卡系统上发卡运营,卡量累计1700万张。 公司主要业务包括:l 贷记卡业务:银联数据为
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 两地 中心 解决方案

链接地址:https://www.31ppt.com/p-4037489.html