灾备技术的现在和未来(1).ppt
灾备技术的现在和未来,姚文斌 灾备技术国家工程实验室 北京邮电大学,National Engineering Laboratory for Disaster Backup and Recovery,Beijing University of Posts and Telecommunications(NEL-DBR),主要内容,引言,灾备技术的现在,灾备技术的未来,灾备技术国家工程实验室,引言,为什么需要灾备?,什么是灾备?,信息系统灾难案例 信息系统灾难原因 信息系统灾难后果,需要灾备,需要灾备,911事件发生中,世贸中心1200家企业的信息化系统(其中不乏摩根士丹利这样的巨型跨国公司的信息中心)全部损毁,本地数据全部丢失。,-案例1,2002年7月23日,北京首都国际机场离港系统出现故障停机1小时,60个航班和约6000名旅客被延迟。,需要灾备,-案例2,2003年7月1日,上海市轨道交通4号线凌晨发生险情,临江花苑大厦内的劳动保障局和市财税局的重要信息系统被迫中断和搬迁。,需要灾备,-案例3,2008年11月8日,北京火车站售票系统死机瘫痪,不得已采用手写无座票的售票方式进行应急处理,直到5小时后系统才修复。,需要灾备,-案例4,需要灾备,信息系统灾难就在我们身边 并非遥不可及!,自然灾难-天灾-人祸,-原因1,-自然灾难会造成灾难区域被完全孤立隔离、信息设备损毁严重、人员伤亡严重。-自然灾难所产生的直接后果就是本地数据信息难以获取或保全、本地系统难以在短时间内恢复或重建、灾难对信息系统的影响和范围难以控制。-自然灾难虽然很可怕,但是据统计仅占灾难3%。,需要灾备,人为灾难偶然故障(人为失误、非授权操作等)Byzantine故障(恶意操作、病毒入侵等),-原因2,需要灾备,人为灾难发生机率大、危害具有潜伏性和突变性、表现形式多种多样人为灾难造成的直接后果包括丢失或泄漏重要数据信息、性能降低乃至丧失系统服务功能、软件系统崩溃或者硬件设备损坏人为灾难中偶然故障约占32%,Byzantine故障约占7%,技术灾难设备故障(硬件损坏、电力中断等)设计故障(软/硬件设计故障等),-原因3,需要灾备,-设备灾难主要是以硬件器件的损伤为典型特征;设计故障则主要来自人为的考虑不周或逻辑错误,设计错误是其典型特征,采用相异性的冗余设计方法才有可能从根本上解决这类问题。-技术灾难会造成信息、数据的损害或丢失。-这一类故障数量占到灾难中的58%。,-原因,需要灾备,客观原因天灾无法控制人祸不可避免信息系统存在生存期主观原因信息系统技术本身存在缺陷信息系统缺乏灾难防护能力,需要灾备,信息系统周围潜伏了无数的灾难,随时会损坏甚至摧毁信息系统!,信息系统灾难就在我们身边 并非遥不可及!,-后果,需要灾备,需要灾备,信息系统一旦被灾难毁坏,会对人民生活、国家政治和国家经济造成无法估计的影响!,信息系统周围潜伏了无数的灾难,随时会损坏甚至摧毁信息系统!,信息系统灾难就在我们身边 并非遥不可及!,灾备的基本概念 信息系统与灾备 灾备的性能指标 灾备的体系结构,灾备,灾难备份,简称灾备,就是指利用技术、管理手段以及相关资源确保关键数据、关键数据处理系统和关键业务在灾难发生后可以恢复的过程灾备的目的就是确保关键业务持续运行以及减少非计划宕机时间,灾备,-概念,灾备狭义灾备:包括灾难备份系统(存储领域)广义灾备:包括灾难备份和灾难恢复两层含义容灾与广义灾备等价(涵盖了容错领域、存储领域 和信息安全领域),灾备,-概念,广义灾备 从严格意义上说,灾备应该称为灾难备份与恢复(disaster backup and recovery)灾难前的备份 不仅仅是数据信息的备份和日志,更重要的还包括信息系统 构建过程中容灾体系结构的设计、提前制定的灾难应急预案 与恢复计划等灾难后的恢复 应急服务系统或者备份系统的业务接管、数据/系统/服务迁移过程中的安全管理、系统灾难损失评估等,灾备,-概念,信息系统的核心结构图,灾备,-信息系统与灾备,灾难备份与恢复是信息化社会 一个不可缺少的基础安全设施。,灾难备份与恢复是信息系统的 基本要求。,灾备,-信息系统与灾备,恢复时间目标RTO(Recovery Time Object)恢复点目标RPO(Recovery Point Object)降级操作目标DOO(Degraded Operations Object)网络恢复目标NRO(Network Recovery Object),该指标是容灾恢复的时间指标:-其含义从广义上来说,是从灾难发生造成业务中断,直到使业务能够得以继续所需要的时间。-通常RTO越短意味着容灾能力越高。,恢复点:宕机后数据开始恢复的时间点。恢复点指标RPO:指当灾难发生后,系统和数据必须 恢复到的时间点要求。RPO 对应着灾难造成的数据丢失。-如果RPO=0,相当于没有任何数据丢失-否则,就需要进行业务回复处理,修复数据丢失,宕机恢复后到第二次故障或灾难的时间,网络恢复的时间,灾备,-性能指标,灾备系统结构简图,灾备,-体系结构,在信息领域,灾备系统可以理解为是以存储系统作为基本支撑系统、以网络作为基本传输手段、以容错软硬件技术为直接技术手段、以管理技术为重要辅助手段的综合系统。,灾备技术的历史,灾备技术的衍生,灾备技术的提出,灾备技术的发展,灾备技术的历史,灾备技术从容错计算中衍生,-衍生,容错计算 容灾是容错计算中专门专注于对灾难事件处理的相关技术,是容错计算中一个重要的研究方向。到目前为止,容灾所用到的相关技术让然没有脱离开容错的基本技术和方法 容灾技术就是目前耳熟能详的广义灾备技术。,容错计算 容错是指在存在故障的情况下,计算机系统不失效,仍然能够提供系统服务的特性容错技术在计算机系统中的应用可以追溯到第一台计算机系统ENIAC 由于ENIAC采用了18800个真空管,而受工艺限制、硬件的故障率是平均每15分钟就会烧掉一个真空管,因此,该系统中大量的采用了基于冗余的容错技术来保证系统的可用性因此,如果没有容错技术,也就不会有了第一台成功的现代的电子计算机国际上一直对容错计算比较重视:容错专委也是IEEE和ACM协会中具有最老资格专业技术委员会之一,灾备技术的历史,-衍生,灾备技术的历史,-衍生,容错技术是提高系统可靠性的有效手段,通过自动监测、自动甄别-隔离-排除等技术手段,保证系统完成预期的目标。一般来说,整个过程不需要用户干预,对用户透明除功能子系统外,容错系统通常还包括故障检测子系统备份子系统系统恢复与重构子系统,灾备技术的历史,-衍生,计算机系统故障分类,灾备技术的历史,-衍生,容错计算-技术实质,高可信应用需求航空、航天、核电站等关键应用系统银行、证券等其他关键系统包括制造、物流、交通等有着“7天24小时”不间断运营需求的中小商业团体和政府,容错计算系统多用于系统可靠度达到99.999%以上的应用环境中即连续工作一年中系统故障时间为5分钟,灾备技术的历史,-提出,灾难备份在上世纪50年代作为容错中的一种技术手段被提出但是直到70年代,灾备才作为独立的研究方向得到发展,其契机是美国建立联邦应急管理总署。该机构明确提出了建立灾难指挥系统,提出了信息系统的灾难安全保障。1979年,SunGuard公司建立了世界上第一个灾备中心,从而开创了专业从事信息系统灾备的产业,灾备技术的历史,-发展,最初,灾备集中在企业信息化方面,专注于数据备份和系统备份随后,随着信息系统规模扩大,提出了灾难恢复计划(DRP),即在灾备中加入了灾难恢复预案、资源需求和灾备中心管理,形成了生产中心的保障概念之后,把灾难恢复从专注于系统转向了业务的角度,提出了用业务衡量灾备目标,灾备技术的历史,-发展,除了信息化系统外,还增加了信息化辅助与决策的支持“911”事件后,灾备又将引入了管理方面的支持,包括紧急事件响应危机公关和供应链危机管理等集中在企业信息化方面,专注于数据备份和系统备份,业务影响分析 业务恢复预案,策略制定 人员架构,通信保障 第三方合作机构,灾备技术的现在,政策引导,市场情况,技术现状,灾备技术的现在,发达国家70%公司开始启动容灾机制,-政策引导,国外美国发布了强化金融容灾能力白皮书限定了容灾能力到位的时间表美国政府制定了COOP计划确定政府容灾能力下限保护重要信息资产:启动恢复小于12小时,维持能力大于30天其他国家重新评估银行容灾能力,提出监管要求英国的FSA、德国的HKMA、新加坡的MAS,灾备技术的现在,-政策引导,国内,我国政府高度重视灾备恢复工作,灾备技术的现在,-政策引导,国内,灾备技术的现在,-市场,国际上:到2009年,全球IT外包规模会达到2103亿美元,其中,数据外包的市场规模将达991亿美元国际灾备市场一直保持着15%左右的年增长率,灾难备份中心服务年平均增长幅度约30%据赛迪市场调查结果,2005年中国灾备市场规模仅仅约31.9亿元,2007年灾备市场规模达到了73.7亿元,2008年市场规模将达到100亿元,灾备技术的现在,-市场,从1982年至1998年间,遍布全美的25间灾难备份中心成功完成了582宗灾难恢复,平均每年40宗国外的灾难备份业务,60%以上集中在金融领域国际最大的灾难备份服务提供商SunGard对美国等565个公司调查发现,71.2%使用灾难备份中心。其中,56%使用了商业化的灾难备份服务,29%使用自有的灾难备份中心,15%在商业化灾难备份服务基础上同时拥有自己的备份设施.,灾备技术的现在,-市场,在宏观指导政策中我国对在8大行业关键系统中建立信息系统灾难备份与应急机制是十分明确的,但在执行和微观操作方面进展较为缓慢从九十年代末开始,工行、建行等都纷纷启动了数据大集中工程,并相应地启动了其灾备系统建设2004年,国务院信息化办公室组织有关专家对中国的灾难备份进行大量的调查研究工作,得出的结论是:除我国一些金融机构灾难备份系统已经启动建设外,其他行业的灾难体系基础还非常薄弱,目前中国的灾备行业还处于起步阶段,灾备技术的现在,-技术现状,灾备研究领域,灾备核心技术,灾备实现方案,灾备标准,容错系统结构数据恢复技术系统恢复技术业务连续性服务,数据安全网络安全系统安全安全审计,数据信息管理系统恢复管理灾难应急管理灾难影响评估,历史上的灾备主要是容错计算的一个研究方向,现在的灾备则是容错计算、信息安全和系统管理三个研究领域的综合,灾备技术的现在,-技术现状,灾备其他相关领域支持技术,核心技术数据存储技术体系结构技术信息安全技术系统管理技术,灾备技术的现在,-技术现状,灾备其他相关领域支持技术,数据存储技术虚拟化存储技术将物理空间虚拟化为一个大的数据缓冲池,实现集中式统一管理多存储版本的管理数据中心和多个备份中心之间的数据版本一致性管理删除重复数据技术容量优化技术。数据量缩减到正常的1/101/20集群并行存储技术多个存储设备或文件系统一起构建成的单个存储系统高效能存储技术存储性能高、设备利用率高、能耗和运营成本低,灾备技术的现在,-技术现状,灾备其他相关领域支持技术,体系结构技术容错系统结构多级冗余设计、故障诊断与评估、系统动态重构技术数据恢复技术数据完整性校验、部分遗失数据恢复技术系统恢复技术系统应急恢复、系统平台重建业务连续性服务将上述技术综合,避免服务中断,提供连续性服务,灾备技术的现在,-技术现状,灾备其他相关领域支持技术,信息安全技术网络安全技术系统安全技术身份安全技术安全审计技术,灾备技术的现在,-技术现状,灾备其他相关领域支持技术,信息系统管理技术数据信息管理灾难应急管理系统恢复管理灾难评估与决策支持灾难预防能力评估灾难恢复能力评估灾难防御能力评估,灾备技术的现在,-技术现状,灾备实现方案-恢复计划流程,灾备技术的现在,-实现技术,下面介绍十种不同形式的灾备实现技术,分别从简单到复杂,大家通过这些不同的实现技术可以看出灾备系统具有非常高的灵活性和可扩展性!,灾备实现方案-1,灾备技术的现在,-实现技术,灾备实现方案-2,灾备技术的现在,-实现技术,灾备实现方案-3,灾备技术的现在,-实现技术,灾备实现方案-4,灾备技术的现在,-实现技术,灾备实现方案-5,灾备技术的现在,-实现技术,灾备实现方案-6,灾备技术的现在,-实现技术,灾备实现方案-7,灾备技术的现在,-实现技术,灾备实现方案-8,灾备技术的现在,-实现技术,灾备实现方案-9,灾备技术的现在,-实现技术,灾备实现方案-10,灾备技术的现在,-实现技术,目前灾备技术方面,相关的国际和国内标准数量都相对较少,并且多停留在指导意见方面,缺乏灾备系统具体的操作细节和实现细节的指导和评估标准!国际标准SHARE 78国家标准信息系统灾难恢复规范行业法规,灾备技术的现在,-标准,国际标准SHARE 78国际标准SHARE 78将灾难恢复分成八个层次其中异地灾备的定义分七个级别:存储结构:从最简单的本地磁带备份,到将备份的磁带存储在异地,再到建立应用系统实时切换的异地备份系统恢复时间:几天级-小时级-分钟级-秒级-实时(零数据丢失),灾备技术的现在,-标准,国家标准信息系统灾难恢复规范-GB/T 20988-2007(原重要信息系统灾难恢复指南),灾备技术的现在,-标准,国家标准-信息系统灾难恢复规范,灾备技术的现在,-标准,国家标准-信息系统灾难恢复规范,灾备技术的现在,-标准,行业法规银行业银行业金融机构信息系统风险管理指引制定部门:银监会颁布时间:2006年11月1日生效时间:2006年11月1日商业银行操作风险管理指引制定部门:银监会颁布时间:2007年5月14日生效时间:2007年5月14日,灾备技术的现在,-标准,行业法规证券业证券公司集中交易安全管理技术指引 制定部门:证监会颁布时间:2006年8月2日生效时间:2006年8月2日保险业保险业信息系统灾难恢复管理指引制定部门:保监会颁布时间:2007年11月10日生效时间:2008年3月21日,灾备技术的现在,-标准,灾备技术的未来,技术发展方向,我国灾备的发展方向,灾备面对的信息系统变化,灾难面对的信息系统变化存储容量的急剧膨胀。每隔612个月,企业数据量成倍增加数据存储时间和方式的延展。Internet使网络数据能够每天24小时7天365天始终处于就绪状态;同时可以通过多种渠道和方式实现数据的更新与修改数据存储结构的不同,异构性强用户对信息系统提供的服务的要求更高,目前很多关键业务应用要求99.99%的系统可用性,灾备技术的未来,-技术发展方向,灾备面对的信息系统变化,信息化发展的趋势信息的重要性已经超越了系统设备的重要性信息系统的信息量增长惊人,信息有效保存已经成为一个大问题“电子政务”等系统的“数据大集中”模式导致信息系统的脆弱性增强Internet和安全技术的发展使得灾备系统不再单纯依赖于专有网络系统,灾备技术的未来,-技术发展方向,灾备面对的信息系统变化,灾备技术发展方向从围绕着数据存储向围绕着应用服务转变存储技术由集中式向分布式、虚拟化发展从孤立专用系统向综合服务系统转变,灾备技术的未来,-技术发展方向,灾备面对的信息系统变化,围绕着服务的灾备技术保障业务连续性方向发展,要求数据完整而可用系统快速重建应用快速部署新型容灾体系结构研究传统的基于简单备份冗余的容灾体系结构不适应当前复杂的网络计算环境传统的面向科学计算的容错技术对于当前面向事务处理(电子政务/电子商务系统)感到力不从心,灾备技术的未来,-技术发展方向,灾备面对的信息系统变化,灾备存储未来发展方向虚拟化灾备存储技术目标是提高存储的利用率重复数据删除与压缩技术目标是提高存储的效率分布式灾备存储技术目标是利用大量的、分布式的廉价存储资源构建一个安全的海量灾备存储系统基于信息的灾备存储技术目标是将海量数据信息转化为基于内容的信息存储,降低存储数据量,灾备技术的未来,-技术发展方向,灾备面对的信息系统变化,灾备综合服务系统专用系统建设成本高,运营费用成为负担第三方中立机构形式的外包灾备系统公信力问题:权威机构的制度保障和安全审计等技术保障数据的安全性:身份认证、数据加密等技术保障维护的便捷性:远程控制等技术保障其他特性:可扩展性、可共享性等,灾备技术的未来,-技术发展方向,外包方式是当前国际灾备市场的主流形式。据统计,国外采用灾难备份外包服务的比例达到71%,灾备系统外包得到了国际广泛认可,灾备面对的信息系统变化,我国灾备存在问题“数据大集中”是整个国家信息化发展的大趋势,但是与此相适应的灾备建设还十分滞后从中国农业银行2005年8月份停机事件中国银联2006年4月20日全国联网停止服务目前建立的灾难备份系统广泛存在监控分析、故障诊断自动化程度不高,应对突发事件和抗风险能力非常薄弱我国灾备技术储备不足,关键技术由国外厂商垄断我国专门从事灾备技术研究的人才极度短缺,灾备技术的未来,-我国灾备发展方向,灾备面对的信息系统变化,我国灾备发展方向建立灾备行业相关的法律和法规建立适合我国信息化系统的灾备标准体系亟待建立国家级灾备系统服务于政务系统亟待建立具有公信力的灾备系统服务于商务系统亟待建立灾备相关技术研发体系亟待促进灾备专业人才梯队建设,灾备技术的未来,-我国灾备发展方向,灾备面对的信息系统变化,法制和法规建立健全强制灾备法律和法规建立健全灾备相关制度和规范建立国家级灾备认证和管理中心,灾备技术的未来,-我国灾备发展方向,灾备面对的信息系统变化,标准体系从九十年代开始,我国大力发展信息化建设,已经具有初步的成效,我国信息化系统具有行业分布广、信息化层次参差不齐、信息量巨大的特点,这决定了新建立一个统一的标准来规范所有的信息化系统变得不现实,因此,同时建立一个集合了通用标准集和专有标准集的灾备标准体系就成为未来发展当务之急标准体系不仅仅包括技术标准,还应包含管理标准、监控标准、验证标准等一系列标准规范,灾备技术的未来,-我国灾备发展方向,灾备面对的信息系统变化,国家级灾备系统建立国家级灾备服务系统,服务于国家级各类政务信息系统灾备需求建立国家级商业灾备服务系统,服务于国有大中型企业的信息化灾备需求建立综合的国家级灾备服务系统,服务于中小企业日益增长的灾备和安全需求,灾备技术的未来,-我国灾备发展方向,灾备面对的信息系统变化,灾备相关技术体系促进产学研结合,积极研发具有自主知识产权的灾备相关技术、管理方法和应用设备,为国家信息化建设提供信息安全保障,灾备技术的未来,-我国灾备发展方向,灾备面对的信息系统变化,专业人才培养多形式培养相结合高校培养灾备专门人才面向市场需求,开设灾备应用综合培训,灾备技术的未来,-我国灾备发展方向,灾备技术国家工程实验室,实验室基本情况简介,研发能力和成果,灾备面对的信息系统变化,唯一的国家级灾备技术的实验室,灾备技术国家工程实验室,-情况简介,灾备国家工程实验室以企业、社会需求为导向,产学研相结合,围绕国家重要信息系统灾备建设领域的重大需求,针对急需解决的关键科学技术问题,开展应用基础理论研究和关键技术创新,建成国内外有竞争力的灾难备份和恢复关键技术研发及综合试验基地,为进一步提升我国灾备行业的整体自主创新能力、不断提高国际竞争力提供强有力的技术支撑!,灾备面对的信息系统变化,实验室方向成为国际一流的信息灾备技术创新研发基地成为促进成果转化、推进先进技术扩散和辐射的关键环节成为信息灾备技术体系和标准化中心成为我国信息灾备技术创新人才的培养基地,灾备技术国家工程实验室,-情况简介,灾备面对的信息系统变化,实验室职责推动灾备相关法律和法规制定制定灾备相关的标准和制度为灾备系统建设提供技术支持与保障开展灾备相关技术的研究与技术推广适时推动第三方灾备中心建设为灾备管理人员提供专业培训,灾备技术国家工程实验室,-情况简介,灾备面对的信息系统变化,人员团队固定人员63人,其中正高职称占27%、副高职称占46%,拥有博士学位者71.4%,60.3%技术人员年龄在30-40岁之间,拥有一支知识结构合理、富有创新精神的研发团队流动人员30人,包括博士后、高级访问学者等另外,还将引进国外高级人才10-15人,灾备技术国家工程实验室,-情况简介,承担与灾备技术相关各类项目44项,灾备技术国家工程实验室,-研发能力和成果,获与灾备技术相关国家科技进步奖 4 项,省部级科技进步奖励 11 项,灾备技术国家工程实验室,-研发能力和成果,灾备技术国家工程实验室,-研发能力和成果,主持制定灾备技术相关国际标准10项,灾备技术国家工程实验室,-研发能力和成果,灾备技术国家工程实验室,-研发能力和成果,获得灾备相关国家发明专利30项,灾备技术国家工程实验室,-研发能力和成果,灾备技术国家工程实验室,-研发能力和成果,发表灾备相关重要学术论文40余篇,灾备技术国家工程实验室,-研发能力和成果,组织实施了中国邮政金融计算机网络系统灾难备份工程,该灾备系统目前已顺利建成并投入运营,于2003年成功地在香港WT&T运营商部署了一套容灾系统,承担WT&T的多个增值业务,负载区达1000KBHCA,至今稳定运行,在XXXX管理系统(涉密项目)中采用HA技术,实现了全国级系统和省级系统互为容灾,灾备技术国家工程实验室,-研发能力和成果,谢谢!,敬请指正,MajpjMVcyzj21HLfrvy96dv02lPPfYgxUS7IYmZkyEmZ0kGeYZS3bpLCkYH1lt4EK7CxmUX3ijoYSOer7ZuaVWYgz4EpZrUirVpMzzvNtf1XZw5oswSXOtFaejnOcmfE1lZgnN1RSXg8wLCG8CVQ3XPJMvodPFWcpiYJgZazNSEPNIaklYSu7qSd1UpaxmZDlpN9zW7kljfsLCLi26Yv109ffbnDH8LbUN1G6ACURQ39eG12KHL9tXsZ1jzgoCK8g1kuNOh5eFvcmVT5ZYVQt9zk3rp3qLnf02FovEXxVRxjCcFRNppiJljNiOuk6fONnyX7fyGg7sXZ49BmCN5oy9VesHpKzdjTKwjrkCEQCFDehVmGax3lrOEbw63VscA3YSijtUKoCyiLzAlVRp7l4QgPNHxvJFFDyjUVN3oHlMah0XBd4uTbkfPIhHtw0evPmYOrdhEDoPwvYhzlGplU1AU9mpyiCXH8gpPCBRYjq77VcnbXumNE1yGfyTsbSj89J63kRTKDkKUg3mdS5sJ4X5cQ8dK7oW9IkScssECQdz2O9UTlpRjAFPChjhLdzopQzwxQf8ozdzOhogwAooXpUF83BX4C3jRgjDJiiXEUDMaNz4vQ4n164vspddHvOIVuBBdMA4xp1YhiHk0vOJ8TL1BxogzVlMpmod6ianYGmksQq6NWCEd56hZF4wfaNyZcrGfNxnPiG6ZAxSkfmhJAKtNmCqbRmppeXp8inz4eq3HkWCMSORyMMX522xpHG6basNr6KQfbZsFbHjzyNlJrruLolKFcC84dqfijBO5Dy2NaBcNEBPgQrT12PgpcKx2or2YChN5DPjs80zzdtdAdTKuW4uVv9bbZu3K2SZ2aEhTlIC1UqrIWibkzwHh6p8gLv26zr01mJybfOzFc4T7kQH1IpPwOzMDnAKPLsLrznXGjFNIA9bSWWms6ibKZwQIKrMzalwbFrQJvOP1rPH8rx2KkyYqrtQk5VRwM1HSX,