vmware灾难恢复.ppt
虚拟化,一切皆有可能VMware Site Recovery Manager 容灾方案,内容提要,简介和重要概念Site Recovery Manager 前提条件和 SAN 集成Site Recovery Manager 工作流程Site Recovery Manager 角色和权限警报和站点状态监视总结,何为灾难?,数据中心在较长时间内完全不能正常工作灾难的申报通常需要组织(C*O 级别)中多个部门一致认可哪些情况不算是灾难?单个主机发生故障暂时的服务中断,传统灾难恢复的当前状况,灾难恢复服务根据业务需要进行分级执行物理性灾难恢复比较困难在两个位置维护完全相同的硬件并行地应用升级和修补自动化程度较低容易出错且难以测试,虚拟灾难恢复的优势,虚拟机可移动可自动配置虚拟硬件可自动执行测试和故障切换(将人为错误降到最少)减少了对闲置硬件的需求降低了成本,提升了服务质量,简化和自动化灾难恢复工作流程:设置、测试、故障切换将人工恢复操作手册转换为自动化的恢复计划通过 VirtualCenter 提供对恢复计划的集中管理,介绍 VMware Site Recovery Manager,与 VMware Infrastructure 配合工作,使灾难恢复变得更加快速、可靠、可管理、价格合理,Site Recovery Manager 利用 VMware Infrastructure 来实现高级灾难恢复管理和自动化,受保护站点,恢复站点,VirtualCenter,Site Recovery Manager,VirtualCenter,Site Recovery Manager,数据存储组,数据存储组,X,Site Recovery Manager 概览,服务器端组件*,站点 1,VC Server 1,SRM Server 1,存储复制适配器,SRM 1 数据库,VCMS 1 数据库,块复制软件,站点 2,VC Server 2,SRM Server 2,存储复制适配器,SRM 2 数据库,VCMS 2 数据库,块复制软件,阵列 1,阵列 2,*注意:仅作为概念图。SRM Server 可以在 VCMS 以外的系统上运行,Site Recovery Manager 概念关系“速查表”,重要概念及各概念之间的关系,保护组 3,保护组 2,保护组 1,数据存储组 3,数据存储组 2,数据存储组 1,LUN 1,LUN 2,LUN 3,LUN 4,LUN 5,VMFS 1,VMFS 2,VMFS 4,VMFS 3,恢复计划 1(整个站点)保护组:,恢复计划 2(子集)保护组:,受保护站点,恢复站点,保护组 1,保护组 2,保护组 3,保护组 1,与 SRM 的阵列集成,针对特定供应商的脚本支持:搜索阵列搜索复制的 LUN启动 SRM 测试(在隔离环境中模拟故障切换)启动 SRM 故障切换(对恢复站点的服务执行实际的故障切换)阵列供应商将负责为其阵列创建脚本,以支持与 Site Recovery Manager 进行集成,安全提示:DNS 验证 四法则,通过为 VC、SRM 和 ESX Server 执行下列 DNS 查找,验证 DNS 是否按预期工作短名称长名称反向正向,Site Recovery Manager 1.0 前提条件,、ESX Server 3.5 或 ESX Server 3i安装在受保护站点和恢复站点上的 VirtualCenter(VC)Server 2.5 版本安装在受保护站点和恢复站点上的 SRM Server安装在将要访问受保护站点和恢复站点的 VI Client 上的 SRM 插件允许在 VC Server 和 SRM Server 之间建立 TCP 连接的网络配置使用 ODBC 在受保护站点和恢复站点中建立连接的 Oracle 或 SQL Server 数据库安装在受保护站点和恢复站点上的 VC License Server 中的 SRM 许可证在受保护站点和恢复站点之间预先配置好的基于阵列的复制,安装工作流程,在受保护站点上,完成下列操作:安装 SRM Server将 SRM 插件安装到 VI Client 上安装 Storage Replication Adapter(SRA)在恢复站点上,完成下列操作:安装 SRM Server 将 SRM 插件安装到 VI Client 上*安装 Storage Replication Adapter(SRA)务必按本演示文稿所述的顺序完成 Site Recovery Manage 工作流程,*注意:可选步骤,只在使用 VI Client 的其他实例访问恢复站点时需要执行此步骤,受保护站点和恢复站点数据中心,受保护站点,恢复站点,Site Recovery Manager 用户界面,设置工作流程 保护站点,在保护站点上完成下列设置操作:用户对保护站点和恢复站点上的 SRM Server 进行配对设定 SRM Server 和 VC Server 之间的安全证书,未经正确签名的证书将导致产生黄色警告信号。不过仍会建立相关性,以便您继续执行工作流程中的下一个步骤。,设置工作流程 保护站点,阵列管理器配置从“Manager Type”下拉框中选择正确的 Manager Type,SRM 识别出可用阵列和复制的数据存储,并确定数据存储组。,设置工作流程 保护站点,设置工作流程 保护站点,使用 Inventory Preferences Mapper,用户可以将受保护站点中的资源映射到这些资源在恢复站点中的对应项。,设置工作流程 保护站点,保护组是一组将一起故障切换到恢复站点的虚拟机,在运行“保护组”向导的过程中,您需要在恢复站点上为受保护虚拟机的临时 VirtualCenter 清单文件选择一个位置。,设置工作流程 保护站点,在运行“保护组”向导的过程中,用户应选择需要保护的虚拟机,并将它们分配给保护组。如果创建保护组,则会导致恢复站点上的 VC 清单发生更新。,设置工作流程 恢复站点,在恢复站点上,完成下列设置操作:用户创建与单个或多个保护组相关联的恢复计划,Site Recovery Manager 恢复计划,虚拟机关机,高优先级虚拟机恢复,连接虚拟磁盘,高优先级虚拟机关机,一般优先级虚拟机恢复,Site Recovery Manager 恢复计划,低优先级虚拟机恢复,测试后清除,虚拟磁盘重置,Site Recovery Manager 恢复计划:将人工 BC/DR 操作手册转换为自动化流程 在 VirtualCenter 中指定恢复流程的步骤 提供一种在恢复站点上的隔离环境中测试您的 BC/DR 计划的方法,这种测试方法不会影响受保护站点上的受保护虚拟机,测试恢复计划,通过在保护站点上模拟在不停机的情况下对受保护虚拟机进行故障切换来“测试”恢复计划,测试恢复计划,执行故障切换,警告 执行实际故障切换将永久性地改变受保护站点和恢复站点上的虚拟机和基础架构,执行故障切换,警告 执行实际故障切换将永久性地改变受保护站点和恢复站点上的虚拟机和基础架构,Site Recovery Manager 1.0 中的故障恢复选项,Site Recovery Manager 1.0 不提供一键式自动化故障恢复流程。故障恢复选项:不含 SRM(无启动顺序,无故障恢复历史记录报告)与您的存储团队合作,反向复制数据虚拟机重新创建清单*、重新启动和重新获取 IP(手动或通过脚本)包含 SRM(恢复计划包含启动顺序和故障恢复历史记录)与您的存储团队合作,反向复制数据利用 SRM 反向完成从恢复站点向受保护站点执行恢复的所有 SRM 工作流程重复上述两个步骤从受保护站点向恢复站点执行恢复,*注意:在受保护站点中,虚拟机可能无需在 VC 中重新创建清单。,默认角色和权限,警报和站点状态监视,Site Recovery Manager 支持下列警报通知操作:向指定地址发送电子邮件向 VC 陷阱接收器发送 SNMP 陷阱在 VC 主机上执行指定命令我们建议您为以下情况设置警报通知:远程站点关闭 对远程站点执行 Ping 操作失败复制组被删除恢复计划损坏License Server 无法访问,Site Recovery Manager 服务器监视,Site Recovery Manager 将在下列情况下引发 VirtualCenter 事件:磁盘空间不足CPU 的使用率超出限制内存不足远程站点无响应远程站点心跳出现故障恢复计划测试已启动、结束、成功、失败或取消虚拟机恢复已启动、结束、成功、失败或发出警告,Site Recovery Manager 核心收益,扩展灾难恢复保护现在只需增加最少的操作和成本,即可对虚拟机内的所有工作负载进行保护减少恢复时间一旦确定发生灾难,按下一个按钮即可为数以千计的虚拟机启动恢复流程提高恢复的可靠性系统状态复制功能确保虚拟机具有启动过程所需的所有数据硬件独立性避免了由不同硬件引起的故障由于测试过程基于实际的故障切换流程,并且操作简便,因此可以频繁进行高度逼真的测试,总结,Site Recovery Manager 利用 VMware Infrastructure 实现灾难恢复快速实现灾难恢复过程的自动化避免使用复杂的传统恢复方法可靠 确保正确地执行恢复计划支持更简单、更频繁的测试可管理集中管理恢复计划使计划动态地适应环境价格合理利用恢复站点基础架构降低管理成本,