上海市规划和国土资源信息化运维系统管理.doc
《上海市规划和国土资源信息化运维系统管理.doc》由会员分享,可在线阅读,更多相关《上海市规划和国土资源信息化运维系统管理.doc(21页珍藏版)》请在三一办公上搜索。
1、上海市规划和国土资源信息化运维系统管理摘要:上海市规划和国土资源信息化运维团队从专注技术向运维管理转变。以优质服务,面向业务、面向客户来开展IT运维工作。关键词:IT运维;一站式服务;服务交付;服务支持;ISO20000中图分类号:P23 文献标识码:A文章编号:1674-3695-(2010)01-43-07引言上海市房屋土地资源信息中心以下简称中心)肩负着全上海市规划国土局和住房保障局电子政务信息系统建设的重任,其服务范围包括规土和房管两局机关用户以及下属事业单位、区县两局和交易中心两级用户、区县下属房地办土地所二级用户以及信息中心内部科室。服务工作除了信息系统运维外还包括其主干网建设与运
2、行维护的使命。中心致力于提供安全、高效、快捷的IT运维。近年来,随着市局信息化建设的深入,各种业务管理逐步信息化,计算机机房设备、网络基础设施,大型主机、服务器、客户端等硬件平台,政务应用系统、核心数据库、应用服务器、中间件等软件平台日益复杂,服务的用户(包括应用使用单位、银行查询、行业企业用户、市民百姓等)越来越多,如何维护好日益增多的网络和系统等各类设备,保证各个应用系统安全稳定地运行,为用户提供良好的服务并及时解决出现的问题和故障,做到网络和用户之所及,管理和服务之所及,确实是保障日常业务正常稳定运行的关键所在。为了满足中心业务的需求,提升管理水平,IT运维就需要上升到更高的IT运维管理
3、体系的层面。IT运维管理体系有两条主线,其一是针对客户的,其二是针对用户的。客户的要求就是IT运维服务的目标,也就是SLA(服务级别管理),具体可分解成运维团队管理、能力管理、可用性管理、业务连续性管理和财务管理,专业地讲也叫作IT服务交付;用户是指IT运维服务的服务对象,服务核心就是拥有服务台和事故管理,具体可分解成问题管理、变更管理、发布管理和配置管理,专业地讲也叫作IT服务支持。2IT运维服务的目标IT运维服务的目标是整个运维工作的重点,只有确定了目标才能开展好工作。作为一个技术人员往往乐于沉浸在具体的技术工作中,很少关注业务的发展需要。而作为一个运维团队则首先要将自己的工作目标与业务目
4、标紧密相联,变被动支持为主动服务。运维服务的作用从中心工作重点来讲是需要保障数据的安全性,保障业务的连续性。简而言之就是确保系统不瘫、数据不丢。我们建立了上海规划和国土系统运维团队的运维服务方针和服务口号,明确了工作方针、目标和工作宗旨,有效凝聚了团队的工作热情。运维服务方针是:“一个中心,两个基本点:以服务为中心,确保运行安全、信息安全”。运维服务口号为:“安全、专业、规范、高效”。运维服务目标是:(1)系统无重大故障,保持高可用性(2)始终保持足够的能力余量,以不变应万变(3)建立业务连续性计划并定期演练(4)确保信息安全为了能够更准确的说明运维目标,结合上海规划和国土系统的目前实际情况,
5、我们提出了三年内运维目标量化的指标:高可用性:目前为99.9%足够的能力余量:电力:利用率低于60%存储:15K转速FC磁盘的SAN存储利用率低于70%,7.2K转速SATA磁盘的SAN存储利用率低于50%;核心小型机:CPU利用率低于50%,SAN和网络带宽利用率低于40%;内外网虚拟机:始终分别保持有三台高性能计算机(目前参考DELL R71O:4个E5520的CPU,72G内存)冗余。网络:流量利用率低于50%建立应用级灾备中心,切换时间小于8小时,通过BS25777认证通过等级保护三级测评,通过ISO27001认证同时,为了规范服务内容,提高服务质量,经过和服务用户的深入讨论,我们进一
6、步的建立了SLA(服务级别管理)。在SLA中,我们定义了从客户角度更详细的指标。如:服务台热线支持服务,服务时间5天*9小时、每个电话接通小于10秒、客户满意度高于92%,等等。这样就把概要性的工作目标进一步展开为可实际执行和考核的工作内容。限于篇幅,对于中心其他SLA要求就不做介绍了。3IT运维服务的交付根据SLA的要求,运维服务交付进一步展开为运维组织管理、能力管理、可用性管理、业务连续性管理和财务管理。运维组织管理是一个运维技术人员选聘、考核、培训的流程。根据SLA的要求,以及数据中心的技术架构,我们制定了组织结构,明确了各个岗位的职责和要求;同时根据目前的人员配备计划,制定了人员选聘、
7、外包服务人员的要求,以及人员的培训计划。经过三年的运作,搭建完成了组织完善、岗位明确的组织体系,并且拥有了一支工作规范、技术过硬、业务精通的技术队伍,有效地支持了运维服务工作。能力管理是一个对IT资源的服务能力进行有效监控和管理的流程,通过监测工具对服务资源进行监测,然后提取监测数据进行分析,来掌握当前资源的服务能力,及时地调整对象的配置情况。除此以外,它还可以预测未来所能提供的服务。主要内容有:根据服务级别协议中定义要求的能力服务条款,制定资源服务对象的监测范围和指标,以及监测周期、阀值、方法和技术等;根据能力监测数据,进行能力分析,编制报表;根据能力运行周报,提出服务改善计划;根据用户要求
8、进行能力现状调查,收集服务级别协议、事件问题记录、配置项等的资源服务对象的监测数据;分析现有能力与当前服务级别和预计要求之间的差距,并提出改善技术建议给用户。目前,上海规划和国土系统已经建立了全面的监控系统,涵盖了机房的空调、电力、消防、门禁、摄像,小型机、数据库、存储、网络、PC服务器、Vmware虚拟机、内外网同步、磁带备份等所有的内容。同时,在日常工作中,每周生成一份近百页的设备能力报告,对小型机、网络、数据库、存储等各系统性能进行全面分析,从而可以判断系统能力变化趋势,及时发现系统隐患,采取纠正措施。此外,我们还制定了全年的能力报告,分析全年的系统性能信息,从而可以科学的决策下一年设备
9、采购计划。可用性计划是一个对IT资源的可用性进行有效监控和管理的流程,它建立和维护与业务需求相一致的IT服务可用性计划,在明确的业务和用户需求的基础上制定的IT服务可用性计划,最大化地支持业务的发展和用户的工作,符合组织的最大利益。除了业务需求之外,还需要明确IT服务的目标,在可用性目标的制订中,应涉及可用性、可靠性、可维持性等方面。应考虑从正常状态到发生重要服务损失的所有情况。同时应该为已知的数据量、用户量的增减、预期的工作量高峰和低谷以及其它已知的将来的变更做出计划。应结合业务影响性分析结果和重要IT资源和应用优先级来进行可用性设计。在制定可用性计划的过程中,我们充分考虑未来的业务需求及计
10、划,并和业务部门进行了深入的探讨。在运维队伍中,可用性经理负责对IT服务可用性计划定期维护、及时更新,保证计划维持在有效状态,以指导IT服务可用性管理和改进。目前,我们利用已建立的监控系统,建立了重要应用系统的可用性报告,根据该报告和该应用系统的可用性要求(如工作日、工作时间内99.9的可用性),制定了下一阶段的系统改进计划,全面保证应用系统的高可用性。业务连续性管理是一个对IT资源的业务连续性进行有效管理的流程。它为了确保重大灾害与意外事件发生时,上海市房屋土地资源信息中心运维团队的IT运维服务能够在既定的要求时限内恢复正常运作,从而减少运营风险、降低社会影响。业务影响分析:我们依据包括用户
11、需求、社会影响、内部管理重要度、期望值与恢复策略等在内的各要素,进行业务影响分析(BIA)并制定关键业务影响分析表。该表反映了可能导致上海市房屋土地资源信息中心运维中断的重大影响项目、伤害属性、严重等级、中断最大可忍受时限等数据。IT服务连续性规划:根据关键业务影响分析表协调我们制定关键业务恢复计划表,经过专家评审后作为当发生重大灾难时的执行依据。然后依据关键业务恢复计划表及关键业务影响分析表来规划制定灾难恢复计划,并将其作为系统恢复作业的依据,确保该系统执行恢复作业的有效性。各系统灾难恢复计划的规划与执行若遇有资源冲突,应交由高层决定其优先级分配次序,并在关键业务恢复计划表中予以说明。IT服
12、务连续性计划的实施与测试:关键业务恢复计划表中相关系统的灾难恢复计划应同时进行测试及演练。测试后依照测试结果修正关键业务恢复计划表和灾难恢复计划,并提交测试记录表。测试结果与修正后的关键业务恢复计划表送交审查。测试失败或部分失效,应立即检讨并提出纠正及改善计划,或再进行测试予以确认。关键业务恢复计划表经核准后,对所有业务相关人员进行培训了,且每年实施一次对关键业务系统的演练,以便在发生重大事件时能正确使用该计划,所有的演练均保留纪录,形成灾难测试记录表。目前,我们已经对内外网分别制定了全套的数据级业务连接性文档,并进行了数据级的业务连续性计划演练。以后每年将演练一次,同时,我们计划逐步把规划和
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 上海市 规划 国土资源 信息化 维系 统管
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-3453656.html