神州泰岳运维管理解决方案.doc
《神州泰岳运维管理解决方案.doc》由会员分享,可在线阅读,更多相关《神州泰岳运维管理解决方案.doc(154页珍藏版)》请在三一办公上搜索。
1、北京神州泰岳软件股份有限公司目 录1概述62需求分析72.1总体需求分析72.2监控管理72.2.1监控对象分析72.2.2集中故障管理72.2.3资源配置管理82.3服务管理93解决方案概述113.1建设路线113.2产品选型113.2.1监控管理113.2.2服务管理173.3部署方案233.3.1软硬件部署233.3.2组网方案244监控管理解决方案264.1技术架构264.1.1系统逻辑结构264.1.2数据展现层264.1.3数据处理层274.1.4数据采集层284.1.5系统自管理294.1.6采集源304.1.7外部接口304.1.8系统软件模块304.1.9数据处理流程说明32
2、4.2功能架构374.2.1监控管理平台374.2.2监控管理专题834.2.3业务监控1105服务管理解决方案1275.1事件管理1285.1.1工作台1285.1.2事件管理流程1295.1.3事件处理流程图1345.2变更管理1345.2.1变更请求1355.2.2变更评估1355.2.3变更审批1365.2.4变更实施1375.2.5回顾和关闭1395.3知识库管理1395.3.1知识的来源1405.3.2知识库维护1405.3.3知识检索和使用1415.4值班管理1415.4.1排班管理1425.4.2值班日志管理1445.4.3交接班管理1455.4.4机房进出记录1456运维管理
3、系统接口实现方案1466.1告警接口1466.2配置资源接口1497解决方案特点与优势1517.1网络管理方案的特点和优势1517.1.1全面、深入的监控和管理手段1517.1.2稳定、灵活扩展的网管平台1517.1.3统一的平台监控和业务监控1527.1.4有效的告警处理机制1527.2运维管理方案的特点和优势1537.2.1统一的运维管理系统1537.2.2对ITIL理念的深刻理解和人才储备1537.2.3市场占有率第一的电子运维软件平台1547.2.4与本土实践经验的完美结合1548图表目录1551 概述广州xxx化建设投资营运有限公司(以下简称为“xxxxxx”),是面向广州交通领域,
4、集投资、建设、运营为一体的高科技公司。xxxxxx专注于xxx化平台技术开发,xxx网络系统的建设、营运,计算机信息系统集成,软件开发以及智能卡相关产品的开发、应用,建设了包括调度平台、综合管理平台、出租车管理系统等在内的面向交通领域的应用系统,为广州市城市交通的发展做出了积极的贡献。伴随着xxx化平台给交通管理工作带来的巨大支撑,相关的信息化平台已经成为交通管理不可缺少的有力工具。因此,通过建设一套运维管理系统,保障包括调度平台、综合管理平台、出租车管理系统、内部行政网络等在内的信息化平台的IT基础架构以及业务应用系统稳定、可靠的运行,为交通管理工作提供持续、有效的支撑,成为xxxxxx迫切
5、的需求。2 需求分析2.1 现状分析2.1.1 资源配置管理资源作为运维管理的核心内容,在运维建设当中需要对资源进行管理,具体包括:u 针对服务器、网络设备、数据库、中间件及业务系统等的资源数据采集。u 创建资源管理数据库。u 资源数据的统计分析功能。u 资源管理与故障管理的关联分析。我方认为有必要在本项目中建设一套完备的配置管理数据库(遵循ITIL规范中相关描述,即资源管理数据库)。在其中定义和记录各种被管理资源对象实例和相关属性信息,并定义和记录各被管理资源对象间的关联关系。我方认为本项目中至少应提供以下资源配置管理功能:u 提供自动发现工具,能够自动采集各种被管理对象的资源配置数据,形成
6、资源配置数据库的基础数据。u 提供面向对象的资源配置数据结构,能够将各种被管理对象的实例信息和属性信息进行对象化存储,并能够定义各种被管理对象间的关联关系(诸如连接关系、父子关系等)。u 提供图形化界面对资源配置数据进行后台数据结构和资源配置数据的维护与管理。能够灵活的扩展资源类和资源属性,能够添加、删除、修改各种资源属性数据。提供资源数据批量导入接口。u 能够根据资源对象自身属性、资源对象与资源对象间的关联关系等自动对故障级别进行基于预设策略的调整。如对于重要的核心服务器设备自动提高告警级别、对于双机系统中的非关键故障自动降低告警级别等。u 提供资源数据条件查询功能和资源统计分析报表功能,帮
7、助运维人员充分了解当前IT系统中各类被管理资源对象的状况。我方认为资源配置数据库必须作为整个解决方案的基础来进行重点建设。无论故障管理模块根据资源属性和资源关联关系进行自动的故障级别调整,还是性能管理模块基于资源对象模型进行指标体系建模,都需要依赖于资源配置管理数据库中的数据结构和基础数据。2.2 服务管理广州xxx化建设投资运营有限公司以服务广州xxx化为宗旨,利用现代信息技术手段改造传统的交通产业,为广州市城市交通的发展做出了贡献。在企业内部信息化建设的同时,企业信息化的管理同样需要规范化的指导和电子化的工作方式。ITSM是基于ITIL理论指导的IT服务管理最佳实践。在IT服务管理建设中利
8、用ITIL的服务流程处理日常工作任务,可以大大减少企业IT运营的成本,提企业IT运营的效率。 在本项目建设中,我方将实施ITSM中的事件管理流程以满足IT系统及终端的故障处理,实现故障的申报、处理、完成和关闭。利用ITIL理论中故障事件处理的升级机制和闭环原则,实现故障处理过程中人员的合理配置,同时保证故障处理的完整性,从而提升IT运维部门及企业的价值。在本期项目中我方还建议用户建立变更管理流程,以实现如日常软件升级及版本更新的流程电子化。同时建立知识库和值班管理已满足用户日常维护工作的需要,提升工作效率。3 解决方案概述3.1 建设路线对于XXX运维管理工程建设,包含了系统监控管理平台和服务
9、管理平台,其中:u 监控管理体系负责监控各种网络设备、主机、数据库、中间件、业务应用的资源配置采集和调度、配置变更报告、运行状态监控、性能参数收集、事件分析和关联、告警处理和前转等。本管理体系包括拓扑展现、故障管理、性能管理、资源管理、用户模拟体验等监控管理功能。u 服务管理实施ITSM中的事件管理流程以满足IT系统及终端的故障处理,实现故障的申报、处理、完成和关闭。利用ITIL理论中故障事件处理的升级机制和闭环原则,实现故障处理过程中人员的合理配置,同时保证故障处理的完整性,从而提升IT运维部门及企业的价值。监控管理平台和服务管理平台通过告警接口实现对故障的申报、处理、完成和关闭。3.2 产
10、品选型3.2.1 监控管理3.2.1.1 软件选型Ultra-NMS采用Java语言开发,其产品模块均可以跨平台部署,能够支持Windows、Linux、AIX、HP-UX、Solaris等各种操作系统,可以广泛的支持大中小各种规模的企业。在网管的软件选型方面,我们推荐采用BMC Performance Manager和神州泰岳Ultra-NMS的组合。Ultra-NMS采用Java语言开发和J2EE架构,中间件采用JBOSS,数据库采用Oracle,而Web服务器采用Apache;BMC Performance Manager采用C语言开发,执行效率高、系统影响小,在部署时不需要其他的第三方
11、软件支持。其中BMC Performance Manager作为分布式监控代理程序,被广泛的部署在各个被管理服务器上,负责监控操作系统、数据库、中间件和应用;Ultra-NMS作为集中网管平台,通过Probe进行采集BPM提供的系统平台的监控数据、网络设备监控数据和桌面监控数据,Ultra-NMS Server进行各种数据处理,Ultra-NMS Client和Report进行数据展现。采用这样的产品选型,具有如下优势:r 灵活的部署Ultra-NMS可以支持灵活的部署模式,包括两级部署、三级部署、混合部署,甚至可以支持部署模式的变化,能够适应不同的用户在不同阶段的管理需求。无论采用什么部署模
12、式对于BMC Performance Manager是没有影响的。Ultra-NMS支持各种Unix、Linux和Windows,对于硬件和操作系统没有依赖性,这样使得xxxxxx在对服务器选型时可以不受限制,这不仅有利于新增设备的采购,而且有利于原有服务器设备的利旧。r 广泛的认可Ultra-NMS是成熟的产品化的网管平台,其一个产品相当于国外产品的多个产品组合,是目前最优的网管平台产品。目前已经在电力、石油、电信、金融、政府、媒体等各种行业中广泛使用。r 优秀的监控代理u BMC Performance Manager在安装监控代理时,对操作系统没有特殊要求,不需要额外安装系统补丁,对业务
13、系统几乎没有影响。u BMC Performance Manager产品线齐全,支持各类主流平台系统与数据库系统,如AIX、Solaris、HP-UX、Tru64、Windows和Linux;Oracle、DB2、Informix、Sybase、SQL Server等;BMC Performance Manager产品提供对各种主流中间件,如Tuxedo、Weblogic、WebSphere、MQ的监控管理。u 可扩展性强:BMC Performance Manager管理功能的实现是取决于各个KM,而每个KM是采用PSL(Patrol Script Language)脚本语言编写而成的,PS
14、L脚本语言编写采用明码方式,类似UNIX系统中的脚本语言或C语言。Performance Manager自身提供KM的开发机制,这样无论是学习KM的实现方式、扩展KM的管理功能、或新编写KM都是比较容易完成的工作。而所有扩展的KM与Performance Manager自带的KM工作方式完全一致。u 采集方式统一:Performance Manager的每项管理指标的实现均由不同的KM完成,通过在不同的主机上加载相关的KM,实现管理目标。u 处理方式统一:Performance Manager采用了单一Agent技术,所有KM以插件方式load到指定的Agent上,由Performance M
15、anager根据定义好的轮询策略,定时采集相关KPI指标的值或状态,并统一存放在被管服务器指定位置,在打开Performance Manager Console连接相应Agent时,将存放在被管服务器得到数据进行展现,同时,BMC Performance Manager提供统一的历史数据处理功能,在每个Agent端内置有Data Retriever模块,该模块定时将Agent采集到的数据发送到安装了Performance Manager Reporting Data Aggregator模块的服务器,并通过该组件将数据存入Performance Manager Reporting产品所在的Or
16、acle数据库中。u 展现方式统一:Performance Manager Console采用了统一的左树右图的方式展现所有KPI指标,同时可以针对不同指标的特点选用折线、柱图、表盘等方式展现数据,可以在图表上显示不同级别的告警门限,也可以通过定义管理夹的方式对KPI指标根据实际运维使用习惯进行重新整理,将不同机器的相同KPI指标同时放在右侧的Panel中统一展示,以进行快速的比较,也可以将同一机器中的相关KPI指标在同一Panel中展示,以迅速定位性能瓶颈。u 调度方式统一:由于规范中对不同KPI指标要求的数据采集最大时间间隔不同,同时在实际项目中,也会经常调整采集频率,Performanc
17、e Manager Console提供图形化界面,方便的定义和修改采集间隔。u 通讯加密:Performance Manager Console与Agent之间的通讯可以采用加密算法,并且随用户需求不同可以选择高、中、低三种不同的加密算法。u 数据保存:Performance Manager Agent在本机采集数据后,会将数据保存在本地,以实现对历史性能数据的重采、补采机制。u Agent间连通性测量:维护人员经常需要了解设备间的连通性,如采集机和服务器之间连通性,Performance Manager产品默认能够提供监测本机与其它设备连通性测试功能。u 资源占用:由于Performance
18、 Manager采用了单一Agent、单一进程的技术,CPU和内存占用都很低,正常状态下CPU占用不超过2%,内存占用不超过25M。u 自动分发:Performance Manager中提供Distribution Server组件,通过该组件能够自动向指定的被管服务器批量分发Performance Manager for Servers、Performance Manager for Database等软件,无需进行人工干预即可完成产品的安装工作r 统一的配置服务Ultra-NMS基于先进的资源建模的技术上实现CMDB,不仅能够记录IT基础架构中的各个实体对象,而且能够创建虚类,管理各种虚对
19、象,完整的记录所有的配置项Configuration Item(CI)和它们之间的关系,让用户对现有的IT基础架构有最完整和全面的了解。Ultra-NMS中的资源管理不是仅仅为了记录配置数据而建立CMDB,而是建立了CMDB后能够为网管内部其它模块和外部其它系统提供有效的配置服务,包括:u 配置数据一致性检查:虽然建立CMDB非常复杂,但是对于CMDB中海量的配置数据与现实环境中的配置数据的一致性检查更加复杂。Ultra-NMS能够定义自动化的配置采集和调度任务,时刻监控现实环境中配置变化,及时更新CMDB中的配置数据。当现实环境中配置发生变更时,记录配置项的变化历史,同时提供配置变更告警,提
20、示管理员关注。u 面向故障管理提供配置服务:配置管理数据库CMDB中记录着很多有价值的信息,例如负责人、负责部门、地理位置、重要程度等信息,而这些信息是在故障管理的告警中必须体现,但是单纯依赖故障管理又很难实现的。Ultra-NMS开发出故障管理配置服务技术,能够在原始的故障事件中,自动增加相应的配置信息,实现人性化的故障告警,并且智能的定义故障告警的级别,为故障管理提供有效的支持。u 面向性能管理提供配置服务:性能管理中,Ultra-NMS没有象其它的产品那样简单的基于每个性能指标开发功能,而是建立了KBP/KPI的指标体系,其中KBP就是资源管理CMDB中的配置项CI,这大大增加了性能管理
21、的可扩展性和实用性。u 面向服务台提供配置服务:在所有的运维管理系统中,都需要部署服务台和网络系统管理,这二者都需要建立CMDB,现在大部分的系统都是分别建立CMDB,这样不仅仅是造成重复建设,而且会造成数据的不一致和冲突。Ultra-NMS的配置服务技术不需要服务台自己建设CMDB,可以由Ultra-NMS直接向服务台提供配置数据和信息,实时提供最准确的配置项的属性信息,形成完美的运维管理方案,降低运维管理的成本,提高运维管理的水平。u 配置数据报表:配置服务还可以向运维管理门户提供报表数据,为运维分析提供配置管理方面的基础数据。r 有效提炼信息信息提炼就是对采集的数据进行处理后形成有用信息
22、的过程。在故障管理中,Ultra-NMS采集到的事件需要通过标准化、分类、合并压制、过滤、相关性分析、前转、升级等多级处理后,能够提供有效的故障信息。r 扩展性 附图1. 具有扩展性的体系架构神州泰岳总结多年的运维经验,创新的设计出可扩展的体系架构:u 扩展的数据采集:Ultra-NMS在数据采集方面提供多种接口,包括CORBA、SNMP、JDBC、Web Services、JMS、FTP、MML等,无论业务应用是什么、被管理对象如何变化,只要它有接口,Ultra-NMS就能够采集到数据;u 扩展的数据处理:Ultra-NMS在采集到数据后,能够灵活的定义、存储和处理各类不同的对象数据,无论业
23、务和指标如何变化,Ultra-NMS均可以完善的整合配置、故障和性能数据;u 扩展的数据展现:Ultra-NMS的数据展现能够按照客户和业务的需求定义,不仅仅报表能够定制,而且监控的界面、数据展现的形式都能够方便的灵活定义。Ultra-NMS与其它的产品比较,具有更加扩展的管理能力,使得它不仅仅能够像其它的产品一样监控标准的网络设备、操作系统、数据库、中间件和商业化的应用软件,而且能够扩展的监控业务应用。在为客户的项目实施中,收到了非常好的效果,使得这些客户在运维管理方面达到了国内领先、国际一流的水平。在主流厂商代理中,BMC BPM具有最强的扩展性,能够方便的扩展监控对象;CA Unicen
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 神州 泰岳运维 管理 解决方案

链接地址:https://www.31ppt.com/p-3783635.html