运维管理系统方案.doc
《运维管理系统方案.doc》由会员分享,可在线阅读,更多相关《运维管理系统方案.doc(46页珍藏版)》请在三一办公上搜索。
1、运维管理系统方案书【摩卡软件】【2008】年【08】月目录目录21 XXXXX需求分析41.1 环境描述41.2 管理需求41.3 本期管理目标52 方案功能详述72.1 网络拓扑管理72.2 网络性能检测112.2.1 网络设备的管理功能122.2.2 路由器监控指标举例172.2.3 交换机监控指标举例182.3 服务器监测202.3.1 服务器管理功能202.3.2 摩卡代理软件(MRAM)概述272.3.3 非代理软件(Mocha Agentless)概述282.3.4 AIX服务器监控指标举例292.3.5 Window 2003服务器监控指标举例312.4 配置管理332.5 故障
2、管理352.6 告警事件管理362.6.1 邮件362.6.2 短信362.6.3 Mocha Alert362.7 报表管理362.7.1 报表管理372.7.2 报表分析372.7.3 报表和报告订阅382.8 角色管理392.9 网管工具402.10 管理方式403 方案的典型特点和优势433.1 开放的体系架构433.2 分布式体系架构433.3 单一代理,资源占用少433.4 可扩展业务流程管理433.5 安全的管理系统443.6 灵活的权限控制443.7 使用与维护简单453.8 良好的扩展性453.9 模块化结构451 XXXXX需求分析1.1 环境描述XXXXX现有的IT系统,
3、包含CISCO,F5等多种网络设备,AIX、Linux、Windows等各种类型的服务器,以及Oracle、SQLServer数据库,IIS等。目前XXXXX主要面临以下一些问题:l IT应用不断扩大,各种不同的应用和业务系统在网络上运行越来越多,对网络的依赖越来越大,要求对网络管理的内容日趋增多,包括网络管理、性能管理、应用管理、使用管理、安全系统等内容 。l 网络的规模增大,规划、维护、安全、管理等分工更加细致,管理迫切要求对网络的使用和维护建立统一的、规范的、体系化的、层次化的服务管理流程 。l 多设备、多系统的运行信息、告警信息的多样化,要求对这些信息进行集中化的管理,进行智能化的分析
4、、统计,得出有利于网络管理和维护的数据,更有效、更快捷的解决问题 。1.2 管理需求通过对XXXXX环境的充分了解和分析,摩卡软件公司认为,XXXXX运维管理系统应该包括如下的管理需求: 以业务的角度将传统的技术设备的管理整合到基于业务的管理平台上来,不仅能完成对设备监控的需求同时能满足根据业务的组成定位问题根源,定位性能瓶颈,预测业务发展趋势和稳定性。 采用的技术成熟、先进,并具有较强的集成性和可扩充性的管理平台; 解放人力,依靠智能化技术化的管理手段,降低故障发生率,降低维护成本,并同时提高维护效率。 基于统一、集中的管理体系,统一的数据处理和展现,统一的告警平台。统一的数据处理和展现,消
5、除各个监控工具之间各自为政、系统管理员在各个界面间频繁切换的情况,将旧的监控工具的数据和事件统一融入到新的监控平台中来,并通过统一的展现界面进行展现。统一的告警平台,将所有告警纳入监控管理监控平台,并通过短信、邮件和桌面客户端统一告警。 易于使用和维护。管理软件本身的作用就是为了降低运维成本、提高运维效率。这就要求管理软件本身必须是易于使用和维护的。 对主机系统资源的占用比较少的情况下,实现对各种服务器(AIX、Linux、Windows等)监控管理。包括主机硬件、操作系统、文件系统、进程和应用等。主机监控的重点是对操作系统关键指标,如CPU、内存、进程、文件系统等进行全面的监控管理,要求不仅
6、能够在状态改变或性能指标超越门限时生成告警,同时还应该提供实时和历史的性能数据展现,并能够保存历史性能数据,以形成统计分析报表; 各种数据库(Oracle、MS SQL SERVER等)监控管理,包括数据库的重要配置参数以及运行状况的监控。主要关注数据库的关键指标,如SGA使用率、表空间占用情况、锁竞争和使用情况、缓冲区命中率等; 其它应用的监控管理,支持IIS、Tomcat、DNS、weblogic、Tuxedo等 实现对某种业务服务水平的管理。通过业务服务管理,可以某种业务在过去一段时间内的运行状况有一个总体的评价和衡量。 实现IT资源管理和业务系统的关联,可以从业务的视角进行IT管理。当
7、某台主机或者应用发生问题、产生告警时,系统管理员可以在第一时间发现该设备影响了哪个应用的正常运行。 统一的报告和报表,多台设备性能比较,其它格式导出,柱图、XY坐标、饼图、折线图,定期的运维报告等等 系统的自管理,系统的自我管理功能,包括角色管理,权限视图管理,资源管理等。1.3 本期管理目标在保证对现有的网络和系统没有太大影响的情况下,实现如下管理目标:u 建立统一的监控管理平台,消除各自为政的局面,消除管理对象之间的差别,消除数据采集手段的差别,消除管理软件的差别,对各种不同数据来源数据统一处理、统一展现、统一用户登录、统一权限控制。u 建设开放、具有良好扩展性的监控管理平台。监控管理平台
8、应具有很好的开放性,保证跟相关系统的集成。监控管理平台应具有良好的扩展性,不仅可以满足现阶段XXXXX运维系统管理的需要,未来,随着鄞州业务的不断发展,监控功能添加,或管理节点数量增加时,监控管理平台也可以很好满足XXXXX的需求。u 实现针对网络设备的高效管理,包括自动拓扑,设备监控,链路流量监控,网络性能分析。u 实现针对各种小机,PC服务器的高效管理,包括可用性,性能,配置等管理。u 实现监控系统自动产品监控事件,并通过邮件,短信等多种方式第一时间通知IT管理员。2 方案功能详述本技术方案建议书是根据XXXXX运维管理项目需求而撰写,介绍了Mocha BSM运维管理系统的逻辑架构、部署方
9、式和功能特点。并在分析XXXXX运维管理项目需求的基础上,结合XXXXX的运维管理现状及未来管理模式,详细阐述了摩卡公司针对XXXXX服务器管理、网络管理、报表管理、的整个解决方案。2.1 网络拓扑管理 XXXXX要求能自动发现全网网络拓扑,图形化显示物理拓扑,直观清晰地显示全网所有骨干网络设备(主要为Cisco、迈普、神码等)、子网和互联关系Mocha BSM完全满足XXXXX要求:Mocha BSM自动发现全网络的物理拓扑图,并能够自动更新拓扑图。图形化显示物理拓扑,直观清晰地显示全网所有骨干网络设备、子网和互联关系,支持VLAN、 OSPF、MPLS的拓扑。为了支持网络拓扑的发现,Moc
10、ha BSM支持主流的LAN、WAN等网络协议,包括:n IPn MPLSn PPPn HDLCn FrameRelayn ATM等作为一个网络管理系统,管理员希望所见到的管理界面是现实世界对象的真实反映。Mocha BSM内置的网络自动发现引擎,能够快速的发现企业中二层和三层的网络设备,并根据发现设备之间的关系自动生成全局的网络拓扑结构图。Mocha BSM自动发现时使用ICMP、SNMP这两种协议。网络管理人员能够看到整个运营网络系统的网络拓扑结构,包括各个分布地区的子网、各个子网之间的网络连接关系、及其每一子网上的资源。经过网络拓扑结构的生成后,可以在拓扑图上看到整个网络的拓扑结构图,并
11、能直观地看到各个资源的状态变化。当网络中的结构发生变化时,自动发现引擎能够迅速的发现并及时调整网络的拓扑结构图,保证了与实际网络状态的一致。Mocha BSM可以自动发现以下信息:n 第二层和第三层网络设备n 网络协议,包括TCP/IP、Ethernet、Mpls-vpn、FDDI、ATM、帧中继、令牌环等n 设备包含信息(如卡、端口、接口、IP 和MAC)n 设备之间的物理连接和逻辑关系n 设备连接信息(如电缆、中继、网络连接和VLAN)通过对网络节点状态的轮询,Mocha BSM可以实时监控网络中所有资源的状态。拓扑图上所显示的各被管对象的颜色可以直接反映出其内部被监控对象的状态。如绿色表
12、示用户所关心的对象正常运行,黄色表示警告信息,红色表示严重错误。当我们从表面看到这些状态信息后,利用与数据库的关联功能可以进一步进入被管对象内部,详细查看到底是什么因素造成该设备的状态变化。包括链路流量的大小变化,链路使用率的变化,以及包长,错包率,误包率,ARP包率等信息的变化等。图表 2.1 自动发现二层网络拓扑图图表 2.2 自动发现三层网络拓扑图Mocha BSM支持视图管理。当用户网络设备大量增加之后,网络结构异常复杂,用户的网络拓扑就很难在一个荧光屏上展现或者很难找到想查阅的网络拓扑。Mocha BSM为使网络的展现和管理更适用,支持网络视图功能。管理员可以对拓扑图的节点进行区域,
13、组或网段的管理,比如按照不同地区,组或网段将设备划分到不同视图中。同时,对不同视图可分配不同用户的浏览权限。这样可实现资源管理的规范性和高效性,同时也保证了安全性。由于有些网络存在某些比如租用的线路,拓扑生成发现不到这些节点之前的实际链路。系统管理员可以在网络节点之间绘制手工连线,代表节点之间实际存在的链路,并可设置连线的粗细、颜色、虚线线型来显示此种链路的特殊性。管理员也可根据实际情况删除手工连线。这让整个拓扑图更加完整。网络拓扑提供了个性化的设置功能:页面设置,视图管理和权限管理。其中:n 管理员可自定义拓扑节点状态的刷新速率n 定义节点图标的4种显示大小n 为了引起关注,有故障的链路和宕
14、机设备,可以设置闪烁效果。为更清晰,更直观的展现遍布各省市、全国、全球的庞大的广域网,系统默认提供了中国、世界地图背景,管理员也可以根据实际的拓扑显示上传相应的图片来更换背景。这样可以把网络节点摆放到地图上合适的地点,使得网络视图管理更加直观易懂。图表 2.3网络拓扑图的视图管理 Mocha BSM支持对网络设备PING监控,可监控交换机端口;支持拓扑显示网络设备的实际流量,支持网络设备流量告警 网络拓扑左键点击设备,通过小工具的链接,可以直接管理网络设备背板、流量等信息,就和工作人员亲临机房一样如图:链接到背板管理信息; 2.2 网络性能检测Mocha BSM可对网络设备、服务器、PC的端口
15、出入流量、丢包、错包率、链路出入流量及丢包、错包率、Ping延时及丢包率、CPU、内存利用率做出全面的监控和分析。图表 2.4网络设备性能参数设定1图表 2.5网络设备性能参数设定22.2.1 网络设备的管理功能Mocha BSM对网络设备的管理,不仅仅局限在网络设备本身。Mocha BSM网络管理模块除可以实时监控网络设备自身的CPU利用率、网络设备内存利用率、网络设备端口通断等自身的指标外,还可以从更低层次、更细粒度来监控网络设备端口的情况,包括端口的名称、操作管理状态、接口发送接受速率、端口的ICMP包率、端口的通断信息、端口的发送接收包率等等,并产生报表,以各种方式展现。Mocha B
16、SM对网络设备的可用性监控以红、绿、黄、灰 状态灯展示,管理员可以一目了然地看到发生故障的设备及当前接口的性能。图表 2.6网络设备端口的流量图表 2.7网络设备信息Mocha BSM支持网络链路监控。对网络设备的可用性的监控的同时,设备之间的链路可用性的可视化管理更直观的展示了网络设备的运行状态。链路的畅通与否以红、黄、灰、绿四种状态显示,根据这些状态,管理员可直观地看到故障发生的范围所在,大幅度减少查找故障的工作量。图表 2.4网络链路监控同时,Mocha BSM支持对网络设备日志的收集和处理,当网络设备产生日志后,可以发送给Mocha BSM,并经Mocha BSM统一处理后产生告警。通
17、过产品的二次开发,可以实现网络设备真实设备面版图查看,设备面版视图可以拖动、缩放,同时支持多张设备真实面版图同时查看,支持在面版图界面上直接显示设备端口所属Vlan,能够提供网络设备端口下联设备列表。支持网络设备的TOP N排名。设备CPU、内存、端口的速率、流入/流出量、利用率等指标可以进行统计排名,并以TOPN的形式展现。为方便在复杂的网络拓扑中查看某些设备,Mocha BSM提供了灵活的设备搜索功能,用户可以定义多种搜索条件来查找网络设备。搜索的条件包括:设备名称、IP地址和设备类型。并且可以将设定好的查询条件保存起来便于以后的搜索。通过搜索,网络管理人员可直接查看特定的服务器或网络设备
18、的运行状态、性能状况,对网络的资源状况有一个细致的了解。Mocha BSM网络监控模块支持IP地址和MAC地址定位功能,当网络中某一台主机感染病毒,需要断开网络时,Mocha BSM的IP地址定位可以通过主机的IP地址查找到该主机连接的网络设备端口号。由于Mocha BSM系统中已经有IP-MAC地址-网络设备的对照表数据,所以Mocha BSM还支持IP-MAC-设备端口绑定,支持全网IP定位等功能。图表 2.5IP地址、MAC地址定位Mocha BSM网络监控模块支持网络设备的配置变更,当网络设备的配置发生变化,比如CPU、内存、端口数目或者startup Config文件发生变化时,Mo
19、cha BSM会自动发现并告警通知用户。针对网络设备的配置备份,可根据具体的设备二次开发实现。Mocha BSM通过底层关联来展示网络设备的性能和该设备在网络拓扑中的位置。当浏览一台网络设备的性能时,可以通过定位功能迅速查找到这台网络设备在网络拓扑中的位置。反之亦然。网络设备发现和监控需要开放设备的SNMP,Mocha BSM支持标准的SNMP版本包括SNMP V1,SNMP V2c和SNMP V3。Mocha BSM支持网络的根本原因分析,当网络中某一台网络设备发生问题影响其它的网络设备时,Mocha BSM可以找到根本原因。Mocha BSM系统的网络设备性能管理,可以查看网络设备端口流量
20、、利用率等监控指标的历史性能数据。图表 2.6网络性能管理网络的历史数据记录与分析管理:通过Mocha BSM的报告功能,可以订阅关注设备的性能、可用性报告。2.2.2 路由器监控指标举例资源指标类别指标名称(67个)英文名称Router可用性指标网络设备在线可用性Network Device Availability性能指标CPU平均利用率Avg CPU Percent Utilization内存利用率Memory Percent Utilization网络设备内存池占用容量Total Used Memory网络设备内存池可用容量Total Available Memory总接收吞吐量Rec
21、eive Throughput总发送吞吐量Transmit Throughput吞吐量Throughput丢包率Discard Packets Per Second所有接口接收的丢包数Receive Discard Packets Per Second所有接口发送的丢包数Transmit Discard Packets Per Second接收和发送ICMP包率Receive & Transmit ICMP Packets Per Second发送的ICMP包率Transmit ICMP Packets Per Second接收的ICMP包率Receive ICMP Packets Per S
22、econd信息指标网络设备的OIDOS ID连续运行时间Uptime网络设备说明Network Device Info交换机下的IP地址Contained IP网络设备MAC地址MAC Address配置指标Cisco Config状态Cisco Config StatusCPU个数No. CPU内存总容量Total Memory Capacity网络接口个数No. NICIP地址IP Address网络设备名称Network Device NameCPU(子资源)性能指标CPU利用率CPU Percent Utilization信息指标CPU名称CPU NameCPU ID号CPU Freq
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 管理 系统 方案

链接地址:https://www.31ppt.com/p-2388329.html