NMC监控工具使用指南及应用案例.doc
《NMC监控工具使用指南及应用案例.doc》由会员分享,可在线阅读,更多相关《NMC监控工具使用指南及应用案例.doc(76页珍藏版)》请在三一办公上搜索。
1、 NMC监控工具使用指南及应用案例概述2系统要求3架构4部署5部署环境(以NCWAS垂直集群为例)6部署步骤6进程监控13功能概述13MW-XX的监控13DB-XX的监控16线程监控19功能概述19线程信息说明21监控设置22汇总显示24显示过虑25联查操作员26联查数据库27数据库27功能概述27监控客户端功能27CPU监控31功能概述31监控客户端功能31内存监控31功能概述31监控客户端功能32日志抽取32功能概述32NC客户端日志级别设置32日志数据库33NCLOG日志抽取35抽取JVM日志40抽取CPU42抽取内存日志44监控消息和快照信息日志46操作员信息47消息中心48功能概述4
2、8监控客户端功能50安全设置52功能概述52监控客户端功能52参数设置53功能概述53监控客户端功能53应用案例一54OVERVIEW54进程监控54线程监控56日志抽取58DB-监控62消息中心62应用案例二 某项目时常出现有几分钟登录不了NC67问题描述:67问题分析:67问题解决方案:75概述对于NC这样一个复杂庞大的系统而言,监控体系非常重要而且富于挑战性。主要表现如下几点:1.NC是多层架构的系统,涉到到客户端,网络,操作系统,中间件,数据库.系统可能出现在任何一点出现异常。2.缺乏离线分析定位的能力。大量的问题只能通过问题再现等方式在线定位。这就要求客户配合,可能还要反复的搭建环境
3、。效率低下,限制多多。3.有很多问题只有专家级的人才能定位。对于不非常了解系统的管理员不知如何下手。4.日志作为分析问题很重要的部件,但其数量庞大,分析起来费时费力,不得要领。5.系统缺乏自我纠正的能力。某个服务器一旦出现问题,比如长时间不响应,只有客户报告后,逐个端口检查一遍才能确定那个服务器有问题, 而且只能管理员手工解决。6.缺乏系统评估的客观数据。对于系统的吞吐量,cpu,内存,并发量,每次远程调用的性能指标等缺乏必要的客观数据。7.监控目标繁多,缺乏统一集成的监控平台。 . 其重要性表现为:1.好的监控系统可以快速发现,定位问题,大幅度降低维护成本,提高管理效率,提高客户满意度。2.
4、在测试阶段,可以快速的发现并定位问题,提高产品质量。3.提供系统自我恢复能力。提高系统可靠性.对于上述问题,nmc智能监控系统主要提供如下特性:1.提供一种集成的监控界面。涵盖了作为问题关注者需要关注的各个方面。使用者可以从多个角度对系统监控和分析。2.提供一种端到端的监控体系。监控可以从客户端到应用服务器到数据库都可以无缝监控。3.各个层次可以相互穿透.追踪整个操作流程.进程可以穿透到线程,线程可以穿透到数据库,数据库可穿透到线程。各个层次的部件可以相互穿透。客户端端可以主动录制自己的操作日志。操作日志本身就提供了多层次的数据。以远程调用为核心,提供服务器端的性能统计,可以联查到客户端的远程
5、调用堆栈,可联查数据库的操作及性能统计。4.支持插件的可扩展架构,基于服务中心模型集群架构只要满足客户端或者服务器端的规范的插件就可以很容易地集成进来。监控服务可以部署到任何一个服务器上,一个监控域可以同时监控多个服务器。在一个监控域内,所有的服务和配置都统一管理,统一发布。大大提供系统的可监控性和可管理性。5.主动监控系统提供了一种消息机制。任何监控插件都可以在系统异常情况下可向服务中心发送消息。消息中心根据每个服务的配置对消息进行报警或者生成快照。这些报警信息或者快照可以通过短信或者邮件通知管理员。管理员利用这些消息可快速采取措施。6.主动管理,自我纠正系统提供了一种机制,监控到系统处于不
6、健康的状况对系统进行管理。管理的动作是可以配置的。比如,自动重启,或者生成dump.系统还提供了n+1standby的支持。即有一个standbyserver,在某个server重启时,替换此server继续工作。7.强大的日志抽取和分析能力可用非常灵活的条件对多个服务器上的日志抽取。包括nc日志,jvm,cpu,memory等日志。并且提供了大量的日志分析脚本来分析日志。操作员也可主动录制自己的操作日志。可将日志打包后发给相关人员进行分析。8.同时支持实时监控和事后分析。9.采用监控服务提供的安全机制,不用泄漏目标系统的安全信息。系统要求1数据库监控的脚本包括客户端的一些性能监控脚本目前只是
7、支持oracle9i及以上版本。架构 名词解释:监控域:指向同一个服务中心的一组监控进程,这些监控进程可以分布在多个物理服务器上。服务中心(Service Center) :用于注册监控域内所有的服务和资源,同时提供服务启动控制、访问日志、服务请求路由、安全检查、动态参数刷新功能。一个监控域内有且只有一个服务中心,所有的监控进程必须指定到一个已经启动的服务中心。插件说明:后台服务以服务插件的形式提供,配置文件conf/service.xml定义了服务中心地址,服务的属性。包括服务名、是否启动、是否需要安全检查、是否域内唯一、消息处理方式、快照项目。新开发的服务可以直接在service.xml注
8、册。服务启动引擎根据服务配置启动服务,每个服务启动后会向服务中心注册。客户端通过访问服务中心可以把可以访问的服务资源下载到本地。客户端同样采用了插件式的架构,通过配置文件conf/resource/resource-client.xml配置每个服务对应的客户端UI。每个监控域的信息都保存在conf/resource/domain.xml文件中,每次启动客户端会自动连接domai.xml文件中的监控域。 服务中心提供了一种简单的安全机制。管理员可以配置一个用户名和密码。需要安全保护的服务需要通过这个认证才可以被访问。比如数据库,只有通过了安全检查服务的认证才能对数据库操作。部署典型部署图(推荐)
9、: 典型模式是 监控服务中心部署在NC的服务器上,监控服务也同时部署在NC的服务器上。独立部署模式:Monitorserver可以部署到一个独立服务器上,但这样不能监控NC Server的NCLOGS、CPU和内存,同样也不能抽取NC Server的NCLOGS,CUP和内存的日志。部署环境(以NCWAS垂直集群为例)ServerHost10.10.71.156服务节点master、ncMem01、ncMem02应用代码目录D:ufsoftnc56APACHE目录D:IBMHTTPServer中间件was6.1.0.11.DM server启动在10.10.71.156,管理端口为8879数据
10、库ORACLE10G部署步骤1:配置服务中心:在server上启动D:ufsoftnc56nmc serverconfigure.bat,设置service center,。这里将服务中心设置为10.10.71.156,管理员默认为admin,密码为admin,端口9999为系统默认,尽量不要改,如果改为其他端口,需要同时改D:ufsoftnc56nm6serverconfserver.xml文件修改对应的端口。 同时修改%nchome%/resources/monitor.properites对应的端口。Local Server中的host可以设置为127.0.0.1或本机的IP地址10.1
11、0.71.156。D:ufsoftnc56nmcserverconfigure.bat命令的运行界面如下:说明:运行configure.bat命令需要设置JAVA_HOME: set JAVA_HOME=JDK存放的目录, 如:set JAVA_HOME=././ufjdk 或set JAVA_HOME=D:ufida502nchomeufjdk同样,其它命令,如startmonitor.bat, MonitorConsole.bat等也需要同样的设置。 如果是水平集群,则在从服务器上运行.nmcserverconfigure.bat命令,需要将Server Center中 Host项的值,设
12、置为主服务器的IP地址如:10.10.71.156. Local Server中的host项的值是从服务器的IP地址 如 10.10.71.157 或127.0.0.1注意:Unix如果服务器操作系统无法启动图形界面,可以直接修改配置文件nmcserverconfservices.xml。配置监控安全管理员,可以通过命令securityset.sh修改。2:设置WAS DM服务器,在D:ufsoftnc56nmcserverconfigure.bat的运行界面上的属性配置(monitor.properites)的tab页中修改属性nodeagenthost,nodeagentport。如果不是
13、WAS中间件,则将nodeagenthost设置为空。 如果monitor server监控工具安装在单独的一台机器,则同样需要nodeagenthost设置成集群中WAS DM服务器的IP地址。如果是单个server,没有dm,nodeagent,则查看这个server对应的serverindex.xml或者通过管理控制台,得到SOAP_CONNECTOR_ADDRESS。将nodeagentport设置为这个端口。默认应该是8880。 3:确保D:ufsoftnc56ierpbinprop.xml文件的配置和实际环境的配置相同.特别是中间件为websphere的情况下,prop.xml可能
14、会存在和实际环境不同的情况,因为监控工具通过读这个文件来获取中间件和数据库的信息,所以,必须要确保这个文件的配置和真实环境的配置相符(包括中间件,数据库,web server ).可以通过ncsysconfig.bat对环境配置。 另外,如果上图中的propfile的值不是相对路径././ierp/bin/prop.xml,是指定的绝对路径,则需要用作为分隔符 如 d:monitornc56okierpbinprop.xml,否则启动时会提示找不到文件。特别说明:(1)如果在WAS管理控制台中更改了单个Server或者集群中某个成员Server的端口,一定要在NC的prop.xml文件中修改该
15、对应的端口。否则在NC5.5监控工具的客户端,将会检测不到该端口对应的Server信息。 WEB服务器的地址也要配置,不能为空。如下图(2)如果是数据库是RAC环境,需要prop.xml文件中将数据源拆分成两个针对单个实例的数据源.这样可以保证做快照和数据库检查的性能. 但是,部署时需要用原来的数据源。比如: jdbc:oracle:thin:(DESCRIPTION=(ADDRESS=(PROTOCOL=TCP)(HOST=10.12.167.11)(PORT=1521)(ADDRESS=(PROTOCOL=TCP)(HOST=10.12.167.12)(PORT=1521)(LOAD_BA
16、LANCE=yes)(CONNECT_DATA=(SERVER=DEDICATED)(SERVICE_NAME=ncdata)改成:dbsource11. jdbc:oracle:thin:10.12.167.11:1521:ncdata. dbsource12jdbc:oracle:thin:10.12.167.11:1521:ncdata.4:消息自动发送邮件的功能邮件配置:邮件服务器(SMTP)可以是任何有效的邮件服务器,如但是,帐号和密码填写针对“发送邮件服务器”有效的帐号和密码。 邮件发送的地址: 在下面属性配置页签,配置消息自动发送到的邮件地址。说明: 邮件发送的地址是填写 任何有
17、效的邮件地址。如: xxx或 xxx 5:在server上启动D:ufsoftnc56nmcserverstartmonitor.bat如果是水平集群,则主服务器启动后,再在从服务器上对应目录运行startmonitor.bat6:启动客户端.可以直接访问http:/10.01.71.156:9999/nmc/client.exe下载客户端。也可以将D:ufsoftnc56nmcclient拷贝到任意一个客户端机器.执行D:ufsoftnc56nmcclientmonitorconsole.bat, 第一次执行在没有监控域的情况下,需要添加监控域, 监控域名称任意,服务中心地址为:10.10.
18、71.156,端口9999,用户名admin,密码xxxxx,(都是在步骤2中配置的)。说明:启动monitorconsole.bat需要设置JAVA_HOME, 如set JAVA_HOME=D:ufida502nchomeufjdk7. 如需要通过代理(192.168.8.108:8080)访问远程的监控服务:monitorconsole.bat增加参数:-DproxySet=true -DproxyHost=192.168.8.108 -DproxyPort=8080 启动后提示如下:需要增加监控域域名可以随意写入NC某项目或10.10.71.156,服务中心地址必须写服务中心(Serv
19、ice Center)的IP地址:如 10.10.71.156 启动后的客户端如 注:进入上图方式:选择一个监控域,工具-overview,或者第一次登陆到监控系统的第一个页面,提供一种整个监控系统的概要信息。主要功能: 1.展现整个系统的部署方式.包括apache,中间件,数据库.2.动态显示中间件的和数据库的性能指标.中间件动态柱状图显示jvmheap信息,和web线程信息,数据库柱状图显示数据库活动会话的个数.如: 鼠标点中上图的ncMem02图标,会自动显示该成员的信息如下: 3.报警.如果某个server有报警信息,则相应的服务器会变红,鼠标点上去会显示报警信息.4.服务器端主要的配
20、置文件: (1)安全设置:Monitor/server/conf/security.properties,用于设置对需要安全验证的服务访问的权限用户(2)服务配置:monitor/server/conf/services.xml: (3)各种监控参数配置:monitor/server/conf/monitor.properties 进程监控功能概述进程监控服务主要实现如下功能:1:定时对中间件状态检查,包括端口响应的时间和内存使用的情况,如:当发现中间件不能正常工作,则可以对其自动重启。2:定时将jvm heap的使用情况和中间件webthread,serivcethread信息写入日志,通过
21、日志抽取和分析的功能可以对系统进行性能评估和性能诊断。3:定时更新数据库连接池的信息和数据库活动会话的信息。4:如果是WAS中间件,提供对中间件的管理功能,比如重启,生成javacore,heapdump,设置定时重启等。通过上面的进程监控功能,可以获取NC服务的运行状态、Webcontainer线程池的大小、当前远程调用线程数、当前后台服务的线程数、Jvm heap的max值 、Jvm heap当前的free值、Jvm heap used值、数据库连接池的大小、数据库的活动会话数等,同时根据需要直接在监控工具中定时、关闭和启动NC服务等。MW-XX的监控客户端功能: 定时获得某个中间件的概要
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- NMC 监控 工具 使用指南 应用 案例
链接地址:https://www.31ppt.com/p-3043073.html