《服务器硬件培训.ppt.ppt》由会员分享,可在线阅读,更多相关《服务器硬件培训.ppt.ppt(57页珍藏版)》请在三一办公上搜索。
1、1,一、PC Server 基础知识介绍二、IBM PC Server产品介绍及故障诊断三、HP PC Server产品介绍及故障诊断四、DELL PC Server产品介绍及故障诊断,目录,一、PC Server基础知识介绍,PC Server的来源:PC Server 从PC机发展而来,在继承了X86架构的同时,加入了服务器的技术;PC Server的服务器特性:Availablity:可用性-即稳定性,指服务器能够持续稳定运行较长时间;实时的生产设备要求极高的稳定性,服务器必须能够长时间稳定和不间断的运行;这种要求除了对服务器的硬件质量有很高的要求外,也催生了一些服务器的技术:CPU的S
2、MP技术、内存的冗余、热插拔及镜像技术;硬盘的RAID技术;电源的热插拔技术、风扇的热插拔技术等等;Scalability:可扩展性-可以进行扩容;高要求、高质量、复杂的技术支持,导致了服务器的成本较高,从而要求设备具备可扩展性;业务的关键性、实时性,架构的复杂,让迁移也成为难点;设备的可扩展性,避免了性能瓶颈导致的业务迁移;服务器要有多个CPU、内存、电源、风扇、PCI插槽;高端服务器和存储的联机技术;,一、PC Server基础知识介绍,3.Usability:易使用性-相关的软件系统的设计;为实际生产需求产生的服务器,具备了相关的硬件技术;同时也要求相应的操作系统来使用和管理硬件;比如W
3、indows的Server版本;AIX;HP-UX;Solaris;Linux的企业版等;专业的系统是经过封装的,在易于使用的同时又加强了专业性,所以我们需要进行学习;4.Manageability:易管理性-硬件故障的在线修复和故障的预警机制;要让服务器易于管理,那么其故障的告警机制、诊断机制、在线修复机制必须要强;所以产生了冗余技术、备份技术、在线诊断技术、故障预警技术、内存纠错技术、热插拔技术和远程诊断技术等;,一、PC Server基础知识介绍,智能监控管理技术:我们必须对服务器的整体运行情况进行监控,所以监控管理技术会应运而生;首先,理解service processor服务处理器;
4、服务器基本都有service processor;只是各自运用的技术有些差别;设备上的关键部件总是有很多参数来表征他们的状态的,这些参数以电信号的方式通过I2C总线传给 service processor,service processor处理之后传送给专门的监控软件,软件就在其界面上表现 出来,呈现给管理员查看!设备上的每个重要部件都有传感器,传感器将收集到的部件状态通过I2C总线发送给service processor,这样子,监控软件,service processor,I2C总线和各部件的传感器连接起来形成了 一个网络,这个网络区别于设备硬件系统和操作系统,就是所谓的监控管理网络;主要
5、有以下几种技术:EMP-应急管理端口;需要拨号;很少使用;ISC&ISM-Intel 服务控制或管理;Intel架构;局域网通信;客户端监控;IPMI-智能平台管理接口;应用最多;内置BMC芯片,HP和DELL应用较多;SNMP-简单网络管理协议;可以使用工作站终端管理网络设备;,一、PC Server基础知识介绍,总线技术:目前的服务器,多采用I2C总线技术;I2C总线技术的作用是集中管理服务器的部件,并监控它们的状态,以便于管理;CPU技术:RISC:精简指令集;多用于小型机;CISC:复杂指令集;多用于PC机及PC Server;SMP技术:对称多处理器技术;保证了服务器的运算性能和冗余
6、性能;这个技术的存在让我们不会因为坏了多个CPU中的一个而导致设备宕机;DP技术:双处理器技术;SMP技术的低端版;NUMA技术:IBM特有技术,扩展性能;多台设备联机聚成一台性能更高的设备;,一、PC Server基础知识介绍,内存技术:ECC校验:只能修正1比特的错误;为了改善ECC性能:IBM:chipkill技术;HP:advanced ECC技术;内存镜像技术:单纯提高ECC校验位数是不能解决所有的内存问题的;内存镜像技术就应运而生;-类似于磁盘镜像技术;内存镜像技术可以支持内存热交换和热添加,可以在线解决内存问题和进行内存扩容;HP和IBM各有自己的内存镜像技术;在线内存备份技术:
7、可以使用备份的内存为使用内存做在线备份;类似于硬盘技术中的热备盘;内存RAID技术:类似于硬盘RAID技术,HP DL760灯型号设备上有使用;,一、PC Server基础知识介绍,硬件冗余技术:双份硬件;备用件处于待命状态;实时监控部件使用情况,一旦故障,备用件立即顶替,保证设备不宕机;比如:电源的冗余技术,保障供电;风扇的冗余技术,保障散热;热插拔和热添加技术:硬件冗余技术往往都伴随着热插拔和热添加技术;热插拔技术是指某些部件可以在系统运行的情况下进行插拔,不影响使用;热添加技术是指某些部件的空槽位可以在系统运行的情况下插入相应的部件,类似于USB设备的即插 即用;热插拔和热添加技术由特殊
8、的电路来实现,主要是热插拔控制器和针对槽位的电流控制器;,一、PC Server基础知识介绍,硬盘RAID技术:硬盘的容量、IO速度、容错能力都成为服务器的性能瓶颈;使用RAID技术,可以解决单硬盘容量小、IO速度慢、出错容易导致数据丢失等问题;要是有RAID技术,必须有RAID控制器和多块硬盘;主要有以下几种RAID级别:RAID 0:串接只是单纯扩大容量;并接在扩大容量的同时,提高磁盘的性能和吞吐量。没有冗余或错误修复能力,成本最小;RAID 1:RAID 1又被称为磁盘镜像,每一个磁盘都具有一个对应的镜像盘。对任何一个磁盘的数据写入都会被复制镜像盘中;系统可以从一组镜像盘中的任何一个磁盘
9、读取数据。能够在不影响性能的情况下最大限度的保证系统的可靠性和可修复性。成本最高;RAID 5:有3块以上硬盘组成,使用了校验的概念提供容错能力。总容量为=(N-1)*单盘容量;有较高的可靠性和可修复性;成本为一块盘的容量;,一、PC Server基础知识介绍,双网卡绑定技术 网卡故障及链路故障容易造成业务中断;使用软件,将两块网卡虚拟成一个网卡,对外进行通信;如果其中一块网卡或其链路出现故障,不影 响设备与外界的通信;主要的厂商有brodcom和intel;诊断技术:指示灯技术:通过指示灯或者液晶面板等手段对设备部件的状态进行监控;IBM:光路诊断板;HP:指示灯技术;新设备也开始使用光路诊
10、断技术;DELL:液晶面板告警技术;软件诊断:各厂商都使用各自的软件对设备节进行在线诊断;IBM:director;DSA HP:Homepage;SMH;SIM;DELL:openmanager Administrator;Dset;,二、IBM PC Server产品介绍及故障诊断,产品介绍:Netfinity系列-低端、早期产品 集成度低;配置低;技术简单;X系列-曾经的主流产品 集成度提高;性能提升;采用主流技术;System X系列-最新的产品 由X系列发展而来;各项性能均为顶端;目前各外地机场的IBM设备清单中,只有IBM System X 3650这一款机型;属于最新的产品系列,
11、而且3650本身也是IBM很经典的一款机型;,二、IBM PC Server产品介绍及故障诊断,IBM System X3650主要性能特征:CPU:Intel Xeon FC-LGA 771 双核,4M二级缓存,2个插槽;内存:12个DIMM插槽,单条大小可以为512M、1G、2G、4G,必须成对;内存必须为全缓冲DIMM(FBD)PC2-5300 DIMM,而且必须支持chipkill技术;光驱:IDE接口,可以是24倍速的CD,也可以是8倍速的DVD;硬盘:只支持SAS硬盘;可以为3.5英寸,也可以是2.5英寸;3.5英寸最多可以插6个,2.5英寸最多可以插8个;PCI:集成在主板上有两
12、个PCI E插槽,使用可选件可以支持PCI X的卡;风扇:标准5个,最多可以10个(支持冗余散热);电源:835W,最少一个,最多两个(支持冗余);RAID:主板上集成了RAID控制器,但是只有在安装了ServeRAID 8k 或8k-l SAS 控制器时才处于活动状态;ServeRAID 8k-l只支持RAID 0、1 和10;ServeRAID 8k,256 MB 带有备用电池,支持RAID 0、1、1E、5、6 和10;,二、IBM PC Server产品介绍及故障诊断,主要故障诊断方法:LED指示灯法:前面板LED指示灯、光路诊断板指示灯、后面板LED指示灯、主板LED指示灯;POST
13、 蜂鸣声代码、错误消息和错误日志:POST为开机自检;power on self-test;开机自检(POST)生成蜂鸣声代码和消息,以表明测试成功完成或检测到问题。诊断程序、消息和错误代码:IBM PC Server在只读存储器上集成了一个诊断程序;需要重启,按下F2键,运行诊断程序;ServeRAID manager程序:安装在系统中,在线查看RAID和硬盘状态 DSA程序:收集系统信息、底层硬件日志,借以判断硬件及系统状态;,二、IBM PC Server产品介绍及故障诊断,LED指示灯法:前面板:3.5英寸硬盘:2.5英寸硬盘:,二、IBM PC Server产品介绍及故障诊断,前面板
14、指示灯分析:不管是安装了3.5英寸的还是2.5英寸的硬盘,设备前面板的指示灯基本都一样,主要需要关注两个:操作员信息面板和硬盘驱动器状态指示灯;操作员信息面板:需要注意:硬盘驱动器活动指示灯:当该指示灯闪烁时,表明硬盘驱动器正在使用中。信息指示灯:当该指示灯点亮时,表明发生了一般性事件。光通路诊断面板上的某个指示 灯也会点亮,以帮助找出错误。系统错误指示灯:当该指示灯点亮时,表明发生了系统错误。光通路诊断面板上的某个指示灯 也会点 亮,以帮助找出错误。释放滑锁:将该滑锁滑向左侧可操作光通路诊断面板,该面板位于操作员信息面板的后 面。,二、IBM PC Server产品介绍及故障诊断,光路诊断板
15、分析:使用释放滑锁将光路诊断板拉出的时候,可以看到如下图所示:,OVER SPEC:电源功率超过最大额定值PS X:托架X 中的电源发生故障;CPU:微处理器发生故障;VRM:微处理器稳压器模块(VRM)上发生错误。CNFG:发生硬件配置错误MEM:当该指示灯点亮时,表明发生了内存错误。NMI:发生机器检查错误SP:服务处理器发生故障DASD:发生硬盘驱动器错误RAID:发生RAID 控制器错误FAN:风扇发生故障TEMP:系统温度已超出阈值级别BRD:系统板上发生错误PCI:PCI 总线或系统板上发生错误,二、IBM PC Server产品介绍及故障诊断,LED指示灯法:后面板:交流电源指示
16、灯、直流电源指示灯:每个热插拔电源都有一个直流电源指示灯和一个交流电源指示灯。系统错误指示灯:当该指示灯点亮时,表明发生了系统错误。光通路诊断面板上的某个指示灯也会点 亮,以帮助找出错误。和前面板上的系统错误指示灯对应;,二、IBM PC Server产品介绍及故障诊断,LED指示灯法:主板LED指示灯:在一些情况下,比如光路诊断板上的CPU MEM灯亮起了,我们并不能断定是哪个 槽位的部件故障了,这个时候就需要打开 机器上盖板,查看主板上哪个具体的部件 出现了故障,借以做具体的故障定位;,二、IBM PC Server产品介绍及故障诊断,POST 蜂鸣声代码、错误消息和错误日志:当您开启服务
17、器时,它会执行一系列测试来检查服务器组件以及服务器上的某些可选设备的运行情况。这一系列的测试称为开机自检或POST。如果设置了开机密码,则必须在出现提示时输入该密码并按Enter 键,才能使POST 运行。如果POST 完成且未检测到任何问题,则将发出单声蜂鸣声,且服务器启动完成。如果POST 检测到问题,则可能会发出多声蜂鸣声或显示错误消息,二、IBM PC Server产品介绍及故障诊断,POST 蜂鸣声代码、错误消息和错误日志:POST 蜂鸣声代码:蜂鸣声代码是或长或短的一组蜂鸣声,或是中间略微停顿的一系列短蜂鸣声。例如,“1-2-3”蜂鸣声代码依次发出一声短蜂鸣声、一次停顿、两声短蜂鸣
18、声、一次停顿和三声短 蜂鸣声。除一声蜂鸣声以外的蜂鸣声代码表明POST 已检测到问题。具体设备的蜂鸣声的含义,需要查看具体的手册;我们只需要能判断出嗡鸣声是什么长短组合,具体代表的故障含义可以交由后台判断;,二、IBM PC Server产品介绍及故障诊断,POST 蜂鸣声代码、错误消息和错误日志:错误消息和错误日志:POST 错误日志包含POST 过程中生成的三个最新的错误代码和消息。BMC 系统事件日志包含受监视的事件,例如达到阈值或设备发生故障。BMC 系统事件日志的大小受限制。当日志到达上限后,新的条目不会覆盖现有条目;因此,必须通 过Configuration/Setup Utili
19、ty 程序定期清除BMC 系统事件日志 可以从Configuration/Setup Utility 程序查看POST 错误日志、BMC 系统事件日志和系统事件 错误日志的内容。您还可以从诊断程序查看BMC 系统事件日志的内容。从Configuration/Setup Utility 程序查看错误日志 开启服务器当提示Press F1 for Configuration/Setup 出现时,请按F1 键。要查看POST 错误日志,请选择Event/Error Logs,然后选择POST Error Log。要查看BMC 系统事件日志,请选择Advanced Setup-Baseboard Ma
20、nagement Controller(BMC)Setting-System Event Log。要查看组合的系统事件错误日志和POST 错误日志,请选择Event/Error logs,然后选择System Event/Error Log。,二、IBM PC Server产品介绍及故障诊断,POST 蜂鸣声代码、错误消息和错误日志:从诊断程序查看BMC 系统事件日志 不论是通过Configuration/Setup Utility 程序查看还是诊断程序查看,BMC 系统事件日志所包含的信息都是相同的。要查看BMC 系统事件日志,请完成以下步骤:1.如果服务器正在运行,请关闭服务器和所有已连接
21、的设备。2.开启所有已连接的设备;然后开启服务器。3.当提示F2 for Diagnostics 出现时,按F2 键。如果您同时设置了开机密码和管理员密码,则必须 输入管理员密码才能运行诊断程序。4.从屏幕顶部选择Hardware Info。5.从列表中选择BMC Log。,二、IBM PC Server产品介绍及故障诊断,POST 蜂鸣声代码、错误消息和错误日志:清除错误日志 要清除错误日志,请完成以下步骤:1.开启服务器。2.当提示Press F1 for Configuration/Setup 出现时,请按F1 键。如果您同时设置了开机密码和管理员密码,则必 须输入管理员密码才能查看错误
22、日志。3.执行以下某个步骤:要清除BMC 系统事件日志,请选择Advanced Setup-Baseboard Management Controller(BMC)Setting-BMC System Event Log。选择Clear BMC SEL。要清除系统事件错误日志(如果存在)或POST 错误日志,请选择Event/Error Logs,然后选择Post Error Log 或System Event/Error Log。当显示任何日志条目时,按Enter 键(每个条目页面上会突出显示Clear xxxx log,其中xxxx 是正在查看的日志名 称)。注:每次系统重新启动时都会自动
23、清除POST 错误日志。至于日志的具体含义,我们可交由后台分析,我们只需要清楚怎么抓取日志即可;,二、IBM PC Server产品介绍及故障诊断,诊断程序、消息和错误代码:诊断程序是测试服务器主要组件的主要方法。当您运行诊断程序时,文本消息和错误代码将显示在屏 幕上,并保存到测试日志中。诊断文本消息或错误代码表明已检测到问题。运行诊断程序:要运行诊断程序,请完成以下步骤:1.如果服务器正在运行,请关闭服务器和所有已连接的设备。2.开启所有已连接的设备;然后开启服务器。3.当提示F2 for Diagnostics 出现时,按F2 键。如果您同时设置了开机密码和管理员密码,则必须输入管理员密码
24、 才能运行诊断程序。4.从屏幕顶部选择Extended 或Basic。5.从诊断程序屏幕中选择要运行的测试,然后按照屏幕上的指示信息进行操作。诊断硬盘驱动器时,请选择SCSI Attached Disk Test 进行最全面的测试。对以下情况选择Fixed Disk Test:想运行更快的测试;服务器包含RAID 阵列;服务器包含SATA 或IDE 硬盘驱动器。诊断文本消息 Passed:测试完成并且未出现任何错误。Failed:测试检测到一个错误。User Aborted:您在测试完成之前停止了它。Not Applicable:您试图测试服务器中不存在的设备。Aborted:由于服务器配置问
25、题,测试无法继续。Warning:无法运行测试。正在测试的硬件没有故障,但其他地方可能存在硬件故障或是另一个问题导致测试无法 运行;例如,可能存在配置问题、硬件可能丢失或无法,二、IBM PC Server产品介绍及故障诊断,ServeRIAD Manager程序:IBM使用ServeRIAD Manager程序使用和管理RAID组和磁盘;ServeRIAD Manager是安装在操作系统中的软件,打开之后可以看到如下图所示的界面,可以根据其内容看到RAID和硬盘的状态;,二、IBM PC Server产品介绍及故障诊断,DSA程序:版本介绍:DSA有两个版本,一个版本是PortableEdi
26、tion,一个版本是InstallableEdition。使用安装版本,就在系统中安装了此程序,以后运行此程序就可以进行那个抓包;运行该下载文件将DSA安装到硬盘上,安装在c:ProgramfilesIBMDSA,在正常运行的程序文件列表中选择“IBMDynamicSystemAnalysis”,再选择“IBMDSA”运行即可收集信息。收集的信息文件保存在 c:IBM_Support目录下,生成一个文件和一个目录;文件格式:型号_序列号_年月日_时分秒.xml.gz,目录名格式:型号_序列号_年月日_时分秒。使用非安装版本,每次抓包都需要运行一次 PortableEdition的程序;收集的信
27、息文件保存在c:IBM_Support目录下,文件格式:型号_序列号_年月日_时分秒.xml.gz。将收集的信息包发给后台进行分析处理即可;,三、HP PC Server产品介绍及故障诊断,产品介绍:HP 公司的PC服务器也就是ProLiant系列服务器;HP称之为Prliant工业标准服务器;惠普 ProLiant 工业标准服务器包括:ProLiant DL 系列::高密度机架式服务器系列;提供最高灵活性及管理能力 ProLiant ML 系列:高扩展性服务器系列;为实现最高内部存储及I/O灵活性所专门设计 ProLiant BL 系列:超密度刀片式服务器系列;为实现迅速部署与管理 ProL
28、iant SL 系列:可扩展系列 DL和Ml是应用最广泛的机型,其中又以DL系统最多;DL:机架式;ML:塔式;命名规则:以DLxyzGm或MLxyzGm命名,x表示系列;y表示小系列,DL的一般为偶数,ML为奇数;z表示CPU类型,0为Intel,5为AMD;m表示是第几代;我们这边的HP的机型为DL 380G5;,三、HP PC Server产品介绍及故障诊断,HP DL 380 G5主要性能特征:CPU:Intel Xeon 5160双核,4M二级缓存,2个插槽;内存:8个DIMM插槽,单条大小可以为512M、1G、2G、4G,必须成对;A bank的两条必须有;内存为FBDIMM,PC
29、2-5300F,Fully-Buffered DIMMs;光驱:IDE接口,可支持CD和DVD;硬盘:可支持SAS和SATA硬盘;PCI:主板上有2个PCI E插槽;还有单独的PCI Cage;风扇:最多可以8个(支持冗余散热);实际使用量需要根据CPU个数调整;电源:800W,最少一个,最多两个(支持冗余);RAID:配有 64MB 高速缓存的智能阵列 E200 控制器(RAID 0/1);,三、HP PC Server产品介绍及故障诊断,HP DL 380 G5主要故障诊断方法:LED指示灯法:前面板LED指示灯、Systems Insight Display板指示灯、后面板LED指示灯;
30、Smart Start CD离线诊断法:HP Smart Start CD可以对设备进行离线测试和诊断;SMH程序:安装在系统中,在线查看设备状态,也可以进行在线测试和诊断;使用ILO口进行诊断:ILO接口是HP设备的专用接口,可以对其配IP地址进行远程管理;ILO口可以执行远程开关机、监控设备状态等;,三、HP PC Server产品介绍及故障诊断,HP DL 380 G5主要故障诊断方法:LED指示灯法:HP DL380 G5的前视图如右所示:在右图中,可见设备前面板有6部分;其中,对我们诊断有帮助的主要有三部分:1、内外部健康指示灯;2、Systems Insight Display板指
31、示灯;3、硬盘指示灯;内外部健康指示灯 如右图所示:,三、HP PC Server产品介绍及故障诊断,HP DL 380 G5主要故障诊断方法:内外部健康指示灯:如右图所示,内外部健康指示灯有如下几部分组成:1、UID LED 按钮,按下它,会以蓝光点亮;这个灯主要是用来给设备定位的;设备后面会有性对对应的UID LED 按钮;2、Internal health LED:绿灯:正常;黄灯:设备降级,机箱内部部件有故障;红灯:设备危机,内部部件有严重故障;3、External health LED:绿灯:正常;黄灯:电源失去冗余;红灯:电源故障;4和5、NIC 1或者2 link/activit
32、y LED:绿灯:网络链路正常;绿灯闪烁:网络正在活动,有数据传输;灭:无网络链路连接;6、Power On/Standby button/system power LED:绿灯:设备已开机;黄灯:设备已关机,但仍有电力供应;灭:没有电力供应;,三、HP PC Server产品介绍及故障诊断,HP DL 380 G5主要故障诊断方法:Systems Insight Display板指示灯:如右图所示,Systems Insight Display板指示灯有如下几部分组成:1、Online spare指示灯(对内存而言):灭:没有开启内存保护功能;绿灯:开启了内存保护功能;黄灯:发生内存故障;黄
33、灯闪烁:内存配置错误;2、Mirror指示灯(对内存而言):灭:没有开启内存镜像功能;绿灯:开启了内存镜像功能;黄灯:发生内存故障;黄灯闪烁:内存配置错误;3、其他所有指示灯:绿灯:正常;黄灯:对应部件故障;注意:HP的Systems Insight Display板能够定位到具体槽位的 CPU或者内存故障;比IBM的光路诊断板先进;,三、HP PC Server产品介绍及故障诊断,HP DL 380 G5主要故障诊断方法:后面板指示灯:有以下几个灯需要注意:1、Power supply LED:绿灯:正常;黄灯:故障;2、UID LED 按钮:和前面板的UID LED按钮对应;3、网络接口活
34、动指示灯:绿灯或者绿灯闪烁:网络链路是活的;灭:没有网络活动;4、网络接口链路指示灯:绿灯:有网络链接;灭:没有网络链接;,三、HP PC Server产品介绍及故障诊断,HP DL 380 G5主要故障诊断方法:Smart Start CD离线诊断法:HP 设备都会随机附带一张Smart Start CD,除了在安装操作系统时提供驱动和软件之外,Smart Start CD还可以原来对设备部件进行检测和诊断;Smart Start CD的使用详见:SmartStart使用详解.doc,HP 管理软件介绍-SMH软件HP 的SMH软件是一个单系统管理软件,我们常常在巡检中使用它来检查底层硬件配
35、置和设备健康状态;HP System Management Homepage 为单个系统管理提供整合的界面。HP System Management Homepage 提供了一个使用方便的通用界面,该界面通过汇集 HP基于 Web 的代理以及管理实用程序提供的数据,可显示单个服务器的硬件故障和状态监视、性能数据、系统阈值、诊断信息以及软件版本控制。它具有以下特点:1、是web界面的;2、不仅能管理windows,还能管理linux和HP-UX;3、是单系统管理软件,一般在本机安装,也只能管理本机;SMH主要有以下几个模块:hardware fault and status monitoring
36、-监控硬件状态,发现硬件错误;performance data-性能分析;system thresholdsdiagnostics-诊断系统software version control for an individual server-软件版本管理;,三、HP PC Server产品介绍及故障诊断,HP 管理软件介绍-SMH软件(续)管理软件如下图所示:,三、HP PC Server产品介绍及故障诊断,HP 管理软件介绍-ACU:HP ACU(Array Configuration Utility)用于创建,配置和管理逻辑驱动器。也可用于初始化和重新扫描硬盘。使用ACU可以直接查看RAID
37、卡、Array、Logical Drivers及硬盘的信息和状态的。ACU的操作界面如下图所示:1、运行ACU:开始-程序-HP System Tools-HP Array Configuration Utility-Setup HP Array Configuration Utility2、如果ACU没有配置执行模式,运行ACU的时候会出来一个提示窗口让你配置,如右图:,三、HP PC Server产品介绍及故障诊断,HP 管理软件介绍-log viewer:Log viewer是一个日志管理工具,和SMH中的log是一样的;使用它可以很简便的查看系统发生的事件,包括故障:路径:开始-程序-
38、HP System Tools-log viewer;,注:HP的PC Server的管理和维护思路是一致的,其他的机型并不存在不同;,三、HP PC Server产品介绍及故障诊断,HP 管理工具介绍-ILO:iLO是Intergrated Light-Out的缩写,是惠普特有的远程管理功能,目前最新的版本是iLO2。通过iLO2可以实现硬件级别的服务器远程管理,包括开关机、重启、服务器状态的监控、虚拟KVM等。目前在惠普3、5、7系列服务器以及刀片服务器上一般都集成了iLO2控制芯片,管理员可以通过Web方式远程进行管理,配置过程和管理过程都非常简便,管理员可以从环境恶劣的机房中解放出来,
39、管理过程轻松简洁,也降低了企业TCO成本。ILO技术详解详见:惠普iLO2远程管理功能实战.doc,三、HP PC Server产品介绍及故障诊断,四、DELL PC Server产品介绍及故障诊断,产品介绍:Poweredge server market segment Entry/workgroup(入门级):PE350,1750,1850,1855,1900,1950;Departmental(部门级):PE 2650,2850,2900,2950;Enterprise(企业级):PE 6300,6650,6800;6850,6950;8450;,四、DELL PC Server产品介绍
40、及故障诊断,DELL PC Server主要故障诊断方法:LCD面板告警:前面板上的LCD液晶面板会告诉我们很多故障信息;软件诊断法:DELL有自己的管理软件和诊断软件,可以使用这些来帮助判断故障;,四、DELL PC Server产品介绍及故障诊断,LCD面板告警:在DELL的PC Server前面板上,一般会有一个LCD的液晶面板;蓝色,显示设备型号:设备正常;黄色,显示告警信息:设备出现了故障;告警信息一般由两行组成:第一行:报错码,一般由5位组成,第一位一般是字母;第二行:报错说明,很简洁,很多是缩写;抓取这些报错信息,交给后台,就可以判断出来故障;报错信息例子如下:,四、DELL P
41、C Server产品介绍及故障诊断,管理软件:Openmanager Server Administrator:Server Administrator是DELL的一款管理软件,使用它我们可以很方便的查看系统状态,发现设备 部件故障:获取途径:(1)戴尔给客户的随机光盘。旧版7.x,或者8.x的随机盘,在一张叫DellOpenManageSystemManagement的光盘里面。4.x的随机盘,在一张叫InstallationandServerManagement的光盘里面。最新的在 SystemsManagementToolsandDocumentationDVD盘内(2)戴尔支持网站:h
42、ttp:/具体链接:http:/(随着网站的更新,地址有可能会有所更新)安装之后,在桌面或者程序里面,会有DELL Server Administrator的快捷方式;具体操作步骤:1,双击桌面的快捷方式图标。2,在跳出的安全警告窗口securityalert选择YES。,四、DELL PC Server产品介绍及故障诊断,四、DELL PC Server产品介绍及故障诊断,3,在Login窗口的Username和Password框内填入本机的管理员帐户和密码。,四、DELL PC Server产品介绍及故障诊断,4,在主目录树选择System,四、DELL PC Server产品介绍及故障诊
43、断,5,选择Logs选项卡,四、DELL PC Server产品介绍及故障诊断,6,通过ServerAdministrator抓出来的ESM日志可以保存成2种格式:(1)html网页格式,方便阅读。(2)txt格式,一般用于邮寄回给后台工程师,以做诊断。要保存为html网页格式,请单击SaveAs,要保存为txt格式请跳到步骤10。,四、DELL PC Server产品介绍及故障诊断,7,在跳出的FileDownload窗口单击Save,四、DELL PC Server产品介绍及故障诊断,8,在跳出的SaveAs窗口单击Save按钮,四、DELL PC Server产品介绍及故障诊断,9,在桌
44、面或刚才选择保存路径的地方就可以找到一个以zip为扩展名的文件夹,要阅读里面的日志,请 解压缩到一个独立的文件夹内,否则会出现乱码,或者有些图片无法显示。10,如果要把ESM的日志保存为txt格式的文档,回寄给工程师,请在刚才的保存页面单击Export。,四、DELL PC Server产品介绍及故障诊断,11,在跳出的SaveAs窗口单击Save,注意文件名是以.log为扩展名的。在桌面或者刚才所保存的路径就可以看到一个以.log为扩展名的日志文件,四、DELL PC Server产品介绍及故障诊断,管理软件:DSET 这个工具可以用来收集windows 驱动,服务,网络设置等等,同时又包括
45、CPU,memory,ESM log,BIOS/firmware versions and system health(fan/voltage levels).,它也收集系统存储信息,比如:RAID卡,硬盘等。使用这个软件,不需要重新启动机器,不必安装,对您的系统不会有任何影响。软件说明:1、可以获取系统日志,硬件日志等一系列机器信息。2、可以清除ESM/BMC日志,消除系统指示灯琥珀色的情况。3、软件是独立的,不依赖与其他软件。4、安装非常简单 5、在Linux下使用也非常的简单,以root身份直接运行文件名 6、支持几乎戴尔所有的机型。需要注意的几点:1、尽量使用最新版本的DSET软件。2、运行时候必须要有管理员权限,Administrator 或者 root.3、不支持NT4。,四、DELL PC Server产品介绍及故障诊断,四、DELL PC Server产品介绍及故障诊断,四、DELL PC Server产品介绍及故障诊断,四、DELL PC Server产品介绍及故障诊断,结束语,谢谢!,
链接地址:https://www.31ppt.com/p-2204084.html