超大彩信业务平台应急指导书.doc
《超大彩信业务平台应急指导书.doc》由会员分享,可在线阅读,更多相关《超大彩信业务平台应急指导书.doc(31页珍藏版)》请在三一办公上搜索。
1、超大彩信业务平台应急指导书中国电信系统集成有限责任公司内蒙古分公司2010年08月目 录目 录2第1章 目的3第2章 使用对象3第3章 适用场合3第4章 应急处理流程说明34.1 紧急情况界定34.2 应急措施及应急流程3第5章 常见故障及应急处理篇35.1 硬件故障篇35.1.1 电源故障35.1.2 防火墙、交换机故障35.1.3 路由器故障45.1.4 超级彩信平台服务器硬件故障45.2 软件故障篇45.2.1 超级彩信平台程序软件故障45.2.2 超级彩信平台数据库软件故障4第6章 预警处理篇46.1 CPU过负荷预警处理46.2 内存预警处理46.3 磁盘空间预警处理46.4 超级彩
2、信平台程序故障预警处理46.5 超级彩信平台数据库故障预警处理4第7章 应急资源配备4第1章 目的为保证公司业务的正常运行,避免和减少公司各服务器出现严重问题,在出现问题时能根据本方案及以前的备份资料迅速及时恢复系统的正常运行;保证公司数据的完整性,并可随时恢复;减少故障对公司的损失。为了规范项目,便于维护人员在紧急情况下对硬件及软件的常见问题做出及时的判断和分析,特编写业务平台的应急预案书。第2章 使用对象项目维护人员第3章 适用场合网络安全漏洞造成数据被恶意攻击破坏,未采用容灾方案,数据在外界灾害中被破坏,用户硬件故障造成的数据损失,电力实效。第4章 应急处理流程说明4.1 紧急情况界定发
3、生电力故障时第一时间保证重要服务器、路由器及交换机的电源,关掉业务不是很重要的服务器,这样可以在断电时保证网络的基本运行,确保各分公司正常连接办公网、相关业务系统基本不受影响。并询问人事部故障处理时间,如果断电时间超出UPS使用时间,可通知各部UPS电源可待机时间。在UPS电源只够支撑半个小时的时候,电话通知各部做好文档保存工作,一线营业部门做好手工记帐准备,服务将在15分钟后中断。确定各部做好保存工作后将各组服务器关机,等待电力恢复。电力恢复后,将各服务器和网络设备开机,检查各组服务器和网络运行情况,发现故障及时跟进处理,确认运行正常后,电话各部通知服务已恢复正常运行。恢复后将结果报知部门经
4、理并做好相关记录。4.2 应急措施及应急流程硬件故障应急流程:当发生硬件故障时第一时间分析故障原因,用排除法找到故障原因.如果是内存、硬盘、电源故障可及时使用备用零件替换.如果是CPU、主板可用备用服务器顶替,以确保服务不中断。如果当值人员无法排除故障,可向本部同事请求技术支持并向本部经理汇报情况,由经理统一协调。发生故障同时电话通知相关业务部门,告知故障原因、处理时间,故障处理结束后电话通知使用部门和部门经理告知处理结果。并将处理结果在服务器重大事件处理登记表做好记录。软件故障应急流程:当发生软件故障时第一时间分析故障原因,当系统出现崩溃时,可通过系统GHOST备份还原系统。(系统GHOST
5、在本机与文件服务器都做了备份)。当系统中病毒时,可进入安全模式查杀病毒和木马,安全模式无法进入的话可将硬盘外挂到另一台电脑进行查杀。当服务器数据库损坏后,可及时通过SQL恢复本机的备份数据。(数据库在本机与磁带机都有备份)。如果当值人员无法排除故障,可向本部同事请求技术支持并向本部经理汇报情况,由经理统一协调。发生故障同时电话通知相关业务部门,告知故障原因、处理时间,故障处理结束后电话通知使用部门和部门经理告知处理结果。并将处理结果在服务器重大事件处理登记表做好记录。人为及自然损坏应急方案:当发生人为及自然损坏时,第一时间通知部门经理由经理统一协调,发生服务器被盗和暴力破坏服务器时,可选择报警
6、,追究破坏者刑事责任,从其它公司部门借调服务器,重新恢复相关数据。当发生数据被盗时,查看监控录像或服务器日志。报警追究刑事责任。发生不可抗力服务器自然损坏时, 从其它公司部门借调服务器,重新恢复相关数据。并将处理结果在服务器重大事件处理登记表做好记录。第5章 常见故障及应急处理篇本篇主要介绍在日常维护及应急处理中的一些常见硬件及软件故障,指导相关超大彩信平台维护人员掌握日常应急处理方法及流程。5.1 硬件故障篇本篇主要介绍在日常维护及应急处理中的一些常见硬件故障,指导相关超大彩信平台维护人员掌握日常应急处理方法及流程。5.1.1 电源故障电源指示灯报警,正常状态为绿色,报警状态为红色,建议联系
7、供应商更换电源。5.1.2 防火墙、交换机故障防火墙、交换机故障会导致与各个外部实体网源连接中断,同时,也会导致超大彩信平台数据库与业务进程之间的通讯中断,导致程序异常,业务全阻。5.1.3 路由器故障5.1.4 超大彩信平台服务器硬件故障5.1.4.1服务器故障常见问题安全第一 为您和您的系统着想小心: 许多维修工作只能由获得认证的服务技术人员来完成。您只应按照产品文档中的授权或按照在线或电话服务与支持团队的指导,执行故障排除和简单的维修工作。由于未经 Dell 授权的维修所造成的损坏不包括在保修范围内。请阅读并按照产品附带的安全说明进行操作。系统启动失败故障排除在启动过程中,如果系统在出现
8、视频图像或 LCD 消息之前停机,尤其是在安装操作系统或重新配置系统硬件之后发生这种故障,请检查下列情况。在 UEFI 引导模式下安装操作系统之后,如果采用 BIOS 引导模式引导系统,系统便会挂起。反之亦然。您必须引导至您在安装操作系统时所采用的引导模式。请参阅使用系统设置程序和 UEFI 引导管理器。无效的内存配置可能导致系统启动时停机,并且无任何视频输出。请参阅系统内存。有关其它所有启动问题,请留意 LCD 面板消息和屏幕上显示的任何系统消息。有关详情,请参阅LCD 状态信息和系统信息。外部连接故障排除对任何外部设备进行故障排除之前,请确保所有外部电缆均已牢固地连接至系统上的外部连接器。
9、有关系统上的前面板连接器和背面板连接器的信息,请参阅图1-2 和图1-5。视频子系统故障排除 检查显示器与系统和电源的连接。检查系统到显示器之间的视频接口连线。如果系统连接了两台显示器,请断开其中一台的连接。系统仅支持将一台显示器连接到前面板或背面板视频连接器。请尝试使用已知可正常工作的显示器。运行相应的联机诊断检测程序。请参阅使用 Dell PowerEdge Diagnostics。如果检测程序运行成功,则问题与视频硬件无关。如果检测程序运行失败,请参阅获得帮助。USB 设备故障排除使用下列步骤对 USB 键盘和/或鼠标进行故障排除。对于其它 USB 设备,请转至步驟 2。从系统中暂时拆除
10、键盘和鼠标电缆,然后再重新连接。将键盘/鼠标连接至系统另一面的 USB 端口。如果问题得以解决,请重新启动系统,进入系统设置程序,检查是否已启用不工作的 USB 端口。将此键盘/鼠标更换为其它可正常工作的键盘/鼠标。如果问题得以解决,请更换有故障的键盘/鼠标。如果问题仍然存在,请继续执行下一步骤,开始对与系统相连的其它 USB 设备进行故障排除。关闭所有连接的 USB 设备,断开它们与系统的连接。重新启动系统,如果键盘正常工作,则进入系统设置程序。验证是否启用了所有 USB 端口。请参阅Integrated Devices(集成设备)屏幕。如果键盘不能正常工作,还可以使用远程访问。重新连接,每
11、次打开一个 USB 设备的电源。如果某一设备造成同一问题,请关闭该设备的电源,更换 USB 电缆,然后再打开该设备的电源。如果问题仍然存在,请更换此设备。如果所有故障排除均失败,请参阅获得帮助。串行 I/O 设备故障排除关闭系统和所有连接的外围设备,并断开系统与电源插座的连接。将串行接口电缆更换为另一条可正常工作的电缆,并打开系统和串行设备。如果问题得以解决,则请更换接口电缆。关闭系统和串行设备,将该设备更换为同类设备。打开系统和串行设备。如果问题得以解决,请更换串行设备。如果问题仍然存在,请参阅获得帮助。NIC 故障排除运行相应的联机诊断检测程序。请参阅使用 Dell PowerEdge D
12、iagnostics。重新启动系统,并检查与 NIC 控制器相关的任何系统信息。查看 NIC 连接器上的相应指示灯。请参阅NIC 指示灯代码。如果链路指示灯不亮,请检查所有电缆的连接。如果活动指示灯不亮,则网络驱动程序文件可能已损坏或丢失。使用交换机或集线器上的另一个连接器。如果使用的是 NIC 卡而非嵌入式 NIC,请参阅 NIC 卡的说明文件。确保安装了相应的驱动程序并捆绑了协议。请参阅 NIC 的说明文件。进入系统设置程序,并确认已启用 NIC 端口。请参阅Integrated Devices(集成设备)屏幕。确保将网络上的 NIC、集线器和交换机设置为相同数据传输速率和双工。请参阅每个
13、网络设备的说明文件。确保所有网络电缆的类型无误,并且未超出最大长度限制。如果所有故障排除均失败,请参阅获得帮助。受潮系统故障排除小心: 许多维修工作只能由获得认证的服务技术人员来完成。您只应按照产品文档中的授权或按照在线或电话服务与支持团队的指导,执行故障排除和简单的维修工作。由于未经 Dell 授权的维修所造成的损坏不包括在保修范围内。请阅读并按照产品附带的安全说明进行操作。关闭系统和连接的外围设备,并断开系统与电源插座的连接。打开系统护盖。请参阅打开系统。拆除系统上的组件。请参阅安装系统组件。冷却导流罩硬盘驱动器SD 卡USB 存储钥匙NIC 硬件卡锁内部 SD 模块扩充卡和两个扩充卡提升
14、板集成存储控制器iDRAC6 Enterprise 卡电源设备处理器和散热器内存模块风扇支架使系统彻底干燥至少 24 小时。重新安装处理器和散热器、内存模块、电源设备、冷却导流罩和风扇支架。合上系统护盖。请参阅合上系统。将系统重新连接至电源插座,然后开机。如果系统未正常启动,请参阅获得帮助。如果系统正常启动,请关闭系统,然后重新安装步驟 3 中拆下的其余组件。请参阅安装扩充卡。运行相应的联机诊断检测程序。请参阅使用 Dell PowerEdge Diagnostics。如果检测程序运行失败,请参阅获得帮助。受损系统故障排除小心: 许多维修工作只能由获得认证的服务技术人员来完成。您只应按照产品文
15、档中的授权或按照在线或电话服务与支持团队的指导,执行故障排除和简单的维修工作。由于未经 Dell 授权的维修所造成的损坏不包括在保修范围内。请阅读并按照产品附带的安全说明进行操作。关闭系统和连接的外围设备,并断开系统与电源插座的连接。打开系统护盖。请参阅打开系统。确保已正确安装以下组件:扩充卡和两个扩充卡提升板电源设备风扇和冷却导流罩处理器和散热器内存模块硬盘驱动器托盘确保所有电缆均已正确连接。合上系统护盖。请参阅合上系统。运行系统诊断程序中的系统板检测程序。请参阅运行系统诊断程序。如果检测程序运行失败,请参阅获得帮助。系统电池故障排除 通过系统设置程序重新输入时间和日期。请参阅使用系统设置程
16、序和 UEFI 引导管理器。关闭系统并断开系统与电源插座的连接,然后至少等待一小时。将系统重新连接至电源插座,并打开系统。进入系统设置程序。如果系统设置程序中的日期和时间不正确,请更换电池。请参阅系统电池。小心: 许多维修工作只能由获得认证的服务技术人员来完成。您只应按照产品文档中的授权或按照在线或电话服务与支持团队的指导,执行故障排除和简单的维修工作。由于未经 Dell 授权的维修所造成的损坏不包括在保修范围内。请阅读并按照产品附带的安全说明进行操作。如果更换电池仍不能解决问题,请参阅获得帮助。对电源设备进行故障排除小心: 要使系统运行,必须至少安装一个电源设备。仅使用安装的一个电源设备长时
17、间运行系统,而且 PS2 电源设备托架中并没有安装电源设备挡片,则可能导致系统过热。通过电源设备状态指示灯来标识有故障的电源设备。请参阅电源指示灯代码。小心: 如果对电源设备不匹配错误进行故障排除,请仅更换指示灯闪烁的电源设备。如果更换另一电源设备来形成匹配电源对,则可能导致故障状态和系统意外关机。要从高输出配置更改为能量智能配置或进行反向更改,则必须关闭系统电源。通过拆卸和重新安装的方法来重置电源设备。请参阅卸下电源设备和装回电源设备。注: 安装完电源设备后,请等待几秒钟,以便系统识别电源设备并确定其是否可以正常工作。状态指示灯呈绿色亮起,表示电源设备可以正常工作。如果问题仍然存在,请用相同
18、类型的电源设备更换故障电源设备。如果问题仍然存在,请参阅获得帮助。系统冷却问题故障排除小心: 许多维修工作只能由获得认证的服务技术人员来完成。您只应按照产品文档中的授权或按照在线或电话服务与支持团队的指导,执行故障排除和简单的维修工作。由于未经 Dell 授权的维修所造成的损坏不包括在保修范围内。请阅读并按照产品附带的安全说明进行操作。确保不存在以下情况:卸下了系统护盖、冷却导流罩、驱动器挡片、电源设备挡片(在单电源设备配置中)或前后填充面板。在单处理器配置中卸下了 FAN5 挡片或散热器挡片。未遵照扩充卡安装原则。请参阅扩充卡安装原则。环境温度太高。关于系统的工作温度要求,请参阅使用入门指南
19、。外部通风受阻。系统内部电缆妨碍了通风。某个冷却风扇被卸下或出现故障。请参阅风扇故障排除。风扇故障排除小心: 许多维修工作只能由获得认证的服务技术人员来完成。您只应按照产品文档中的授权或按照在线或电话服务与支持团队的指导,执行故障排除和简单的维修工作。由于未经 Dell 授权的维修所造成的损坏不包括在保修范围内。请阅读并按照产品附带的安全说明进行操作。打开系统护盖。请参阅打开系统。小心: 所有冷却风扇均可热插拔。要在系统运行时保持正常的冷却效果,请每次仅更换一个风扇。根据 LCD 面板或诊断软件的指示找到出现故障的风扇。重置风扇。请参阅卸下冷却风扇和装回冷却风扇。注: 等待至少 30 秒钟,以
20、便系统识别风扇并确定风扇是否正常工作。如果问题仍未解决,请安装新的风扇。如果更换的风扇仍不能正常运行,请参阅获得帮助。系统内存故障排除小心: 许多维修工作只能由获得认证的服务技术人员来完成。您只应按照产品文档中的授权或按照在线或电话服务与支持团队的指导,执行故障排除和简单的维修工作。由于未经 Dell 授权的维修所造成的损坏不包括在保修范围内。请阅读并按照产品附带的安全说明进行操作。注: 无效的内存配置可能导致系统启动时停机,并且无视频输出。请参阅内存模块一般安装原则,并验证您的内存配置是否符合所有适用的原则。如果系统可以运行,请运行相应的联机诊断检测程序。请参阅使用 Dell PowerEd
21、ge Diagnostics。如果诊断程序指示出现故障,请按照诊断程序提供的更正措施进行操作。如果系统无法运行,请关闭系统和连接的外围设备,并断开系统与电源的连接。等待至少 10 秒钟,然后将系统重新连接至电源。打开系统及连接的外围设备,并留意屏幕或 LCD 面板上的消息。如果系统显示特定内存模块出现故障的错误信息,请转至步驟 14。进入系统设置程序并检查系统内存设置。请参阅内存设置屏幕。请视需要对内存设置进行更改。如果内存设置符合所安装的内存,但仍指示存在问题,请转至步驟 14。关闭系统和连接的外围设备,并断开系统与电源插座的连接。打开系统护盖。请参阅打开系统。卸下冷却导流罩。请参阅卸下冷却
22、导流罩。检查内存通道,确保内存插装无误。请参阅内存模块一般安装原则。在各自插槽中重置内存模块。请参阅安装内存模块。装回冷却导流罩。请参阅安装冷却导流罩。合上系统护盖。请参阅合上系统。将系统重新连接至电源插座,并打开系统和连接的外围设备。进入系统设置程序并检查系统内存设置。请参阅内存设置屏幕。如果问题未解决,请继续执行下一步。关闭系统和连接的外围设备,并断开系统与电源的连接。打开系统护盖。请参阅打开系统。卸下冷却导流罩。请参阅卸下冷却导流罩。如果诊断检测程序或错误信息指示特定内存模块出现故障,请更换该模块。要对未指定的故障内存模块进行故障排除,请用相同类型和容量的内存模块更换第一个 DIMM 插
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 超大 彩信 业务 平台 应急 指导书

链接地址:https://www.31ppt.com/p-4136953.html