ITIL Foundation Series (2)事件管理、问题管理.ppt
《ITIL Foundation Series (2)事件管理、问题管理.ppt》由会员分享,可在线阅读,更多相关《ITIL Foundation Series (2)事件管理、问题管理.ppt(47页珍藏版)》请在三一办公上搜索。
1、ITIL Foundation Series(2)事件管理、问题管理,ITIL服务支持与服务管理职能与流程,服务支持服务台(职能)事件管理问题管理变更管理配置管理发布管理,服务提供服务级别管理可用性管理IT服务财务管理能力管理IT服务持续性管理,涉及客户和用户如何获得恰当的服务来支持他们的活动和业务,涉及客户需要用来支持其业务运作的服务以及为提供这些服务所需要的资源,ITIL框架(2.0),业务,技术,IT服务管理的实施规划,业务管理,IT基础架构管理,应用管理,服务管理,服务提供,服务支持,安全管理,Service Support流程,事件 问题和已知错误 变更 发布 配置项关系CMDB,管
2、理工具,事件,事件管理,问题管理,变更管理,发布管理,配置管理,事件,服务台,事件调查报告,事件请求、需求,沟通、更新和权益措施,业务客户用户,变更,发布,Service Delivery流程,可用性管理,服务级别管理,需求、目标和绩效,业务客户用户,警告和期望调整,管理工具和IT基础架构,IT服务持续性管理,能力管理,IT服务财务管理,沟通、更新和报告,请求、需求,事件管理Incident management,启示,治标、治本是个问题?,概述基本概念主要活动关键角色与其他流程之间的关系成本效益及可能的问题分析关键成功因素和绩效指标总结,议题,概述,定义-事件管理是负责记录、归类和安排专家处
3、理事件,并监督整个处理过程直至 事件得到解决和终止的流程。目标-在给用户和公司正常的业务活动带来最小影响的情况下,尽快地恢复到SLA 中定义的正常服务级别。-保留事件的有效记录以便能够权衡并改进处理流程,给其他的服务管理流 程提供合适的信息,以及正确报告进展情况。,理解要点:事件管理是一个被动性的任务,也就是减少或消除存在或可能存在与IT服务中干扰因素给IT服务带来的影响,以确保用户可以尽快的恢复自己的正常工作。对于业务而言,更及时地解决事故可减少对业务的影响;提供用户的工作效率;独立的面向用户的事件监控;基于SLA的业务管理信息的可用性;对于IT部门来讲,改善监控,对于SLA的执行情况可以进
4、行更为准确的评测;更好地有效的使用人力;避免事件和服务请求的丢失或不正确的记录;更准确的配置管理数据库(CMDB);提高用户和客户的满意度;,基本概念(1)事件/服务请求/变更请求,事件(incident)-在某一服务中不属于标准操作的,并可能导致或可能导致这个服务的中断或服务质量下降的任何事件;-不仅包括软、硬渐渐的错误,还包括服务请求。基本上包括服务台接收到的所有呼叫只要可记录和可监控的;服务请求(service request)-用户想要获得有关的支持、提供、信息、建议或文挡而提出的请求,它不属于IT基础架构方面的故障;-一个服务请求可能是要求进行一个标准变更,但是只要它属于“标准服务”
5、的范畴,那么就应当由事件管理而不是变更请求流程进行处理;标准服务是根据服务级别协议(SLA)提供的,是根据既定的程序进行,而这些程序是经过协商的,并且具有适当的检查和控制功能;-例如:状态查询;口令重置;功能方面的问题或请求;要求提供具有一定IT技能或服务的新雇员的请求;对批处理活动、恢复以及口令认证的请求;变更请求(request for change,RFC)-变更请求如果被请求的服务不是事先已经定义好的“标准服务”,并且它将改变IT基础设施的状态,那么我们将据此提交一个变更请求;-变更管理流程的正式组成部分,用于记录在一个基础架构内对任何配置项或服务、程序以及与基础架构相关的项目进行变更
6、的需求的详细情况;,基本概念(2)影响度/紧急度/优先级,影响度-影响度指所影响的用户或业务数量而言,事件偏离正常服务级的程度;-重要事故是指哪些对用户带来非常严重影响的事件,而有些在时间上极度紧迫的事件,也应当作为重要事件来处理;紧急度-解决故障时,对用户或业务来说可接受的耽误时间;优先级-决定处理事件和问题的先后顺序;-根据事件对用户和正常业务带来的影响的严重程度来决定。由服务台与用户进行协商,根据SLA确定事件优先级,当事件提升到二线/三线时,其优先级的维护及调整仍是在与服务台进行协商后确定;,受影响的用户数;受影响的系统数;用户要求;服务级别协议;错误的严重性;,影响度,紧急度,优先级
7、,评估:人力;资源;时间;,优先级=影响度X紧急度X职务(?),优先级,解决时间,影响度,紧急度,高,中,低,高,中,低,紧急,1h,高,高,中,中,中,低,低,计划中,8h,24h,8h,24h,48h,24h,48h,已有计划,事件的影响度和紧急度在生命周期中有可能变化,基本概念(3)升级,定义-如果某个事件不能在规定的时间内由一线支持小组解决,那么更多的有经验的人员或有更高权限的人员将不得不参与进来,这就是升级。它可能发生在事件解决过程的任何时间和任何支持级别;职能性升级(Functional Escalaton,水平升级)-需要具有更多时间、专业技能或接入特权(技术机构)的人员来参与事
8、件的解决。-这种升级可能会超越部门界限而且可能会包含外部支持者;结构性升级(垂直升级)-当经授权的当前级别的机构不足以保证事件能够及时、满意的得到解决时,需要更高级别的机构参与进来解决;-例子:服务台-服务台主管-问题管理经理-服务经理/客户经理-IT总监/第三方总监-一般情况应优先使用职能性升级,只有当在某些事件不能得到及时解决时才考虑使用结构性升级;-如果是后一种方式,最好尽可能早于SLA规定的时间开始有关行动,比如外聘专家;-事件管理经理对于事件管理流程负有全部责任,他的目标是为了满足一个事件的职能性升级的需要做好预备工作,以避免结构性升级的发生;,基本概念(4)一线/二线/三线/N线支
9、持,一线支持(也称第1排支持人员)通常由服务台提供二线支持则由管理部门提供;三线的支持由软件开发人员和系统结构人员提供;四线的支持由供应商提供事件管理经理可在相关部门指定的故障协调人来支持自己的工作。协调人在整个事件管理过程中处于各线的支持机构之间充当接口的角色,每个协调人协调他本身所在的支持团队。,主要活动,接收和记录归类和初步支持匹配调查和诊断解决与恢复终止跟踪与监控,负责解决事件并跟 踪、监督、控制和协调解决过程,事件检测、接收和记录,初步归类和支持,事件调查和分析,解决事件而后恢复服务,终止事件,处理服务请求,服务请求,1、避免无人负责监控和升级事件;2、避免专业人员经常面对用户;3、
10、避免与用户和服务相关的关系信息缺乏,输入:事件详细来源于服务台配置管理数据库中配置项信息已知错误和解决方案于问题和已知错误匹配的事件响应,输出:已知错误变更请求更新规避措施或解决答案记录客户沟通管理信息提交,主要活动,WHY记录?已有的事件记录可帮助对新发生的事件进行诊断;问题管理可通过对事件的记录来发现问题的原因;如果所有的来电呼叫都被记录下来,那么对于某一事件的影响度的判断会容易一些;如果没有事件记录,那么将不能监控经过协商服务级别是否得到履行;避免在解决问题时出现几个人同时解决同样的问题,或在对某一事件的处理过程中什么工作都没有做等情形;WHO报告?由某一用户发现;由系统发现;由某一服务
11、台员发现;由另一IT 部门的人发现;,接收记录,归类和初步支持,匹配,调查诊断,解决恢复,终止,跟踪监控,主要活动,记录WHAT?事件编号(唯一的);事件类别;记录事件的时间和日期;事件记录人(或组)的姓名(或ID);有关用户的姓名、部门、电话和工作地点;回复用户的方式(如电话、电子邮件等);时间症状描述;HOW记录?分配一个时间索引序号-大多数情况下系统自动分配一个唯一的时间索引序号。通常,在后续沟通过程中用户可使用通过提供的查询序号来查看事件状态;记录基本的诊断信息;-时间、症状、用户、处理问题的人、地点、以及受影响的服务或硬件等信息;附加事件信息-包括与事件相关的其他信息(例如一个脚本或
12、交谈程序记录)或配置管理数据库中的一些信息(通常以数据库中定义的关系为基础);警告-如果存在一个具有高影响度的事件,例如某一个重要服务器的瘫痪,则应警告其他用户和管理部门;,接收记录,归类和初步支持,匹配,调查诊断,解决恢复,终止,跟踪监控,主要活动,类别:与中央处理过程相关:包括介入、系统、应用等故障;与网络相关:包括路由器、整流片、集线器、IP地址等故障;与工作站相关,包括显示器、网卡、磁盘驱动器、键盘等故障;同样功能和使用相关:服务、能力、可用性、备份、手册等相关故障;与组织和过程相关:与命令、请求、支持、沟通等相关;与服务请求相关:用户对服务台提出的请求,要求提供支持、交付、信息、建议
13、或文档等,这可能会备一个单独的过程所覆盖,也可能会按其他时间一样的方法进行处理;优先级=影响度X紧急度服务,接收记录,归类和初步支持,匹配,调查诊断,解决恢复,终止,跟踪监控,事件警告,事件查明和记录,调查CMDB,定义优先级,初步评价事件,安排特定支持小组,请求?,服务台能解决的事件?,解决事件,终止事件,事件调查和分析,处理服务请求,是,否,是,否,根据事件的类型状态、影响度、紧急度、优先级、SLA等进行分类,并向用户提供建议来解决处理问题,主要活动,支持小组如果服务台不能再预先确定的时间范围内解决时间,决定应该由那个支持小组来负责处理该事件;时间表以优先级和SLA 为基础,受影响的用户将
14、会被通知预计解决问题的最长时间(一个周期时间)。以及什么时候进行进一步的升级。事件索引号工作流状态 新建:已接受己计划:已分配活跃状态:已暂停已解决:已终止,接收记录,归类和初步支持,匹配,调查诊断,解决恢复,终止,跟踪监控,事件警告,事件查明和记录,调查CMDB,定义优先级,初步评价事件,安排特定支持小组,请求?,服务台能解决的事件?,解决事件,终止事件,事件调查和分析,处理服务请求,是,否,是,否,归纳和初步支持,事 件 故 障 单,事件说明,事件症状,系统,组件,项目,严重等级,请求者信息,步骤,解决方案,事件来源,事件ID,事件处理人员,事件类型,状态,等待原因,关闭代码,事件产生日期
15、,请求者提交的事件故障单,附件,用户号,登陆名,24小时电话,提交者,主要活动,对于事件进行分类之后,要检查以前是否发生过类似的事件。如果发生过,则查看是否存在解决方法和应急措施。如果新事件与某一问题或某一已知错误具有相同症状,那么可将事件指向这些已知的问题或错误。,接收记录,归类和初步支持,匹配,调查诊断,解决恢复,终止,跟踪监控,新的突发事件,问题,已知错误/规避措施,是否是新的突发事件?突发事件是否与已有的问题相关?是否存在已知的规避措施?,搜索知识库,主要活动,服务台将那些没有快速解决方法或超过他们专业水平的事件安排给具有更高专业水平和技术能力的支持群体;支持小组将对事件进行调查并尽快
16、加以解决,如不能解决,则将其转交给其他的支持小组;,接收记录,归类和初步支持,匹配,调查诊断,解决恢复,终止,跟踪监控,安排支持人员,收集基本信息,查询历史数据,将事件处理责任反馈给服务台,终止事件调查,请求?,CMDB,事件、问题和知名错误数据库,搜索调查数据,事件,否,是,主要活动,成功完成对事件的分析解决之后,负责解决问题的支持小组应在系统中记录故障的解决方法;对某些解决方法来说,必须要向变更管理发送一个变更请求(Request For Change,RFC)最糟糕的情况是,如果没有找到解决事件的方法,那么事件依然保持开发(Open)状态;,接收记录,归类和初步支持,匹配,调查诊断,解决
17、恢复,终止,跟踪监控,主要活动,一旦解决方法执行完毕,支持小组要把事件处理情况反馈给服务台;服务台应联系事件的报告人以确认问题的确已经得到解决;如果服务台可以确定问题已经得到很好解决,那么事件就可以关闭(Close)了,否则需要在适当的地方重新开始处理流程;在事件关闭的过程中,必须要对事件的记录进行更新以指明对事件最终的分类和优先级,受影响的服务、用户、客户以及导致事件发生的配置项(CI)等;,接收记录,归类和初步支持,匹配,调查诊断,解决恢复,终止,跟踪监控,主要活动,作为所有事件的拥有者,服务台负责对事件的发展情况进行监控以及通知用户有关事件的状态;用户在某一状态变更后可能作出适当的反馈,
18、如在预期的事件周期内发生的进一步的事件移交安排或变更等;在对事件进展进行跟踪和监控时,可能需要将事件进行职能性升级,转交给其他支持小组来处理,或进行结构性升级,以加强处理事件的力度;,接收记录,归类和初步支持,匹配,调查诊断,解决恢复,终止,跟踪监控,关键角色,事件经理 对以下事情负责:监控事件处理流程的效果和效率;控制支持小组的工作;为改进工作提供建议;开发维护事件管理系统;支持小组人员 一线支持小组负责记录、分类、匹配、转交、解决(除指派给其他支持小组之外的)和终止事件;其他的支持小组主要参与调查、诊断和恢复工作,这和对事件设定的优先级有关;,在很多公司,事件经理就是服务台经理,与其他流程
19、之间的关系概述,服务台,计算机操作,网络,规程,其他事件源,服务请求,配置管理数据库,问题管理,事件管理流程,监控和记录分类和一线支持匹配调查和诊断解决和恢复事件终止事件的所有权、监控 跟踪和沟通,配置细节,转交和监控,事件信息,应急措施,变更管理,变更请求,解决方案,可用性管理,报告,能力管理,报告,服务级别管理,报告,SLA参数,输入:事故输出:解决方案应急措施,事件可能由基础架构的任何部分引起,通常由用户报告。也可能由组织的其他部门发现或监控系统自动跟踪应用事件和基础架构事件,管理信息,已知错误数据库,与其他流程之间的关系,事件管理与配置管理配置管理显示基础架构的某一部分由谁来负责,这样
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- ITIL Foundation Series 2事件管理、问题管理 事件 管理 问题
链接地址:https://www.31ppt.com/p-2266754.html