数据中心运维管理培训ppt课件.ppt
《数据中心运维管理培训ppt课件.ppt》由会员分享,可在线阅读,更多相关《数据中心运维管理培训ppt课件.ppt(60页珍藏版)》请在三一办公上搜索。
1、议程,数据中心运维管理面临的问题与挑战,数据中心运维管理探讨数据中心运维管理的能力框架及建设演进业务驱动IT管理完整的平台管理全生命周期管理总结,2,IT越来越复杂,带来的典型IT运营问题,架构复杂 复杂,多厂商 难扩展 需要多领域专家 消除I/O瓶颈很复杂 多厂商集成方案成 本高、耗时,整体性能难保证 异构的数据库、Java层、消息层和Web 层很难整体调优尤其在通常虚拟环 境中,整体性能不高、,整体可用性难保证 异构环境可用性管理复杂在通常的虚拟环境中,应 用可用性更难管理 不同厂商产品的可用性可 以大大影响整体可用性,运,维管理复杂运维 不好界解决过的升 复杂,不可预测,异构环境增加,复
2、杂度,职责 定问题诊断、程复杂,不同厂商产品,级、补丁过程,3,“稳定”和“安全”是IT运营的基本目标运维人员在多个环境里进行手工配 置和操作,难以避免人为操作风险,日常监控 服务响应 工作调度 数据备份,系统变更执行,事故报告 灾备操作 机房管理 访问授权 健康检查,应用系统 中间件 数据库,开发,测试,生产,灾备,服务器与存储,问题变更事件配置版本 可用性容量管理管理管理管理管理管理管理,网络,变更影响分析通常凭 经验,也难以充分测 试,怎样控制和验证?,怎样确定问题 的根源?可以 从业务影响发 现问题吗?怎 样避免问题的 再次发生?,真的了解运行 状态吗?预警 和主动监控能 做到什么程度
3、?健康检查是否 有效?,如何快速定位和恢复故 障?应急演练是否有效?备份的数据真的可用吗?,怎样判断架构的高可 用性?当前的性能容 量能否支撑下阶段业 务发展?,4,基础架构和运维的驱动,性能提升资源利用率提升弹性扩展弹性/可靠性/性价比快速应用部署压缩环境准备和应用安装部署时间提高工作效率节能减排机房空间效率电力供应平均CPU/存储利用率追求更低的TCO和高ROI降低软件、硬件、服务成本简化运维工作,降低维护成本,集中管控监控预警,实现主动管理故障诊断和性能优化可视化管理,面向服务质量风险控制降低操作风险系统安全提升数据中心 不能成为问题中心,5,来自业务的挑战,CIO办公室,对最终用户体验
4、缺乏可 见性,业务要求IT可靠和透明,业务经理要求以业务的语 言来描述IT服务水平,客户对服务中断和性能 问题毫无耐心,IT性能指标与业务毫不相干,不能有效控制服务中断 和性能下降,缺乏通用语言,基础关注点 不一致,IT运营“像业务一样经营IT”是CIO共同目标,目的是保障服务质量,提高IT对业务的贡献。,6,IT服务管理最佳实践的新要求,ITIL v3帮助用户从业务角度完成整体设计、实施和 持续优化IT服务管理,并通过IT服务管理将 企业的业务需求和IT管理实现量化对接,ISO 20000:2011供应商和客户之间的实质关系将影响服务管理过程如何实施,业务战略指导落地,业务需求量化考核,7,
5、问题与挑战的总结思考,来自业务的挑战 灵活的支持业务发展;对业务量持续以及爆发性增长的 需求;对于最终用户体验具备可见性;业务需求和IT管理实现量化对接运维的驱动 具有面对服务需求峰值而不需要 额外投入的能力;可提供724小时高水平服务等 级的能力;需要具有丰富经验的资源;80%的企业软件费用花费在安装与维护;服务器对管理员的比例还维持在 20-30:1的水平;部署新的应用时间太长。,IT基础架构与基础设施的驱动 数据中心空间优化与地点的选择;不断增长的数据中心基础架构的复杂度 服务器的利用率介于10%15%;数据中心往往需要耗费上千万的资金去 建设,而且不能在现有设施上去扩展。IT的变革与创
6、新 IT基础架构集中与标准化;虚拟化、网格计算;自动化与持续可用;云计算/绿色IT。,;,日常监控 服务响应 工作调度 数据备份 系统变更执行 事故报告 灾备操作 机房管理 访问授权 健康检查,应用系统,中间件,数据库,服务器与存储,网络,保障稳定和安全 业务连续性和高可用性建设;潜在问题的分析和规避;主动的客户体验监控;问题快速定位和解决。,8,议程,数据中心运维管理面临的问题与挑战,数据中心运维管理探讨数据中心运维管理的能力框架及建设演进业务驱动IT管理完整的平台管理全生命周期管理总结,9,通过架构整合和简化、提升运营管理能力来解 决面临的IT运营问题与挑战,构建完整平台管理,完善运 营基
7、础管理能力,同时帮助 用户从业务角度优化IT服务 管理,将企业的业务需求和 IT管理实现量化对接,提升运营管理能力,10,Oracle IT运营能力框架模型,ITIL v3.0COBITUSMBOK ISO 20000 TOGAFOracle Unified Method SAS 70 Type I and II,业务,IT,11,提升IT运营能力:技术成熟度模型,有感知的,标准化程度低 架构与运维无法 共享 只对关键资产使 用状况有了解 6周部署 普遍的单点故障 基本的监控,集中与整合技术现代化,阶段 1,认可的 关键的硬件/软件,标准化,对于75%资产的使,用状况了解,25%已经整合,2周
8、部署,N+1设计,基本的管理,阶段 2,主动的 硬件/软件标准化,共享的架构与运维 运维资产,75%整合、部分虚 拟化,100%了解资产使用,状况,数天内部署,关键系统可靠性设 IT服务工具,计,运维管理工具集,虚拟化,阶段 3,集成的架构,75%虚拟化,数小时分配 资源 持续的可用性,服务型的,自动化,阶段 4,业务合作伙伴,高扩展、弹性的架,构,新技术使用 90%虚拟化 整体的架构与运维 动态资源分配 灾难下的持续可用,性,业务服务工具,云计算,阶段 5,我们在哪里?,12,提升IT运营能力:人员成熟度模型,有感知的,人员按技术分 类 离散的 个人主义 较低的客户信心 非正式的审查,组织型
9、个人型,阶段 1,认可的 分级支持,角色按流程定义,正式的职业发展,规划 培训,员工KPI,阶段 2,主动的 以流程为中心,与HR的流程相结合 信任的服务,能力中心 预防模式 趋势分析,以流程为中心,阶段 3,服务为中心,新的角色,供应商 技能管理 以服务质量为目标,参照行业最,佳实践,服务型的,以服务为中心,阶段 4,业务合作伙伴,成为业务部门 虚拟团队 注重业务 高效的外包技能 业务与IT轮岗 创建行业最佳实践,以业务为中心,阶段 5,我们在哪里?,13,提升IT运营能力:流程成熟度模型,有感知的,救火队模式 工具定义流程 备件备份,以工具作为标 准 没有流程文档,运维流程工具使用,阶段
10、1,认可的 事件管理,变更与问题管理,标准化,灾备管理,项目管理,较少的流程集成,阶段 2,主动的 分析趋势 阀值设置,应用可用性监控 自动化,大部分ITIL流程已,成熟,服务交付流程,阶段 3,IT作为服务供应商 服务分类与 定价保证的SLA 服务可用性监控 集成的流程,容量管理,服务型的,服务与客户管理,阶段 4,业务合作伙伴,IT作为战略业务伙,伴,IT与业务KPI关联 提升业务流程协作 实时架构 业务变革,以业务为中心,阶段 5,我们在哪里?,14,数据中心运维管理的能力建设演进,完善运营管理 基础能力主动端到端监控快速定位问题集中配置管理有效控制变更和 发布自动化生命周期 管理有效的
11、应急和安全措施,实现业务驱动用户体验业务监控业务指标,云管理全生命周期管理,15,用户体验管理,业,产品目录务服,订单管理务管,理,业务交易管理,网络门户,.其它 业务服务,客户与业务用户,业务驱动IT管理,完整的平台管理,全生命周期云管理,业务驱动IT管理 以业务视角管理IT资源 创建应用感知云,能够理解和适应实际业务需求,完整的平台管理 应用、中间件、数据库、硬件 一体机(Exalogic,Exadata),全生命周期云管理 建立敏捷的IT管理以适应 不断变化的业务需求 使用同一软件进行统一的 云服务全生命周期管理,应用,中间件 数据库OS,VM,Servers 存储,网络,Oracle
12、支持服务,云服务 Apps,PaaS,DBaaS,IaaS.,数据中心运维管理解决方案,16,议程,数据中心运维管理面临的问题与挑战,数据中心运维管理探讨数据中心运维管理的能力框架及建设演进业务驱动IT管理完整的平台管理全生命周期管理总结,业务驱动型应用管理与能力框架的映射,网络门户产品目录业务服务管理,订单管理,.其它 业务服务,客户与业务用户用户体验管理业 务 交 易 管 理,业务驱动型应用管理,完整的云平台管理,全生命周期云管理,应用,中间件数据库 OS,VM,Servers 存储,网络,Oracle 支持服务,云服务 Apps,PaaS,DBaaS,IaaS.,JVM 和DB诊断业务交
13、易管理真实用户体验管理,用户满意度怎么样?,他的录入快速吗?下单情况怎么样?,下单为什么卡住?为什么慢?怎么老超时?,根本原因是什么?是核心的问题还是 ECIF问题?,19,业务驱动的端到端应用管理,用户体验管理,实时监测用户的“真实的”活动,优化业务响应率和转化率,Executive dashboard,Business Reporting,Transaction Performance,SLA管理与行政驾驶舱,实时错误报告与分析,KPI实时监控与报警,定制业务服务实时监控,实时交易漏斗监控,整体页面浏览性能-绿色=满意-橙色=容忍-蓝色=失望,用户满意度实时趋势分析,实时用户体验跟踪,用户
14、出错页面重放,实时系统性能分析,持续监控关键事务,通过一系列的事务/操作序列来定义”业务交易”典型“业务交易”问题 业务上定义的逻辑错误,比如”信用额度不足”,“库存少于10 件”,“审批周期超时”,“定 单金额超过预定义金额”失控流程(Stalled processes),不正常跳转,非正常中断的交易 流程等 失控结果,定义范围以外的结果 技术层面的问题,比如延时 和EM其他模块互动,告警并解决问题,Rejected Order Alert,WebLogic,Service Bus,Appliance,DBMS,Web,Partner and Cloud,业务交易管理,22,1 服务水平协议
15、Service Level Objective(SLO)For Platinum customers:Ave.Response time per hour 6 sec,Warning threshold=4 sec-Action:alerts,利用率跟踪和分类 譬如:白金卡,金卡,银卡等,2,3,面向目标的 性能监控,5为白金客 户提供稳 定的响应 时间,4 在白金客户违 规错误发生之 前自动告警,Gold,面向客户可定制业务驱动的服务质量(QoS)交付,议程,数据中心运维管理面临的问题与挑战,数据中心运维管理探讨数据中心运维管理的能力框架及建设演进业务驱动IT管理完整的平台管理全生命周期管理
16、总结,23,完整平台管理与能力框架的映射,网络门户产品目录业务服务管理,订单管理,.其它 业务服务,客户与业务用户用户体验管理业 务 交 易 管 理,业务驱动型应用管理,完整的云平台管理,全生命周期云管理,应用 中间件数据库 OS,VM,Servers 存储,网络,Oracle 支持服务,云服务 Apps,PaaS,DBaaS,IaaS.,24,服务器与存储告警 服务器故障管理 物理层与虚拟基础 设施层的依赖关系 分析,完整的、深度数 据库监控数据库自服务管 理(ADDM,AWR,ASH)自动化SQL优化,监控 Weblogic,SOA,CoherenceJVM诊断服务拓扑与依赖 关系分析,用
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据中心 管理 培训 ppt 课件

链接地址:https://www.31ppt.com/p-3524522.html