企业级性能管理与容量规划概述.ppt
《企业级性能管理与容量规划概述.ppt》由会员分享,可在线阅读,更多相关《企业级性能管理与容量规划概述.ppt(77页珍藏版)》请在三一办公上搜索。
1、企业级性能管理与容量规划概述,建立企业级容量规划、性能管理的业务效益,针对业务部门的需求,集成信息科技主管部门、软件开发中心、测试中心及运行中心等部门,通过统一、规范化的管理平台,对业务服务生命周期的容量规划、性能管理的流程。通过对IT资源容量有效的管理及对运行性能持续地监控,降低业务服务中断的风险。提前在新应用开发、测试阶段,建立起性能管理、容量规划的基线,从而了解新应用、或现有应用大版本变更对于现有生产运营带来的影响,从而降低与新的或改进的服务项目相关的风险。提高IT资源容量的利用效率,在恰当的时候及时适量投资,这意味着采购流程再也不需要应付临时的采购或超前于需求而购买过度的容量,从而总体
2、成本降低了。通过在确定变更对IT容量的影响时与变更管理密切配合,防止了由于不恰当或不正确的容量估计所导致的紧急变更,从而降低了业务运作中断的次数。更为灵活的预测使得对业务需求的响应变得更快速和更准确。职业装定制 工服定做,容量规划、性能管理及相互关系,容量规划主要管理以下几个方面:处理容量的购买成本相对于业务需求来说,是否合理以及处理容量是否以最有效的方式(成本vs容量)被加以利用?当前的处理容量是否足够满足业务当前以及未来的需求(供给vs需求)?现有的处理容量是否发挥了最大的效率(性能管理、调整)?额外的处理容量准确地讲应该在什么时候形成?是否知道未来需要什么样的IT容量以及何时需要这种容量
3、?容量规划与性能管理是互为包含的关系,是一个循环的交互关系:性能管理:为优化整体运营绩效而评价、监控和调整IT基础设施组件的性能的活动。容量规划:根据容量管理数据库分析当前的情况、预测IT基础设施未来的使用情况以及为满足预计的IT服务需求而需要的资源,从而制定容量计划的过程。建模:使用分析、模拟和趋势预测模型来确定服务的容量需求以及确定最佳的容量方案的过程。模拟需要分析各种不同的情形,并分析各种“如果怎么办”式的问题。职业装定制 工服定做,通过获取系统性能信息,全面掌控历史性能与容量趋势依据当前系统信息,预测业务增长的情况下,系统资源的使用的和性能响应,目标:,维持现有IT服务能力的成本相对于
4、组织的业务需求而言是合理的吗?现有的IT服务能力能满足当前及将来的客户需求吗?现有的IT服务能力发挥了其最佳效果吗?,方法:量化管理,致力于解决以下问题:,评价和改进现有服务能力,确保服务水平的承诺评估当前IT资源的使用,确保高效地使用资源分析并预测未来的业务需求,据此确定当前最佳容量以及未来应当配置的容量和对应的服务水平能力,容量规划和性能管理目标及方法,容量和性能管理是一个持续的管理流程,容量规划和性能管理是一个持续的管理流程,流程负责人设计并确定容量规划和性能管理流程流程负责人设计并确定该流程的角色和责任技术专家分析并确定管理需求,相关指标以及需要使用的工具,对于优化建议,技术专家负责规
5、划优化行动技术专家负责利用相应的调优工具,进行相应的系统或应用的调优工作优化后仍不满足要求,容量规划师负责提出增容建议,各管理环境的数据采集专家负责建立数据采集机制数据采集专家根据流程定义的采集周期定期地使用相关的工具采集所需的容量和性能指标并进行存储,容量规划师根据容量管理报告,根据历史信息定期预测未来容量需求 对于增容建议,容量规划师负责制定相应的容量规划,各管理环境的数据评估专家根据已存的容量和性能指标,生成所需的性能管理报告、异常报告以及容量管理报告技术专家根据异常报告分析异常指标,结合性能管理报告找到异常原因并提出改进建议(优化或增容),流程负责人负责监督管理流程的执行流程负责人定期
6、向上级汇报容量规划和性能管理的结果,容量和性能管理是一个持续的管理流程,容量规划和性能管理是一个持续的管理流程,重要角色企业系统性能架构师从宏观把控性能与容量的需求,技术以及流程业务代表作为业务部门的代表,提供性能标准,未来新业务开展及已有业务增长情况数据评估与采集专家采集,存储基础数据,生成所需的报告容量规划师跟踪项目确保与容量相关的服务级别合乎既定的要求技术专家作为某个特定领域的资深技术人员,深入分析优化的可能性并优化流程负责人类似于项目经理的角色,确保流程合规执行,容量和性能管理的人员组成,容量和性能管理的人员组成,管理报表分类,报表类型管理层报表,技术层报表概况、趋势、异常、详细报表固
7、定报表(日、周、月、年趋势)和交互报表专业条线报表专业条块分类主机系统,分布式系统网络系统存储系统专业报告类型性能报表健康检查报表性能对比报表系统容量报表容量预估报表业务条线交易种类和渠道统计报表,主机平台容量和性能管理报表,性能管理日报生产主机系统性能健康检查日报生产主机系统性能管理日报生产主机操作系统专业性能日报生产主机系统RMF III日报生产主机联机子系统性能管理日报生产主机数据库子系统性能管理日报生产主机批量性能日报生产主机存储性能及容量指标日报性能管理周报生产主机系统性能健康检查周报生产主机系统性能管理周报性能管理月报生产主机系统性能健康检查月报生产主机系统性能管理月报系统容量管理
8、报表容量预估管理报表,哪些由性能容量工具产生?哪些需要系统手段产生,分布式系统平台监控系统硬件资源的性能报表,系统信息包括虚拟空间利用率、页面读写错误情况、物理内存和虚拟内存使用情况、CPU利用率、平均负载情况磁盘资源包括空间利用率、节点(i-node)利用率、磁盘读写繁忙程度等。进程包括CPU利用率的进程、耗用内存最大的十个进程、进程利用情况列表其它监控资源磁盘性能RPC调用的性能情况用户访问情况服务器网络使用情况文件情况,网络硬件资源的性能报表,端口或线路的质量和使用率,网络设备级报表CPU利用率内存利用率Buffer利用率端口、线路的报表:端口速率带宽利用率丢包率错包率SAA,存储容量和
9、性能管理报表,与系统有关的性能管理,参照主机系统、开放系统相关的内容就存储子系统本身而言卷和数据的均衡分布是使性能达到最大的最重要的因素需要考虑cache block与文件系统及数据库的匹配联机交易系统最重要的IO性能指标是每秒的IO数和响应时间其次是吞吐量批处理应用吞吐量是最需要重点考虑的采用TPC等工具来实现对存储性能的监测。其中TPC所监测到的存储前端性能指标,可以和服务器上取得的RMF report,IO stat的值相对应。监测存储前端的卷的性能参数包括IO rate,data rate,response time,读写比,IO块大小等,其中读操作的cache命中率是判断IO特性的重
10、要指标后端性能参数主要包括array和rank级别的IO rate,data rate,response time,NVS full等参数,可以判断存储后端是否存在瓶颈,这些参数通常无法在服务器上取得通过取得的性能指标,结合disk magic和capacity magic可以对存储更好地planning,容量、性能管理贯穿在整个解决方案的生命周期中,异地灾备中心,运行中心及同城灾备中心,开发中心,测试中心,数据中心,信息科技主管部门,SLA的性能需求,业务部门,建立 容量、性能管理委员会,由一部三中心的人员组成按照SLA形成、维护性能的KPI技术研究(产品性能白皮书,性能基线)定期的容量规划
11、评估会根据容量预测,安排资源采购,性能监控及跟踪性能、容量信息收集,分析,评估系统性能调优,新应用性能预估、建模大版本变更性能预估、建模应用性能调优应用性能建模,按照SLA进行性能测试压力测试,需求、设计,开发,测试,发布,生产,研讨:公司在构建企业级容量评估、性能管理方面需要做哪些改进?,思考一下组织架构?规范流程?人员技能?辅助工具?预算开销?,企业级性能、容量管理总体功能架构,投资回报,服务级别报告,性能报告技术条线,业务服务,管理报表记录/结构定义,SQL 查询,被管理技术模块,数据收集,企业级性能、容量管理总体平台参考架构,TivoliPerformance Modeling,RMF
12、,SMF,Enterprise Portal,开发中心,测试中心,数据中心,信息科技主管部门,性能管理的定义,性能管理就是计划、定义、测量、分析、报告和调整计算机资源性能的过程。这些资源包括:主机系统硬件,如CPU,I/O等操作系统和子系统,如z/OS,CICS,DB2等数据网络应用系统服务历史趋势分析和报告以及资源容量的规划也是和性能管理相关的重要内容,性能管理的目标,性能管理的目标就是:通过有效地使用资源来达到性能服务水平(SLA)的承诺。通过对性能的调整降低响应时间、提高吞吐量,在满足SLA的基础上减少消耗。,性能管理的目标,统一的性能报告,制定性能管理的标准和程序手册,性能管理的组织架
13、构性能管理人员和他们的职责性能管理所适用的环境性能测量的标准报告的需求性能管理工具历史文件趋势分析性能管理例会报告和解决性能管理中的问题,。,。,性能管理的主要模块,数据收集:每日收集性能数据,积累形成周、月、年度等数据为性能分析和趋势分析提供原始数据;数据保留:制定性能数据的保存介质和期限;信息处理:日常规定的性能报告或管理层要求的报告处理作业;信息报告:主要以管理层的要求为主。主要针对性能瓶颈的分析和确定何时需要进行升级。,性能管理周期,当解决了一个瓶颈后,重新测量、重新评估性能来验证没有造成别的限制并确保所做的变更升效了,性能管理的步骤,定义服务水平目标(SLA)和度量标准收集性能数据从
14、性能数据中创建有价值的报表分析性能报告来确定是否满足了目标识别系统中的潜在瓶颈分析可疑瓶颈处的详细性能数据决定从哪可以获得所需的资源验证是否消除了性能瓶颈,主机性能指标-宏观性能指标,响应时间(Response Time)外部吞吐率(ETR)和内部吞吐率(ITR)系统饱和点(SDP)资源使用率(Utilization),主机性能指标-宏观性能指标 响应时间,主机性能指标-宏观性能指标 吞吐率,ETR:按照Elapse Time来测量,注重系统容量;ITR:按照CPU时间来测量,注重CPU的容量,提问:对于相同的工作负载,哪个系统更好?,主机性能指标-宏观性能指标 系统饱和点,SDP的定义是,为
15、保证一个系统在小间隔内的使用率不超过100%,最大的平均大间隔的使用率。大间隔、小间隔的选择(例如1小时、1分钟),决定于用户的忍耐程度。例如,用户在一小时内不能容忍任何一分钟的使用率达到100%,那么小时平均使用率就不能超过计算出的SDP值。假设,小时平均值为80%,而此小时内分钟峰值为92%,则SDP=80*100/92=87%,混合工作负载时响应时间与CPU利用率关系图,主机性能指标-微观性能指标 I/O,IO Response=IOSQ+Pending+Connect+DisconnectIOS Queue Time:表示在z/OS中设备等待的时间.Pending time:表示从发出
16、SSCH指令直到Channel和I/O控制器之间开始对话.Disconnect time:I/O操作已经开始,但是Channel和I/O控制器之间没有对话.Connect time:Channel和I/O控制器Cache之间作数据传输或交换控制信息.,应用性能指标,不同的代码编写方式对系统性能的影响是不一样的应用程序性能指标体现在代码的编写方式CICS指令写法DB2 SQL语句写法文件组织方式及定义属性其他如果应用程序存在性能问题,ITR往往不会线性增长,导致不能正确预估系统容量如果某支交易存在应用程序性能问题,往往会影响其他80%正常交易的运行,性能管理的工具,联机工具Tivoli OMEG
17、AMON 系列SMFCICS CMFDB2 TraceRMFz/OS Management Console后处理工具Tivoli Decision SupportCICSPADB2 PE应用性能分析工具Application Performance Analyzer 高级管理系统包括性能数据仓库以及报表/展现工具,性能管理交付件,性能管理手册性能管理的系统和数据仓库,各种日常报告和趋势分析报告、系统资源调优/升级建议等性能管理日志,性能管理自动化及其主要需求,全面的数据源采集,支持技术人员在对性能问题进行深层次的分析时能够及时获取所需的所有数据,提高问题分析的效率数据采集、加工与存储应形成一个
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 企业级 性能 管理 容量 规划 概述
链接地址:https://www.31ppt.com/p-5222275.html