基于自主计算的集群管理软件的设计和实现.ppt
《基于自主计算的集群管理软件的设计和实现.ppt》由会员分享,可在线阅读,更多相关《基于自主计算的集群管理软件的设计和实现.ppt(35页珍藏版)》请在三一办公上搜索。
1、2023/6/25,北航计算机学院,1,基于自主计算的集群管理软件的设计和实现,作者:李云春、张德生、李强,2008年10月29日,2023/6/25,北航计算机学院,2,报告内容,研究背景主要研究内容ACMS体系结构和功能模块实现ACMS事件通知机制节点代理的自配置机制中间汇集节点的自恢复机制工作总结和展望,2023/6/25,北航计算机学院,3,概述,课题来源北航校园网格建设中对集群计算环境的管理需求十一五863计划信息技术领域重大项目:高效能计算机系统研制及关键技术研究 2007AA01A127 研究背景集群占据了我国高性能产品和应用的90%份额集群管理日趋复杂北航校园网格目前采用gan
2、glia集群监测软件,无法满足需求平均故障恢复时间较长,自主计算研究计算系统的自管理问题,为集群系统管理提供了一种新的思路,2023/6/25,北航计算机学院,4,自主计算,IBM于2001年提出自主计算的概念思想起源于人体的植物神经系统其动机是试图通过“技术管理技术”自主计算系统具有的属性自动修复自动优化自我保护自动配置,2023/6/25,北航计算机学院,5,集群管理的国内外相关研究,Ganglia树状分层式结构,可扩展没有解决非叶子节点层的容错,易造成单点故障Supermon基于linux集群的分布式监控不能动态添加节点Hawkeye可以定制资源监测模块,适用多平台系统客户端工具还不完善
3、国内曙光公司的DCMM集群监控系统面向曙光服务器集群,软硬件结合,研究现状:1、国外起步较早,国内相对滞后2、大多侧重集群的监测3、缺乏自主管理能力,2023/6/25,北航计算机学院,6,报告内容,概述主要内容ACMS体系结构和功能模块实现ACMS事件通知机制节点代理的自配置机制中间汇集节点的自恢复机制工作总结和展望,2023/6/25,北航计算机学院,7,消息通信机制,命令通道,事件通知机制,ACMS自主管理模型,管理策略,集群资源,分析,传感器,效应器,消息通信机制,决策,监视,执行,事件信息模型,IBM自主计算框架没有解决具体实现问题:1、管理策略2、事件信息模型3、组件之间的消息通信
4、机制,2023/6/25,北航计算机学院,8,ACMS体系结构,JNDI连接,资源监视泵,中间汇集组件,动态发现,管理服务,资源探针,节点代理服务,分析决策引擎,监视组件,资源中介,执行组件,数据库,事件模型,数据库组件,管理服务器,WEB用户界面,监测视图,性能曲线,负载预测,自主管理,事件通知机制,中间汇集节点,域内节点,域内节点,应用层,管理服务层,代理服务层,域内节点,2023/6/25,北航计算机学院,9,节点代理服务的功能模块实现,MBean Server,CPU,Memory,Disk,Network,OS,Tomcat,管理服务组件,资源监视泵,节点动态发现,中间汇集组件,资源
5、探针组件,各组件设计为标准MBean组件,利用Jmx的动态类装载服务mlet服务实现远程URL路径的动态注册和加载,资源探针注册为资源监视泵中线程实例,中间汇集组件收集域内节点的监视泵的事件消息,节点动态发现组件实现节点自配置,动态发现,注册,运行时可管理可扩展,2023/6/25,北航计算机学院,10,ACMS体系结构,JNDI连接,资源监视泵,中间汇集组件,动态发现,管理服务,资源探针,节点代理服务,分析决策引擎,监视组件,资源中介,数据库组件,数据库,事件模型,执行组件,管理服务器,WEB用户界面,监测视图,性能曲线,负载预测,自主管理,事件通知机制,中间汇集节点,域内节点,域内节点,域
6、内节点,管理服务层,2023/6/25,北航计算机学院,11,管理服务器的功能模块实现,资源中介,事件监听,节点连接器,访问接口,监视模块,消息中间件,事件解析器,连接器,分析决策引擎,数据库模块,执行模块,消息中间件,Java规则引擎,分析处理单元,连接器,规则文件,消息中间件,数据库ORM,消息中间件,执行器,事件信息模型,访问接口,数据库,Web界面,节点代理,自主管理控制环路,2023/6/25,北航计算机学院,12,基于规则的策略决策,决策的问题依据当前的状态,决定采取什么样的动作传统的控制理论建立数学模型计算机系统管理复杂性很难建立建立精确的数学模型基于规则的控制将规则表示为产生式
7、规则产生式规则一般形式IF(条件1)and(条件2)andand(条件m)THEN(动作1)and(动作2)and and(动作n)规则引擎基于规则的专家系统的推理引擎试探性规则正向推理和反向推理,2023/6/25,北航计算机学院,13,分析决策引擎,管理服务器模块的核心组件,通过java规则引擎实现基于规则的自主管理控制五种管理级别采用Drools的规则语言定义规则 cpu_alarm_ra.isActive()CpuMonitorHelper.isOverThreshold(cpu,80)CpuMonitorHelper.cpuMetricAlarm(cpu);,监视、警告、报警、建议、
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 自主 计算 集群 管理软件 设计 实现

链接地址:https://www.31ppt.com/p-5316739.html