583742511XX气象局高性能计算服务器方案.doc
《583742511XX气象局高性能计算服务器方案.doc》由会员分享,可在线阅读,更多相关《583742511XX气象局高性能计算服务器方案.doc(73页珍藏版)》请在三一办公上搜索。
1、 XXXX气象局高性能计算服务器系统技术方案建议书中国惠普有限公司目 录第一章 前言1第二章 系统需求分析32.1系统应用特点32.2高性能计算服务器性能评价体系及选型依据32.3高性能存储系统72.4系统设计原则7第三章 总体方案建议93.1 方案技术概述93.2方案逻辑结构123.2.1 ccNUMA体系构架的多处理器服务器123.2.2 集群高性能计算解决方案133.3 性能指标和成功案例193.4 HP安腾高性能计算解决方案优势23第四章 技术说明书254.1 操作系统HP-UX简介254.2 惠普HP-UX Process Resource Manager(PRM)264.3 HP
2、Integrity server SuperDome简介314.3.1 SX1000芯片组介绍334.3.2 HP Integrity Superdome系统参数列表384.4 HP 1000 光纤阵列柜39第五章 实施计划415.1 项目管理及支持服务人员安排415.1.1 项目实施小组组织原则415.1.2 项目组成员职责415.1.3 项目支持人员组成425.2 项目实施日程安排435.3 项目实施内容435.3.1 第一阶段:项目实施的准备工作435.3.2 第二阶段:到货设备的清点与验收445.3.3 第三阶段:系统安装的具体实施445.3.4 第四阶段:系统联调465.3.5 第五
3、阶段:系统的验收465.4 项目培训计划46第六章 中国惠普服务介绍486.1中国惠普技术支持服务体系486.2中国惠普公司售后服务的种类496.3中国惠普公司对本项目的支持服务516.4备品备件管理方案介绍536.5惠普各分公司及技术人员资料信息54惠普产品保修服务说明55客户机房准备要求通知书57第一章 前言HP公司非常荣幸能为XXXX气象局高性能服务器系统建设提出建议。作为全球最大的计算机厂商之一,HP公司具有一流的产品、技术和服务。在本方案建议书中,HP公司推荐了先进的系统建设方案,考虑了系统的实用性、高可用性、安全性、可管理性以及灵活扩展能力。HP公司凭借先进的技术和出色的支持服务,
4、相信通过双方的合作,可使XXXX气象局高性能服务器系统建设项目顺利实施,从而为用户提供一个健壮、安全、高可用的运行环境,并进一步建立长期的友好合作关系。高性能计算系统是提高一个科研机构研究水平的重要基础设施,也是一个国家科技与经济实力的标志。它不仅是一个高速处理的计算机系统、更重要的是在其之上运行的各种应用对科学领域产生非常深远的影响 。无论是在天气与气象研究,理论物理, 计算化学,能源管理,生命科学(life science) ,地理信息系统(GIS),核模拟还是生产制造系统等重大科技领域, 如果没有与之相适应的高性能计算机系统,这些科技项目将无法取得重大进展和突破。为适应高性能计算应用对计
5、算机系统的要求,HP公司长期致力于高性能计算机系统的开发和研究,并制造了一系列高性能计算机系统; 运算能力从每秒几百亿次到几十万亿次。这些高性能计算机系统在高性能计算领域发挥了不可替代的作用。作为全球领先的高科技公司,HP一直在领导着发展潮流,并以31.5%的市场份额已经成为全球高性能计算市场的领导者。不久前,HP刚刚发布了一个包括硬件、软件和服务的全面打包方案,以降低客户在高性能计算领域的复杂性。在中国软件行业协会数学软件分会和国家863高性能计算机评测中心,于2004年11月15日联合公开发布的2004年中国高性能计算机性能TOP100排行榜中,HP公司再次成为最大的赢家。在所有TOP10
6、0榜上有名的超级计算机中,HP系统占据了58个席位,这也就意味着,在100台中国最快的计算机中,有58台来自HP的系统。这一数据是第二和第三名之和的近2倍。在2003年中国软件行业协会数学软件分会发布的2003年中国高性能计算机性能TOP100排行榜中,HP的总体装机量达到了57%。这充分显示了HP在高性能技术计算领域无人企及的领先地位,同时也反映出中国市场对HP系列服务器的强大需求。在天气与气象研究领域,HP公司与著名的数值预报软件MM5的开发者NCAR有着长期的合作关系。MM5的多个版本以及下一代的数值气象预报模型WRF均是在HP公司的Alpha高性能计算机上进行开发的,HP公司还帮助NC
7、AR建立了开放式培训中心和网上实时预报系统,用于MM5的培训和推广。NCAR在网站上公布的测试结果表明,无论对于中小规模还是大规模区域的数值预报,HP所提供的高性能服务器平都是最佳的计算平台,在计算性能和线性扩展能力商均领先于其他高性能计算平台。我们深信,通过采用HP的高性能计算系统 ,必将加速XXXX气象局在高性能计算领域取得更加丰硕的科研成果。 中国惠普有限公司2004年11月第二章 系统需求分析2.1系统应用特点在传统意义上高性能计算应用是属于CPU和内存密集型的应用,它对所运行的计算机体系结构(超级计算机体系结构)提出了几个主要的要求: 浮点计算能力(尤其是64位双精度浮点运算),内存
8、带宽和内存容量及体系框架。所有这些因素都是相互关联的。高性能计算通常利用各种数学方程式来建立模型和模拟物理现象。随着各种模型越来越大,越来越复杂,数据集的规模也急剧增长。例如,一个100*100*100的栅格包含100万个元素,该模型仅占用32MB内存,如果此栅格的分辨率提高10倍,这一模型就变为1000*1000*1000,包含10亿个元素,此模型的原始数据将占用32GB的内存!因此不论是分布式内存还是共享式内存,要将此数据传输至内存中,由CPU处理,就需要高带宽,高容量,低延迟的体系结构,当然还需要强大的CPU进行计算。而超级计算机主要用来处理这样庞大的工作负载。这样的负载所要求的超级计算
9、机一定是采用快速的CPU,高性能的内存和I/O子系统,旨在实现最高的运算速度。同样这样的负载所要求的超级计算机还必须采用多级别并行处理技术,能够利用几十个甚至几千个处理器来处理一项任务;这样的并行处理技术也需要超级计算机要采用高性能的互连设备和系统设计,以较高的成本去换取最高的性能。2.2高性能计算服务器性能评价体系及选型依据 衡量主机系统或处理器计算处理能力的测试体系(BenchMark)也有多种,如SPEC、Linpack等, 尤其是通过Linpack值更可以衡量一个主机系统或一个处理器芯片的实际运算能力, 而不仅仅是虚的理论峰值能力。 过去,人们使用系统能够达到的执行指令最大速率如每秒执
10、行百万指令数/浮点操作数(MIPS/MFLOPS)来量度计算机硬件性能。但是,这些量度指标的实用价值十分有限,它们只能给出理论上最大的性能,并没有全面反映计算机系统的实际性能如内存带宽、内存延迟和I/O性能等。此外,硬件性能量度和系统体系结构都是非标准的,使得人们很难使用它们作为服务器选型的性能指标。因此,出现了计算机系统性能基准测试的概念,即由某些中立的非盈利机构开发出一组经过精心统筹设计和组合的程序,来量度计算机系统运行这组程序的性能指标。此类程序一般称为基准测试程序。不同的计算机系统都运行同一组基准测试程序,就可以相对客观地比较计算机系统的性能。目前有许多专门设计基准测试程序和管理各种计
11、算机系统基准测试指标的机构,其中最著名的是SPEC和TPC。 基准测试可以分为三类: 1、 系统基准测试指标:用于测试计算机各子系统的性能,其中主要有: SPEC CPU2000 用于处理器子系统的指标; McCaplin Stream用于测试内存带宽指标; TPC-C用于测试在线事务处理指标性能指标; 2、 标准应用基准测试指标:用于测试计算机系统执行某种标准的应用的性能指标,其中主要有: SPEC WEB 99用于测量计算机执行 Web应用的性能指标; SPEC MAIL2000 用于测量计算机执行电子邮件应用的性能指标; SPEC JBB2000,SPEC JVM98 用于测量计算机执行
12、JAVA 应用性能指标; Linpack用于测量计算机进行线性代数计算的性能指标(也常作为测量计算机浮点计算速度的基准测试指标); SPEC HPC96 用于测量计算机执行HPTC应用的性能指标; SPEC SFS97 用于测量计算机执行网络文件系统应用的性能指标; TPC-D专门用于测量计算机执行数据仓库应用的性能指标; SPEC glperf 和 SPEC viewperf 专门用于测量计算机执行图形和图象显示方面应用的性能指标;3、 实际应用基准测试指标:许多重要的独立软件开发商(ISV)都制订了计算机系统运行本公司开发的软件产品的基准测试指标。例如,在数据库应用方面Oracle、Inf
13、ormix、 Sybase公司的基准测试指标;在企业应用方面SAP、SAS、PeopleSoft、Baan等公司的基准测试指标;在HPTC方面运行Amber、CHARMm、Fluent、LS-DYNA、MARC、ANSYS等著名应用软件的指标等; 由于在XXXX气象局的主要应用NCAR MM5模式系统的程序(TERRAIN,REGRID,RAWINS/little_r,INTERPF/NESTDOWN,INTERPB,GRAPH/RIP和MM5)中尺度数值模式考虑高分辨的地形和陆面使用状况等重要的局地迫动因子,并可使用复杂的物理参数化方案,来研究和预测高分辨的局地中尺度天气现象,其相对于大模式
14、的灵活性、细致性,使其应用范围迅速扩大,如各种中尺度天气系统的研究。MM5模式系统的程序主要是Fortran程序,属于计算密集性任务。因此,XXXX气象局在进行高性能服务器选型时,需要衡量的主要指标包括:服务器的整体性能指标:l SPECint_2000:单CPU执行以整数运算为主应用软件的性能指标; l SPECfp_2000:单CPU执行以浮点运算为主应用软件的性能指标; l SPECint_rate2000:多处理器计算机系统执行以整数运算为主应用软件的性能指标; l SPECfp_rate2000:多处理器系统执行以浮点运算为主应用软件的性能指标;前两个指标一般称为核心SPEC基准测试
15、指标,是为测量CPU性能设计的。它们主要测量CPU和高速缓存的性能,某种程度上也反映内存子系统的性能。由于,CPU不能单独执行程序,所以人们也经常使用核心SPEC基准测试指标来量度CPU芯片的速度。但是,它们并不测试多处理器系统性能、处理器间通信或系统级内存带宽等。因此,有时小的系统可能提供比大的系统更高的核心基准测试指标。当然这并不意味着小系统有比大系统更高的信息处理能力。后两个指标称为Rate基准测试,它们把负载加在整个系统上,用于测量多处理器系统的性能指标,特别强调CPU个数、系统级内存性能等。Rate基准测试指标随着CPU个数的增加而提高。因此,人们经常使用核心基准测试指标来测试CPU
16、本身和单CPU系统的指标,使用Rate基准测试指标来测试多处理器和多计算机系统(包括CPU、内存和带宽等)的性能指标。SPEC CPU2000使用整数和浮点数两组基准测试程序。整数基准测试程序组CINT2000 由表2-1所示的11个执行整数计算的程序组成,这些程序大都是用C语言编写的,有一个(252,eon)是用 C+编写的,所给出的SPECint_2000和SPECint_rate2000指标是计算机系统执行这11个程序的性能平均的结果。浮点基准测试程序组CFP2000由14个执行浮点计算的程序组成,这些程序中6个是用Fortran77语言编写的,4个是用 Fortran 90语言编写的,
17、4个是用C语言编写的。所给出的SPECfp_2000和SPECfp_rate2000测试指标是计算机系统执行这14个程序的性能平均的结果。(表 2-1 CINT2000 的 组 成 程 序)程 序 名 称 应 用 164.gzip数 据 压 缩 实 用 程 序 175.vprFPGA 电 路 布 线 176.gccC 语 言 编 译 程 序 181.mcf最 小 成 本 网 络 流 求 解 程 序 186.crafty下 棋 程 序 197.parser自 然 语 言 处 理 程 序 252.eon光 线 示 踪 253.perlbmkPerl254.gap计 算 群 论 255.vortex
18、面 向 对 象 数 据 库 256.bzip2数 据 压 缩 实 用 程 序 300.twolf位 置 和 路 由 仿 真 程 序 (表 2-2 CFP2000 的 组 成 程 序)程 序 名 称 应 用 168.wupwise量 子 色 彩 动 力 学 171.swim浅 水 模 型 172.mgrid多 网 格 方 法 求 解 3D 位 势 场173.applu抛 物 /椭 圆 偏 微 分 方 程 177.mesa3D 图 形 库 178.galgel流 体 动 力 学 179.art神 经 网 络 模 拟 ; 自 适 应 推 理 183.equake有 限 元 模 拟 ; 地 震 模 型
19、187.facerec计 算 机 视 觉 ; 识 别 人 像 188.ammp计 算 化 学 189.lucas数 论 ; 质 数 测 试 191.fma3d有 限 元 碰 撞 模 拟200.sixtrack粒 子 加 速 器 模 型 301.apsi求 解 大 气 温 度 、 风 向 、 速 度 和 污 染 物 分 布 问 题 Linpack:Linpack 是美国田纳西大学的Jack Dongarra创立和管理的基准测试指标。它是一组用于分析和求解线性代数方程和线性最小二乘问题的 Fortran子程序,其中的矩阵可以是一般的,也可以对称正定、带形、三对角等特殊形状的。Linpack 广泛应
20、用于测量计算机系统执行浮点计算 (特别是线性代数计算)的性能指标。是高性能计算服务器性能参考的重要依据。任何一项基准测试指标都有其局限性和片面性。有的厂商往往按照自己的优势领域来诠释,过份强调某项指标、贬低或不公布其他指标,这样很容易误导用户。事实上,性能指标都是以系统资源容量(处理器、内存、磁盘、I/O接口等)以及系统架构是否能够充分发挥资源潜力为基础的。对于XXXX气象局的用户而言,只有从实际(系统资源容量和架构)出发,全面考察系统的基准测试指标,充分考虑实际的应用,才能作出科学和客观的评估,选择最佳的服务器。2.3高性能存储系统在高性能计算系统应用中, 除了对高运算能力的需求外, 对存储
21、的需求也是必不可少。在高性能计算应用中,经常需要短时读写大批量的数据,这对存储系统的性能,尤其是多道并行作业同时存取大量数据时的I/O性能,会提出很高要求. 如果这一要求用在计算节点上直接连接大量的本地存储磁盘子系统来满足,那么, 这样会出现多台计算节点之间产生多次数据传输和磁盘容量不均及大量冗余且不一致的文件等现象, 而这些现象既耗用了大量的传输时间和计算节点宝贵的处理资源,又使得管理难度加大,降低了投资的使用率, 从而使整个系统的性能也很难保证。 在当前高性能计算系统中, 越来越趋向于使用多台独立的高性能服务器和外部存储阵列专门作为存储服务系统, 高性能计算系统中的所有计算节点可同时存取数
22、据文件, 将来还可过渡到为其它系统提供信息存储服务。2.4系统设计原则HP公司为XXXX气象局高性能计算系统设计方案的基本出发点:帮助用户建立一套既能最大限度地满足用户实际需要且技术又处于领先地位的高性能计算环境。HP公司认为,XXXX气象局高性能计算系统应具有处理大规模的复杂运算,尤其是浮点运算的能力 。它将为XXXX气象局提供优化工程设计、分析、验证的手段,最终实现提高设计质量、缩短开发周期、降低开发成本。中国惠普公司提供的解决方案是遵循以下原则设计的:1先进性本系统方案所采用的技术既要符合业界的发展方向,又要在未来几年内仍具有很高的技术先进性,保持在同类系统中的领先地位。这样有利于提高整
23、个系统的计算与处理能力 。2. 优越的性能高性能计算系统应具有优秀的处理能力,它不仅具有符合要求的峰值性能 (Peak Performance), 更重要的是应具有稳定的应用性能(sustained performance) 。各种复杂的研究课题在本系统中能够得到准确,快速的计算结果 。3. 可扩展性 系统应具有很强的扩展能力 。 随着对计算机系统性能的要求不断提高, 该计算机系统应具有扩展能力, 并且容易实现 。4. 开放性和兼容性本计算机系统应符合公认的工业标准, 包括体系结构,硬件,I/O, 网络,操作系统,开发环境和开发工具等 。这样,便于和其他平台上的系统互操作 。 5应用软件丰富本
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 583742511 XX 气象局 性能 计算 服务器 方案
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-4291294.html