《高能计算介绍》PPT课件.ppt
高性能计算介绍,什么是高性能计算?(HPC)1.高速运算 2.大内存 3.海量存储,常见的高性能计算的实现 1.多CPU共享内存结构(SGI Altix 3000)2.集群(cluster)结构(联想计算集群)操作系统 Unix,Linux,Windows并行开发软件 MPI,OpenMP,SGI Altix 3700体系结构,一 系统模块1.C brick:32个1.3GHz/3M Intel Itanium2 cpu2.M brick:32G内存3.R brick:路由4.IX brick:输入/输出5.D brick:硬盘扩展(连接1T盘阵),二 体系结构:,NUMAflex全局共享内存的结构 所有内存统一编址,全局共享 本地与远端内存的存取速度不同优点:均衡的、可扩充的性能低延迟的内存访问适于HPC的优化的操作环境容易配置,操作系统,系统软件:64位Linux Advanced Server+SGI HPC ProPack编译器:Intel C,C+,Fortran,Math Kernel Library,MPI 并行,OpenMP 并行,并行计算,SGI HPC 并行开发软件包:SGI MPT(Message Passing Toolkit)优化的MPI 和SHMEM 并行编程库 MPT 在多个分区系统的性能和在SSI上一样,在跨节点时无性能损失SGI NUMA工具集:包含指定cpu、内存的管理工具:cpuset,memset,dplaceSGI 集群软件(Array Services)定义和管理集群的配置,管理运行在集群上的作业集SGI Performance Co-Pilot:图形化的性能监测工具SGI FFIO:对特定I/O 传输的控制SGI 科学函数库SCSL,用户使用初步,一:用户登录:在windows操作系统下:1.安装xmanager等软件模拟xwindows图形化界面 2.利用ssh-client软件远程登录 在Linux系统下直接使用ssh 命令登录,二:上传下载文件:在windows操作系统下:利用ssh-client软件的sftp功能 在Linux系统下直接使用sftp 命令,Linux 基本命令:whoami lists your login name ls lists filenames in working directory ls-l same list with additional information ls-l|more if list too long;page down with space barcp file1 file2 copies file1 to file2(NB:exists already?)mv file3 file4 file3 is renamed file4 rm file1 discards file1.Clean up from time to time.mkdir dir1 creates new directory with name dir1 mv file2 dir1/file2 moves file2 to directory dir1 mv file2 dir1/does precisely the same,cd dir1 change working directory to dir1 cd.go back(one branch down the tree)rmdir dir1 discard dir1(works only when empty)pwd lists path to working directory ps-ef list of activities of computer ps-ef|more if list is too long efc-O2 prog.f-o prog see file Howto.txt for details progoutput1 run program prog;output in file output1 progoutput1 the same using input file named input2 progoutput1&the same in background control-c if cursor does not return:kill task,编译普通程序:1.how to compile a fortran program?efc-O2 tpp2 yourprog.f-o yourprog.out2.how to compile a C program?ecc-O2-tpp2 yourprog.c-o yourprog.out,编译并行程序:1.openmp paralleled fortran program efc-O2-tpp2-fpp-openmp yourprog.f-o yourprog.out 2.mpi paralleled fortran program efc-O2-tpp2 yourprog.f-o yourprog.out-lmpi 3.openmp paralleled C program ecc-O2-tpp2-openmp yourprog.c-o yourporg.out,运行编译好的普通或OPENMP并行程序:1.without input:./yourprog.out or./yourprog.out&2.with input file:./yourprog.outoutputfile&观察你的程序的运行情况:Top or ps-ef|grep yourlogname,作业调度,采用PBS pro作业调度软件对用户提供作业服务,对用户的作业进行排队管理好处:1.为计算资源提供统一的用户界面 2.极大提高计算资源的利用率 3.根据用户或任务分配有限资源 4.减少系统管理的负担管理命令:qmgr,qstart,qstop用户命令:qstat,qsub,qdel,提交作业的方法,编辑一个作业文件,对作业要求的计算资源作出说明,例如,job_sample:,#PBS-N small#PBS l walltime=160:00,mem=100mb,ncpus=4#PBS-m bempirun-np 4/home/wenan/mc2do3/mpimc2do3q.out/home/wenan/mc2do3/outmpi#this sample for a mpi program,执行:qsub job_sample q big其中job_sample是作业文件,big是欲提交的作业队列名。,查看作业状态:qstat q:列出所有队列的情况 qstat a:列出用户自己的作业的状态,