毕业设计(论文)并行文件系统的安装与测试.doc
《毕业设计(论文)并行文件系统的安装与测试.doc》由会员分享,可在线阅读,更多相关《毕业设计(论文)并行文件系统的安装与测试.doc(27页珍藏版)》请在三一办公上搜索。
1、并行文件系统的安装与测试摘要分布式文件系统以其高可靠性、高可扩展性以及高性能和高性价比成为高性能计算平台存储系统的首选,已经在军事技术、天气预报等环境中得到广泛应用。相比其它文件系统,它具有两个特点:一是通过数据的分布存储,来提供更大的存储空间,并利用并行的IO服务模式提供更高的IO带宽;二是通过使用各种新颖的分布式存储体系结构,来为应用程序提供更丰富的IO模式。比如通过使用对象存储技术,为应用程序提供面向对象的数据存储格式,并提供Peta级大小的存储空间。Lustre是典型的基于对象存储体系结构的并行文件系统,它起源于卡耐基梅隆大学的Coda项目研究工作,已经成为当前高性能计算领域使用最广泛
2、的并行文件系统之一。Lustre具有良好的大文件IO性能,但是由于Lustre使用分布式的存储体系结构,文件元数据和数据分开存储,它的小文件IO性能低下,甚至不如本地文件系统。本文以Lustre为研究对象,进行并行文件系统的安装与测试,并与传统的分布式文件系统(NFS)和其他几种并行文件系统进行简单比较,分析并行文件系统及Lustre的存储结构,研究并行文件系统作为存储系统的好处及其传输速度,提出改进建议。关键词:分布式文件系统 Lustre IO性能ABSTRACTDistributed File System has been widely applied in High Performa
3、nce Computation fields such as militaris tstrategist,weather forecastThese fields speciality needs the distributed file system being of highly throughput and availability. The distributed file system has been the main storage architrave of HPC environment. It has two characteristics: one is the bigg
4、er capability and higher aggregation IO bandwidth by distributed data storage;the other is abundant of the IO access mode,such as the objectbased data pattern by use object-based storage architectureLustre is a typical object-based distributed file system. It origins from the coda project in Carnegi
5、e university, and has become one of the widely used distributed file system in HPC filed. It has favourable big file IO performance, which has almost Peta degree aggregation IO bandwidth. Therefore, because of its distributed storage architecture which placing file data and meta data separately. Its
6、 small file IO performance is not so well, even lower than that in the local file system. This paper researches the benefits of distributed file system and its speed of transmission by installing and testing the Lustre file system and comparing with NFS and other kinds of distributed file system. It
7、 has also analyzed storage structures of the Lustre and distributed file system.Key words:distributed file system,objectbased storage,I0 performance目 录并行文件系统的安装与测试1一、引言4二、研究现状42.1 分类42.2 其余并行文件系统52.2.1 PVFS52.2.2 GPFS52.2.3 PFS62.2.4 DAFS62.3 分布式文件系统中的存储结构62.3.1 对称式虚拟存储系统72.3.2 非对称式虚拟存储系统82.3.3 数据块虚
8、拟存储系统和虚拟文件系统9三、Lustre 简介93.1 Lustre 介绍93.2 Lustre 系统架构103.3 Lustre 运行机制113.4 性能特点12四、各部分功能剖析134.1 元数据服务器MDS134.4.1存储系统中各文件的元数据134.4.2维护各个文件的生命状态144.4.3维护整个文件系统的状态144.2 对象存储服务器144.3 Client组件14五、系统安装155.1首先安装一个MDS165.2.安装OST部分175.3. lustre分布文件系统建立完成185.4.客户端挂载18五、系统测试195.1 测试流程195.2 测试结果215.3 结果分析21总结
9、22致谢23参考文献23一、引言高性能计算技术在国内外越来越受重视,许多行业的应用都离不开它,如天气预报、军事技术等。随着电子制造技术的发展,计算机的计算速度越来越快,几百万亿次的巨型计算机已经很常见。CPU计算能力、内存容量等指标不断提高,但是磁盘的存储能力由于受其机械结构的限制,发展缓慢,磁盘带宽的增长速度远远低于CPU计算能力的增长速度,于是出现了计算机的IO速度与计算速度不匹配的情况。因此,高性能计算环境中,必须有相应的高性能的存储系统。随着大规模科学计算处理的数据量越来越大,计算机的IO处理速度成为决定计算机速度的一个主要因素,高性能计算环境离不开大容量、高速度的存储系统,存储技术也
10、逐渐成为研究的热点。随着人们对存储技术的研究,计算机的存储体系结构不断变迁,并设计出各种高吞吐量、高IO带宽的并行文件系统。高性能计算环境中,通过采用SAN、NAS等新型存储结构,使用新型的并行文件系统,来大幅度提高其IO速度。分布式文件系统(Distributed File System)是指文件系统管理的物理存储资源不一定直接连接在本地节点上,而是通过计算机网络与节点相连。分布式文件系统的设计基于客户机/服务器模式。一个典型的网络可能包括多个供多用户访问的服务器。另外,对等特性允许一些系统扮演客户机和服务器的双重角色。例如,用户可以“发表”一个允许其他客户机访问的目录,一旦被访问,这个目录
11、对客户机来说就象使用本地驱动器一样。本文研究的Lustre文件系统是典型的基于对象存储技术的并行文件系统,它来源于卡耐基梅隆大学的Coda项目研究工作,2003年12月发布了1O版,目前已经发布到18版。Lustre在国外的许多高性能计算机构(如美国能源部,LosAlamos国家实验室,Sandia国家实验室,Pacific Northwest国家实验室)的高性能计算系统中都己经得到了应用,Top500 10台机器中有多台采用Lustre。二、研究现状2.1 分类分布式文件系统(Distributed File System)分为三种:1) 网络文件系统(NFS) 最早由Sun微系统公司作为T
12、CP/IP网上的文件共享系统开发。Sun公司估计现在大约有超过310万个系统在运行NFS,大到大型计算机、小至PC机,其中至少有80%的系统是非Sun平台。2) Andrew文件系统(AFS) 结构与NFS相似,由卡内基梅隆大学信息技术中心(ITC)开发、现由前ITC职员组成的Transarc公司负责开发和销售。AFS较NFS有所增强。3) 分布式文件系统(DFS) DFS是AFS的一个版本,作为开放软件基金会(OSF)的分布式计算环境(DCE)中的文件系统部分。如果文件的访问仅限于一个用户,那么分布式文件系统就很容易实现。可惜的是,在许多网络环境中这种限制是不现实的,必须采取并发控制来实现文
13、件的多用户访问,表现为如下几个形式:只读共享 任何客户机只能访问文件,而不能修改它,这实现起来很简单。受控写操作 采用这种方法,可有多个用户打开一个文件,但只有一个用户进行写修改。而该用户所作的修改并不一定出现在其它已打开此文件的用户的屏幕上。并发写操作 这种方法允许多个用户同时读写一个文件。但这需要操作系统作大量的监控工作以防止文件重写,并保证用户能够看到最新信息。这种方法即使实现得很好,许多环境中的处理要求和网络通信量也可能使它变得不可接受。2.2 其余并行文件系统除Lustre并行文件系统,当前的主流分布式文件系统包括:PVFS、GPFS、GFS、PFS、SFS、DAFS、Lustre等
14、,它们之间的许多设计思想类似,如将文件分散于多个存储节点上以提供并行IO访问等。2.2.1 PVFSPVFS(Parallel Virtual File System)是Clemson大学的一个构建在Linux操作系统上的开放源码的并行虚拟文件系统。它在结构上采用传统的cs(客户端服务器)架构实现,整个文件系统由管理结点、I/O结点和计算结点组成。管理结点负责处理文件的元数据,I/O结点负责文件数据的实际存储和读写,并向计算结点提供所需要的数据。在整个集群系统范围内采用一致的全局命名空间。它也使用对象存储的概念,将数据条块化为多个对象,分别存储到多个结点上。在网络通信上,它只支持TCP网络通信
15、协议,不如Lustre灵活。由于PVFS使用对象存储结构,所以小文件性能也不好。2.2.2 GPFSGPFS(General Parallel File System)是IBM为Linux集群系统设计的并行共享磁盘文件系统,它的前身是Tiger Shark多媒体文件系统。在存储设计上,它借鉴了IBM Linux集群系统中的“虚拟共享磁盘技术,即计算结点通过交换网络来并行访问系统中的多个磁盘,通过这种并行的数据访问方式来达到高的I0带宽。大文件通过循环方式放置在不同的磁盘上,小文件的读写通过合并写来提高性能,使用动态选举的元数据结点来管理元数据。它的特点有:日志的结点失效自动恢复;使用集中式的锁
16、机制。2.2.3 PFSSun的PFS(Parallel File System)支持高性能,可扩展IO。它的设计思想是将文件分布在多个磁盘以及服务器上,并在逻辑上将这多个磁盘当作一个“虚拟磁盘共同管理,它还可以跨越多个存储系统,可以包括整个集群中的所有存储设备。当有多个节点同时访问同一文件时,就可以并行地为这些节点提供访问。文件系统构建于Solaris操作系统中,包括host结点、计算结点、I/O slave结点、I0 master结点。Host结点是PFS给其它系统提供的“入口”,登陆到host结点才可以访问到PFS内的文件数据;计算结点负责管理系统的通讯和内存资源;I0 master结点
17、负责文件系统的目录管理、存储块管理,并提供IO数据读写服务;IO slave节点是I0 master结点的一个“子集”,它仅处理磁盘读写和空白块的分配。2.2.4 DAFSDAFS(DirectAccess File System)构建在VI协议1之上的一个文件系统,它和NAS、SAN的最大不同在于它实现了全新的网络存储协议,能够提供基于标准的、高性能的、低延迟的网络存档协议。它的主要特征有数据共享、基于文件的数据整合、条块化的数据管理等。经过比较,Lustre 是HP,Intel,Cluster File System 公司联合美国能源部开发的Linux集群并行文件系统。它来源于卡耐基梅隆大
18、学的NASD 项目研究工作,已经在大学、实验室和超级计算研究中心等得到广泛应用。Sun称Lustre是“目前全球具有最佳可扩展性的并行文件系统”,现在全球十大超级计算机中的六个以及40%的TOP100超级计算机都采用了这个系统。所以本课题以Lustre为例研究并行文件系统的安装、测试、运行及影响并行文件系统因素等内容。2.3 分布式文件系统中的存储结构各种分布式文件系统都能适应一定的应用环境,在存储技术发展的各个阶段,都发挥出优越的性能,能很好的满足当时计算系统对存储系统的需求。分布式文件系统的设计和实现都是基于一定的存储结构,按存储介质的组织形式来划分,分布式文件系统采用的存储结构主要分为虚
19、拟化存储结构和对象存储结构,比如SAN和NAS采用的是虚拟化存储结构,Lustre文件系统采用的是对象存储结构。对象存储结构出现在虚拟存储结构之后,它在虚拟化存储结构的基础上,提出更新颖的设计理念,具有良好的性能和可扩展性。在高性能计算环境中,需要存储系统具有更大的存储能力、更好的扩展性和更高的I0带宽,此时单个磁盘的存储能力已经不能满足需求。这种情况下,虚拟存储技术应用而生。它的基本思想是把多个存储介质模块(磁带组、磁盘RAID等)连接在一起,做为一个逻辑上的存储池,通过一定的手段集中管理。在存储池中可以整合各种存储介质,存储系统表现为一个容量很大(TB或者PB)的逻辑卷,为计算环境提供大容
20、量、高性能的存储系统。从拓扑结构来看,虚拟存储主要分为对称式虚拟存储系统和非对称式虚拟存储系统;从实现方式来看,虚拟化存储主要分为虚拟文件系统和数据块虚拟。2.3.1 对称式虚拟存储系统对称式虚拟存储系统的结构如图2-1所示,存储控制模块包括存储控制设备、控制软件和交换设备,该模块集成在数据传输路径中,由存储控制模块和存储池组成一个存储区域网络(SAN)。它在客户端与存储池进行数据交换的过程中起到核心作用。该结构的存储过程为:存储控制模块将存储池中的存储介质虚拟为逻辑存储单元,并进行映射管理,给每个客户端分配其可见的存储单元集合(每个客户端可见的存储单元不止一个),客户端把这些存储单元映射为本
21、机操作系统可以识别的盘符。当客户端向自己的某个盘符中写入数据时,数据经过存储控制模块的高速并行端口,先写入存储控制模块中的高速缓存,再由存储控制模块完成客户端端盘符和存储池中存储单元的转换,并把数据写入池中的目标单元。该存储系统的特点有:存储控制模块中集成了大容量的高速缓存,能显著提高数据传输速率;存储控制模块中集成了高速并行端口,采用并行IO过程,能提高存储系统的聚合IO带宽,消除IO瓶颈;通过配置对称的存储控制模块,可以很容易的在系统中实现容错功能。在存储控制模块中可以很方便的连接Fabric交换设备,增大系统的规模。图2-1 对称式虚拟存储系统结构图图2-2 非对称式虚拟存储系统结构图2
22、.3.2 非对称式虚拟存储系统非对称式虚拟存储系统是指存储池控制设备和交换设备独立于数据交换网络之外的情况,如图2-2所示。客户端和虚拟设备管理软件均能通过交换网络访问到存储池中的存储介质。虚拟设备管理软件把存储池中的介质虚拟化为逻辑带区(strip)集,并指定每个客户端对池中每个strip的访问权限。客户端要访问池中某个strip上的数据时,先访问虚拟设备管理软件,读取目的strip的信息和访问权限,只有客户端具有访问目的strip的权限时,才能通过交换设备访问目的strip中的数据。在数据访问的过程中,客户端只看到逻辑的strip,而不是实际的磁盘。这种对称式的虚拟存储系统的特点有:不同存
23、储介质进行整合,实现虚拟的strip集,大幅度的提高了系统的可用带宽;在交换设备能力足够的情况下,可以通过安装两台虚拟存储设备,来实现系统内数据存储的冗余。但是这种结构的缺点也很明显:单个strip没有容错能力,一旦某个strip离线或者损坏,将导致整个strip里的数据丢失;该存储系统的访问带宽提高是通过阵列端口绑定来实现的,普通光纤阵列的有效带宽仅为40Ms左右。要达到高的带宽就需要很多台光纤阵列,这是不经济的。2.3.3 数据块虚拟存储系统和虚拟文件系统这两类存储系统主要在软件实现上对虚拟存储系统进行升级,以解决系统中存在的问题。数据块虚拟存储方案着重解决数据传输过程中的冲突和延时问题。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 毕业设计 论文 并行 文件系统 安装 测试

链接地址:https://www.31ppt.com/p-3982344.html