Lustre 使用培训.ppt
《Lustre 使用培训.ppt》由会员分享,可在线阅读,更多相关《Lustre 使用培训.ppt(34页珍藏版)》请在三一办公上搜索。
1、Lustre 使用培训,汪璐中科院高能所计算中心Lu.W,安装及配置调优参数介绍Trouble Shooting,大纲,硬件准备安装Lustre软件配置启动Lustre主要配置命令,安装及配置,块设备磁盘,软RAID,硬件RAID,LVM依赖于RAID提供的块级容错块设备连接与服务器直连,不需要SAN考虑到failover的情况,需要双通道或者多通道设备性能,稳定性在生产环境中,分离的服务器和客户端操作系统服务器和客户端最好都采用64bit从lustre-2.2开始,不再支持32bit,硬件准备,元数据服务器(MDS)至少4核MDS内存大约每个文件2KB,Cache元数据能够将性能提高十倍假设
2、只有1个 MDT的MDS,1000个客户端,16个交互节点操作系统的开销512MB,文件系统日志 400MB1000个4核客户端,每个核100个文件,每个文件锁2KB,总共800MB16个交互客户端,每个客户端10000个文件,每个文件2KB,总共320MB1,600,000个文件句柄信息,每个文件1.5KB=2400MB至少需要4GB内存增大内存能够明显增加大目录的性能大于100000个文件的目录,硬件准备,元数据存储块设备(MDT)多seek,小块读写的访问模式SAS,SSD,RAID10,分离日志可以提高至少20%的性能元数据空间取决于系统的inode个数,一般是系统总容量的1%-2%假
3、设每个inode占用4KB,平均文件大小为5MB,存储容量为100TB,存储容量为100TBInode个数为20 million,按照推算大小的2倍来规划MDT的空间应该为:4 KB/inode*40 million inodes=160 GB对于平均文件大小小于4KB的应用,Lustre是很不经济的,硬件准备,数据服务器(OSS)至少4核OSS内存日志尺寸,每个ldiskfs文件系统400MB(可以更大)服务线程,每个ost_io线程消耗1MB的io buffer文件系统的元数据TCP等需要发送/接收 buffer的协议的内存开销如果有failover,OSS的日志尺寸在故障情况下要翻倍读c
4、ache经验值:2GB+1GB*OST个数failover模式下,2GB*OST个数,硬件准备,数据存储(OST)RAID 6,每6-8块盘一个卷,一个热备盘数据访问模式依赖于应用,需要平衡存储、网络带宽每个OSS可以支持2-8个OST受限于CPU,内存和网络带宽1.8.6-wc1支持24TB OST分区2.1版本可以支持128TB OST分区RAID监控OST的空间实际的存储容量,硬件准备,下载并依次安装lustre内核包,模块包,ldiskfs模块Lustre工具包,e2fsprog包特殊网络相关的模块和库(可选)修改boot loader,重启机器配置网络接口/etc/modprobe.
5、conf 中添加 options lnet networks=ethX创建MGS/MDT设备mds#mkfs.lustre mgs mdt fsname=启动MGS/MDT设备mds#mount t lustre,安装流程,创建OST设备ost#mkfs.lustre ost fsname=-mgsnode=启动OST设备ost#mount t lustre 修改 MDS,OSS上 fstab客户端mountclient#mount t lustre:/,安装流程(2),执行lfs命令验证文件系统的功能lfs df h,lfs df ih注意selinux和防火墙设置保证MDS与客户端有相同的
6、用户数据库保证Lustre集群中所有节点时钟同步,安装流程(3),mkfs.lustremkfs.lustre-fsname=-ost-mgsnode=-param=failover.mode=failout mkfs.lustre-mdt-param=sys.timeout=50/dev/sda“Options for Formatting the MDT andOSTs”tunefs.lustretunefs.lustre-erase-params-param=tunefs.lustre-param=failover.node=192.168.0.13tcp0/dev/sda注意 dryr
7、un 选项mount.lustremount-t lustre-L testfs-MDT0000-o abort_recov/mnt/test/mdtmount t lustre-o flock:/mount-o exclude=testfs-OST0000-t lustre:/,配置命令,lctl:lustre 底层配置工具lctl-device 设备相关lctl dl 查看设备列表lctl device deactivate 关闭一个有问题的设备lctl device activate 恢复一个正常设备网络相关lctl ping 检查lustre 网络,配置命令:lctl,debug 相关
8、lctl dk 打印内核debug buffer到文件lctl df 还原二进制debug文件配置相关lctl conf_param 将参数配置永久性写入配置文件,对所有的客户端立刻生效lctl get_param,lctl set_param,lctl list_param参数映射到/proc/sys,fs/lustre,lnet/pathname一次查看/修改多个数值,配置命令:lctl,磁盘池相关OST的集合,定义文件的分布规则区分不用的应用/硬件新建磁盘池 mgs#lctl pool_new myth.video添加OSTmgs#lctl pool_add myth.video OST
9、0000-3查看磁盘池client$lctl pool_list myth.video,配置命令:lctl,client#lctl set_param osc.*.max_dirty_mb=32osc.myth-OST0000-osc.max_dirty_mb=32osc.myth-OST0001-osc.max_dirty_mb=32oss#lctl get_param obdfilter.*.recovery_statusobdfilter.XXXX-OST0009.recovery_status=obdfilter.XXXX-OST0010.recovery_status=obdfilt
10、er.XXXX-OST0011.recovery_status=mds$lctl list_param-R mdtmgs#lctl conf_param myth.llite.max_read_ahead_whole_mb=5.5client#dmesg|tail-1Lustre:Setting parametermyth-client.llite.max_read_ahead_whole_mbin log myth-client,例子:lctl 查看,修改多个属性,OST迁移脚本/usr/bin/lfs_migrate通过文件的复制来实现OST的负载均衡简单的拷贝,不能用来迁移正在使用的文件
11、防止文件分配到某个特定的OST,可以在MDS上执行lctl-device%fsname-OSTNNNN-osc deactivate与lfs find结合使用client#lfs find/test-O test-OST0004-size+4G|lfs_migrate y,配置命令:lfs_migrate,lfs find时间,查询深度,文件名,文件尺寸,uid,gid特定的OST,特定的Lustre 磁盘池假设OST0002,4即将写满client#lfs find/myth-type f-mtime-2-size+2G-obd myth-OST0002-obd myth-OST0004|l
12、fs_migrate将这两个OST上修改时间超过2天,尺寸大于2G的文件迁移到别的OST上假设OST0005,6 是新加入的OST,将其它OST上的大文件迁移到这两个OST上client#lfs find/myth-mtime+90-size+20G-name“*.iso”!-obd myth-OST0005!-obd myth-OST0006|lfs_migrate,配置命令:lfs find,磁盘池与lfs df,lfs find 结合client$lfs df-p myth.audio UUID 1K-blocks Used Available Use%Mounted on myth-M
13、DT0000 9174328 178572 8471468 1%/mythMDT:0 myth-OST0004 721984264 653299296 68684904 90%/mythOST:4 Summary:721984264 653299296 68684904 90%/mythclient$lfs find-p myth.audio-uid,配置命令:lfs df,ll_recover_lost_found_objs恢复lost+foundoss#mount-t ldiskfs/dev/vgmyth/lvmythost0/mntoss#ll_recover_lost_found_ob
14、js-d/mnt/lost+foundoss#umount/mnt/usr/sbin/lustre_rmmod卸载系统中所有的lustre module,配置命令:其它,客户端,服务器I/O状态查看CACHE 相关空间分布相关Import 和 export,性能调试参数,客户端连续读写情况/proc/fs/lustre/llite/lustre-ee5af200/extents_stats/proc/fs/lustre/llite/lustre-ee5af200/extents_stats_per_process客户端对每个OST的请求计数/proc/fs/lustre/osc/lustre-
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Lustre 使用培训 使用 培训
链接地址:https://www.31ppt.com/p-2381189.html