-2面向数据密集型应用的lustre文件系统



《-2面向数据密集型应用的lustre文件系统》由会员分享,可在线阅读,更多相关《-2面向数据密集型应用的lustre文件系统(15页珍藏版)》请在装配图网上搜索。
1、,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2011/11/26,#,高能所的数据密集型科学计算,Lustre,在高能所的部署经验,问题和需求,大纲,应用背景:高能物理实验,北京正负电子对撞机上的北京谱仪(,BESIII,)实验,羊八井宇宙线实验,大型强子对撞机,LHC,上的,ATLAS,CMS,实验,大亚湾中微子实验,重建,模拟,实验采集,原始数据,重建数据,分析,实验结果,磁带,磁盘,盘,高能所计算存储环境,Document Management,Web ContentManagement,集群、网格计算,环境,Lustre,磁盘存储,登录节点,监
2、控,调度,磁带库,7000,多个,CPU,内核,约,5PB,的磁带存储,登录,监控,调度等服务,近,2 PB Lustre,磁盘存储,数据密集型,高吞吐率,(high throughput),计算,大文件,写一次,读多次,读带宽:,0.5,6,MB/s,写带宽:,0.1,MB/s,没有热点文件,大块读写,跳读,I/O,特征,2008.8,开始在生产系统部署,Lustre,,,1.6.5,2010.1,升级到,1.8.1.1,2011.7,升级到,1.8.5,30,个,OSS,300,多个,OST,近,2PB,的存储空间,,1,亿个文件,理论聚合带宽,24GB/s,Lustre,在高能所的部署,
3、Lustre,在高能所的部署,版本,数量,网络连接,存储连接,服务器,2.6.18-194.17.1.el5_lustre.1.8.5,64,位,30,万兆,以太网,4Gb,(双口),直连盘阵,客户端,1.8.5,32,位和,64,位,800,千兆,以太网,Computing Cluster,SATA Disk Array,RAID 6,(,Main,),10Gb,Ethernet,MDS,OSS 1,OSS N,SATA Disk Array,RAID 6,(,extended,),OST,MDT,(SAS+RAID10),OST,实际性能,单个,OSS,连接,4,个盘阵,8,个,OSTs,
4、每个盘阵大约服务,50,个,读写进程,读性能,2,25,MB/s/disk,array,乘以服务器数量,系统的理论聚合带宽,24,GB/s,20%,Read throughput of single OSS,IOwait on single OSS,900MB/s,60%,文件分布模式,磁盘池,区分不同的应用,Stripe=1,,针对高吞吐率计算,fsck,每年检修一次,错误数据,删除,从备份中恢复,用户管理,crontab,脚本,同步用户数据库,基于目录的,quota,脚本,每天检查一次,系统管理,Lustre,底层信息监控,/proc,主机信息监控,ganglia,iostat,服务器日志
5、汇总,过滤,syslog-ng,监控,磁盘水位报警,:lfs df,服务器连接报警,:lctl ping,客户端可用性报警,:,写文件到多个,OST,故障报警,已解决的问题,32,位服务器,OSS,频繁死机,改成,64,位操作系统,双网卡登录节点频繁死机,对,lnet,模块网卡绑定,timeout,值太小,造成客户端不稳定,lctl set_param timeout,MDS,的可靠性,LVM,快照,+,定期备份,计划实施,DRBD,Lustre,客户端内存使用控制,lctl set_param max_cache_mb,已解决的问题(,2,),1.8.1.1,版本的服务器内存使用控制,ech
6、o 0/proc/fs/lustre/obdfileter/OSTXXX/read_ahead_cache_enable,服务器死机故障分析,crashdump+kernel-lustre-debuginfo,1.8.1.1,客户端死机后,服务器的,CPU,出现,soft stuck,,直到死机的客户端重启后,才能恢复正常,。,升级至,1.8.5,以后故障不再重现,个别客户端,ptlrpc-recov,进程占用,CPU 100%,,无法杀掉,无法正常重启,升级至,1.8.5,以后故障不再重现,1.8.5,版本存在的,bug,导致服务器在读写频繁时会自动重启,HP G6,服务器无法产生,crash dump,输出,可能与,1.8.5,版本中的,cciss,硬件驱动有关,G7,服务器上没有,32,位客户端节点频繁死机,du,ls lr,等操作会消耗大量的客户端,Normal memory,临时措施,禁用,du,操作,等待客户端完全升级至,64,位,存在的问题,问题和需求,文件副本,OST,自动均衡,元数据服务器的可扩展性,方便统一的监控界面,高效的数据备份策略,Discussion,
- 温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。