云存储架构的发展.ppt
云存储架构的发展,杨钢 2013/11/25,内容体验,存储技术发展简史金山云存储的技术路线简单的存储系统架构讨论主要开源方案简介部分新技术点的简介,存储技术发展简史,主要阶段,存储设备DAS/SAN/NAS控制器架构存储集群,控制器架构的基本原理,硬盘级别数据冗余RAID 5/6 和 LUNRS 码纠错热备盘条带化 RAIDRAID 6N+2 容错控制器实现复杂,效率降低,较少使用,云存储集群的基本原理,多台服务器集群物理设备级别冗余内网修复,金山云存储技术路线,需求,按部署模型区分公有云存储私有云存储混合云存储按使用场景区分高性能计算虚拟机平台(云主机/VDI/etc)Key-Value 对象存储(网盘/Hadoop/etc)冷数据(备份/视频监控/etc)其他,需求,按分布模型分集中式异地容灾式有主控分布式对等分布式,需求维度,功能性能可靠性价格,发展历程,2008年 存储实验室2009年 WPS在线办公空间2010年 金山快盘2011年 小米Cloud2012年 金山云,技术路线规划,开源软件部分定制完全自主开发,简单存储架构讨论,存储集群的基础架构,APIScheduler/调度器Name node/元数据节点Data node/存储节点,存储集群的基础架构,调度与元数据,静态Hash一致性Hash弹性Hash,一致性Hash,错误检测和修复,R+W NLoggingFix on reading,数据块组织,大文件条带化小文件块组织,快速元数据管理,快速元数据管理,多机房,主控式对等式,异步备份,独立设备/物理位置独立兼顾写入效率和带宽现状具有较好的独立容错性原子版本功能适合对数据保全要求高的领域,开源方案简介,较多使用的开源方案,HDFS数据分析场景:Hadoop MapReduce/HIVE适用于大文件流式追加和读取非通用接口LustreGlusterFS使用 NFS/CIFS代理提供通用服务使用 Hash 而不是元数据服务效率问题,大规模应用案例缺失CephFUSEZFS,各存储方案基本原理 HDFS,各存储方案基本原理 GlusterFS,各存储方案基本原理 Ceph,部分新技术点简介,镜像模式 VS Erasure Code,镜像模式优势速度快,不论写入和恢复结构简单,易实现和维护EC较少冗余,Erasure code,Vandermonde-RS and Cauchy-RS常用开源库Jerasure,基于EC的存储系统基础设计,输入效率EC Codec(Encoder/Decoder),谢谢,