目前华为全新的存储解决方案——FusionStorage分布式存储,已经获得成功的商业应用,客户有招商银行、中国移动、中国电信。其主要面向企业云、金融云、关键业务数据库等典型的应用场景。根据官方表示,FusionStorage具有“存储系统永新,数据免迁移”的特性,是“下一代云基础设施的理想选择”。那么,果真如此吗?站在新兴区块链技术演进尤其是IPFS已经开始运用的大背景下,企业和普通用户数据的最佳解决方案是什么?
华为FusionStorage是一款可大规模横向扩展的软件定义存储产品,通过存储系统软件将标准X86服务器的本地存储资源组织起来,构建全分布式存储池,实现一套存储系统向上层应用提供块、文件和对象三种存储服务,满足结构化、非结构化等多类型数据存储需求。
系统架构上,FusionStorage采用全分布式架构。数据冗余保护机制,利用的是纠删码(Erasure Coding),多副本设计。存储介质支持NVMe SSD, SAS SSD, SATA SSD, SAS HDD, NL-SAS HDD, SATA HDD。
那么,这个分布式存储产品到底如何?在2019 Interop东京展会上,FusionStorage凭借业界高性能、高可靠、高效能等特性,荣获2019 Interop东京金奖。不难看出FusionStorage 是华为存储近年来最重要的战略级产品,获得了行业认可。它不仅是华为存储产品线的一次重大升级,也承载着帮助科技不断创新的使命。
随着5G和AI时代来临,企业的业务越来越多样化,对存储的效率、性能和管理都提出了更高的挑战。
除了对存储要求的提升,数据的处理速度同样重要。
目前企业数据利用率只有10%,数据价值没有得到充分释放。7月2日,华为在成都发布云存储All-Flash战略,并推出极速IO云硬盘,标志着华为云存储正式进入微秒时代。
华为的极速IO云硬盘的时延低至50~100μs,并具有4GB/s带宽和高达100万IOPS性能。采用全新设计的Flash-Native存储引擎布局,可提升Flash寿命5倍以上。部分算法被卸载至芯片当中,让网卡可以直接将数据写入Flash介质,从而节省约60%的CPU开销。通过自适应差量压缩算法将数据压缩率提升3倍,并可大幅降低网络拥塞发生概率,长尾时延降低30%,时延稳定性更优。同时还AI预测能力,可预判30天性能趋势、提前14天发现故障盘并自动隔离。
但是,FusionStorage不仅提供了云硬盘,也提供了本地磁盘。云硬盘和本地硬盘的区别?
本地磁盘就是物理主机上的硬盘,磁盘的读写速率和取决于物理硬盘的指标。使用本地磁盘的虚拟机迁移时,需要将数据从一台主机拷贝的另外一台主机,迁移速度取决于物理硬盘的性能。云硬盘是共享存储,如SAN、FusionStorage Block等,读写速率快,并且可以使用存储的高级特性。使用云磁盘的虚拟机迁移时,存储只需要变更挂载的主机,迁移速度快,可靠性更高。
通过华为的FusionStorage和All-Flash战略,可以清晰看见华为的战略布局。华为向实现块、文件、对象、大数据四种协议在一套存储系统内融合,让存储更高效。让分布式存储性能超过传统的高端存储,满足企业关键应用需求。面对海量数据爆炸式的增长,华为正在试图建立拥有弹性伸缩、无限扩展能力的云存储,打造智能数据底座,挖掘数据价值并使其极致释放。
其实对于分布式存储,华为并不是第一个吃螃蟹的。传统科技公司如谷歌已经有GFS文件系统,阿里巴巴也为自己的电商业务打造了BFS系统。在新兴的区块链存储领域,已经有Sia、Storj等。尽管如此,它们都各自存在着缺点。
当前的云服务依旧依赖于传统的商业数据库。传统的商业数据库,多以集中式架构为主。逐渐无法适应海量数据对计算能力的巨大需求。谷歌的分布式存储实际上是建立在不断建造数据机房的背景之下,而Sia等存储网络缺乏底层协议的支撑。
这种局面直到IPFS的出现才被打破。作为一种按内容寻址的分布式超媒体文件传输协议,由斯坦福大学计算机硕士和工程师Juan Benet开创。目前包括微软、Cloudflare等跨国公司已经开始了基于IPFS协议的研发和应用。IPFS作为一种底层协议,目的是取代传统HTTP协议,构建分布式的Web网络。当然,技术需要应用,IPFS也有面对大规模商用的难题。为了解决分布式网络的数据安全存储和激励问题,官方开发了基于IPFS协议的分布式存储网络——Filecoin是由加密数字货币驱动的区块链网络。
世界上有大量的存储空间没有被使用,正如华为全球产业展望(GIV)报告显示的一样,全球年数据增量高,但企业数据利用率只有10%。闲置的硬盘空间,存在着巨大的利用价值。Filecoin通过建立一套文件存储托管市场,允许任何人存储客户的数据。用户及客户之间的存取都使用该网络的唯一通证FIL(文件币)。
Filecoin是区块链技术驱动的网络,因此具备许多优势。
●1.稳定且无中心控制:Filecoin是去中心化的网络,分布式设计,没有中心节点,是完全不同于传统集中式数据库的全新数据存储解构。
●2.安全加密:数据打散存储在全球的分布式节点网络上,并利用了哈希加密算法,使得数据得到安全保障。
●3.快速高效:Filecoin可节省带宽,为企业存储减负,去除不必要的工程资源。冗余机制保证了数据的高效利用。同时,点对点传输使得网络速度更快,普通用户都将收益。
●4.强大的扩展性:Filecoin和IPFS都是开源软件项目,提供系统支持并具备多API接口功能,开发者可以基于IPFS和Filecoin进行应用开发。
那么IPFS和华为的分布式存储解决方案,孰优孰劣?
对比IPFS(Filecoin)和华为(FusionStorage),可以看出,它们采用分布式集群控制技术和DHT技术,这两个是提供分布式存储功能特性的关键。
其一即DHT(Distributed Hash Table)分布式哈希表,是一种分布式存储方法。在不需要服务器的情况下,每个客户端负责一个小范围的路由,并负责存储一小部分数据,从而实现整个DHT网络的寻址和存储。
IPFS上的每一个文件都具备唯一的哈希地址,经过DHT算法,将哈希表分散在不同的节点上,提供相应的步骤来查找。分布式散列表本质上强调以下特性:
●离散性:构成系统的节点并没有任何中央式的协调机制。
●伸缩性:即使有成千上万个节点,系统仍然应该十分有效率。
●容错性:即使节点不断地加入、离开或是停止工作,系统仍然必须达到一定的可靠度。
要达到以上的目标,有一个关键的技术:任一个节点只需要与系统中的部分节点沟通,当成员改变的时候,只有一部分的工作(例如数据或键的发送,哈希表的改变等)必须要完成。
其第二个相同点是集群管理技术。
什么是集群?集群(Cluster)指的是分布在不同区域的计算机,彼此之间通过网络建立通信,相互协作作为一个整体对外提供服务。
华为集群
IPFS集群
IPFS集群 (IPFS cluster)是IPFS的项目的一部分,已经发展多年,但广泛使用的不多,很多都是使用IPFS集群在私有IPFS网络中来提供多数据中心的冗余备份,或内容加速。IPFS集群本身目的是为了加速IPFS网络的采用。IPFS提供了一套方案来解决当需要同时管理多台节点时同步文件的不便之处。IPFS的集群cluster系统包含ipfs-cluster-service和ipfs-cluster-ctl,对所有节点进行统一管理。主要功能为实现在管理节点统一上传文件、pin文件和删除文件。
不难看出IPFS是在解决在大数据跨组织的计算问题,尤其是托管和分发PB级数据集的时候,集群技术必不可少。这不仅是对于网络底层的优势,对于大规模商用也起到关键作用。在Filecoin网络中,节点要提供较大量的存储,如果拥有多个如何把分散的设备集中起来,统一作为一个提供商进行服务,那么企业(矿场主、矿池主)将因此收益。管理便捷,成本更低。
而华为的解决方案是,运用VBS (Virtual Block System) 虚拟块存储管理组件,负责卷元数据的管理,提供分布式集群接入点服务,使计算资源能够通过VBS访问分布式存储资源。
FusionStorage可根据存储集群规模自动调整冗余策略,提升磁盘空间利用率。另外,基于分布式哈希(DHT)的华为专利全分布式架构,单集群横向扩展支持更多节点。
现在,我们可以回答IPFS和华为的FusionStorage到底哪个更成功?
根据IPFS官方的集群开发路线图,短期内也就是2019年第二季度,正在进行协作pinsets原型的开发,以替代共识层。正在进行与主要合作伙伴的合作测试,以及API的工业级应用和优化DAD分片控制。可以看出IPFS Cluster对于支持现实的网络也应用还远远不够,许多功能开发还在进行之中。我们知道,现有的IPFS网络不适合进行高速加速,但通过IPFS Cluster可以根据地理位置进行同时多个复制,进行一定程度上的加速。在集群的基础之上,可以提供不同的激励层,支持Filecoin或支持其他类型的激励管理。管理可以建立在集群之上,从而提供更好的服务。
虽然IPFS还原为达到全球大规模消费级应用,但是不可否认IPFS技术及其应用生态已经在强大。
✣IPFS星际文件文件系是2014年创立,距离现在2019年近5年时间。
✣超过50亿个文件已上传到IPFS。
✣已有超过100个项目使用IPFS来存储数据和文件。
在这些基于IPFS的应用中,除了IPFS官方激励层Filecoin,还有几个最为值得关注。
♦IPSE:一个基于IPFS的搜索引擎,致力于解决IPFS数据快速检索和取回的问题,通过建立为哈希添加语义标签的机制,将冗长难记的文件哈希地址转化为简单易懂的文字标题,让用户快速直达文件。
♦Dtube:一个去中心化的视频平台,加密安全,没有传统视频门户那样的精准广告投放。
♦Orbit:一个IPFS上的分布式、点对点聊天应用程序,最大特性之一是采用无服(serverless)设计。
这些应用面向各自的领域,但都具备相同的特点:基于IPFS开发,使用分布式技术,使用安全加密技术,都是下一代互联网的重要组成部分。
但是,尽管它们有相同优点,最受关注的还是Filecoin。由于Filecoin网络主网还在解决复制证明问题和优化全新的共识机制,主网上线还没有最终确定。在面对最直接的矿工、矿场、矿池等群体,IPFS集群还没能开始发挥它的作用。而针对企业,如果想利用IPFS 集群建立大型存储平台,还言之过早。
所谓爱之深,责之切。这里指出IPFS的不足和Filecoin不完善,并非否定分布式技术和区块链技术,很显然超过100多个基于IPFS开发的应用不会同意。可是,有所谓不破不立,如果不去破除过度地迷信某项技术颠覆世界,也仅仅是饮鸩止渴。古语云,九层之台,起于累土,下一代互联网并非一朝一夕即可实现,尤其是作为挑战者的IPFS面对传统科技巨头已经建造的坚固城墙,所面临的压力恐怕只有协议实验室和那些开源社区为这项目敲出代码的那些人,最能感受。
对于华为而言,保证运营商行业及金融行业云转型不仅是把握技术的制高点,同时也是华为存储增长的推动力。正如本文开篇提到的,华为关键业务云存储FusionStorage已经应用与招商银行和辽宁移动。
借助FusionStorage关键业务云存储,招商银行加速甩掉系统架构的历史包袱,将后端云化基础架构平台与大数据应用平台相结合,真正实现了“业务部署快、产品开发快、支持业务发展快”的目标。
中国移动辽宁分公司使用华为FusionStorage,凭借着比较高的信用和非常高的可靠性,在一些领域里替换了原有的高端产品,并承载部分数据库应用,可靠性和信用方面均不弱于原来的传统存储。
相比采用传统存储扩容方式,替换1TB容量传统架构存储,每年可节省维保费近2万元,根据计划迁移的数据量估算,累计节省投资超过30%。
这也难怪华为IT存储产品线总裁孟广斌会对分布式的高度重视,他认为,传统高端存储和分布式云存储都是根据不同的客户应用提供的不同方案,并没有太多的竞争关系。“但是越来越多的应用,我们认为都可以用分布式存储逐步取代,尤其是在云越来越多成为主流方向的情况下,分布式云存储会是必然或者是主流的选择。”孟广斌谈到。
随着人工智能(AI)、VR/AR、5G、自动驾驶等技术的发展,应用对云存储的实时处理能力提出了更高标准。未来是属于IPFS分布式存储还是华为为代表的传统科企的分布式存储?
谁将获得AI和5G助力,缔造核心优势?很显然,华为凭借强大的研发实力,在通信和企业服务领域拥有不可比拟的优势,步步为营,稳扎稳打。而IPFS作为一种全新的底层协议和技术,旨在革新互联网,为网络提供基础设施,帮助开发者建立上层应用。它们虽然都是处于相似的领域,但也都面临同样的问题。它们深知分布式存储才是未来,开始迎接挑战。
华为IT产品线副总裁、智能数据与存储领域总裁周跃峰表示:“人类正在进入万物互联的智能时代,数据成为新的生产资料。海量的数据带来了前所未有的机遇,也给存储带来了巨大的挑战。”
在笔者看来,中心化的网络就像一座城堡,而华为是里面的改革家。IPFS这样的新兴技术,就像是外来的革新者。城堡只能从内部攻破还是从外部摧毁?又或都会有之?
分布式存储领域,华为的FusionStorage正以“智能”来重新定义。面向全球客户,让企业真正实现一个数据中心一套存储,释放更大数据潜能。而依托于底层协议和区块链技术的IPFS Filecoin网络,在功能上都还有开发完善和技术改进的空间,暂时无法满足大规模商用的需求。Filecoin主网上线,开发者将会将它定义为面向企业的商业存储(就像Storj一样)还是面向用户的C端市场,做一个去中心化的“百度网盘”?又或者Filecoin网络上线后又沦为炒币人士的下一盘菜肴?将怎样发展,只有后面才能验证。
尽管如此,Filecoin和传统的集中式存储不同。Filecoin是去中心化、加密、分布式,数据的所有权在用户手中。在笔者看来,这是最优秀的特质,也是新一代互联网所需要的基因。
本文参考文献:
[1]华为官方FusionStorage智能分布式存储官网介绍
[2]华为官方分布式存储技术文档
[3]华为云官方《华为云发布存储All-Flash战略,数据处理从毫秒进入微秒时代》
[4]《DHT分布式哈希表》,作者:Colobu(鸟窝博客),smallnest
[5]Kancloud《P2P系统,一致性哈希和DHT》
[6]IPFS官方集群介绍:IPFS Cluster Overview
[7]《IPFS Cluster 的演进和发展》,作者:简书,胡飞瞳
[8]《华为云计算——FusionStorage数据路由原理(FusionStorage基于DHT技术实现Key-Value存储系统)》,作者:fzj_Unicorn
[9]《打破束缚,华为云存储FusionStorage让关键业务“自由”起来》,作者:任新勃
[10]IPFS官方Filecoin路线图(Filecoin Project Roadmap)
留言与评论(共有 0 条评论) |