存储2.0,基于Web的存储迎面而来

时间:2022-10-10 07:50:48

在线存储建立在开放源代码软件与廉价的服务器之上。目前,备份与归档是其杀手级应用。

集成了开放源码的软件、运行在低成本硬件上的分布式存储以及WWW网的一套系统,对用户而言意味着什么?意味着每月只需为每GB的存储容量付费15美分,为每GB的信息下载或者上传付费10~20美分。

这绝对是一个合算的交易。市场研究公司Forrester的分析师Andrew Reichman进行了一番分析与计算,完成二级存储(包括备份与归档)需要购买的软件与硬件的成本每GB为15~25美元,而对一些关键商业应用,如股票交易或者航班预定等应用,满足基本的存储需要,每GB容量的成本为50美元以上。这些成本还不包括没有计入成本的管理花销。

但是,现在还不是扔掉你的光纤通道存储区域网(FC SAN)的时候。这种基于Web的服务还缺乏在线处理应用或者大型数据库检索所需要的性能,同时怎样保证保存在网络节点上的企业数据不受互联网上各种攻击的干扰呢?

当然,假如网上存储技术能够广泛应用,那么会减少公司对一些封闭私有的、高价格、包含了硬件与软件的存储系统的依赖,这些系统由一些业界的巨型公司如EMC、IBM和日立数据这样的公司提供,许多小型公司很少能提供一个囊括所有方面的方案。

吸引人的技术

这一新的存储平台采用的第一个技术是开放源码软件。用于存储的开源软件可以列出一个长长的名单,如Amanda公司的开源备份软件, Darik公司的Boot and Nuke (DBAN) 磁盘可用性软件,也包括网络文件系统,如Lustre、OpenAFS 和 SAMBA等,利用这些产品可以建立全部的存储基础架构。

第二个技术是存储应用的基础――分布式网格或者基于集群的存储架构,如Cleversafe的产品,以及建立服务,如从美国Berkeley数据系统公司发展而来的 MozyPro公司。

第三个采用的技术是不用高端存储阵列架构,而是采用工业标准服务器中的磁盘驱动器。

Berkeley数据系统公司的MozyPro服务,将存储群集和文件服务软件安装在Berkeley数据中心的白牌服务器上,把数据保存在服务器内部的硬盘上。目前,MozyPro服务的收费为:每台桌面机或服务器每月收费为4美元,每保存1GB数据收费为每月50美分。为了保护用户数据的安全,一些在线存储服务商会为数据提供多个副本。MozyPro则有所不同,仅仅保存相当于原始数据量33%的数据,如果需要的话,可以从这33%的数据恢复所有原始数据。公司产品副总裁Vance Checketts说,只保存33%的存储数据,与需要保存300%的原始数据相比,所需要的存储容量大幅度减少,存储设备的利用率大幅提高。

相比Berkeley,Cleversafe走得更远,这家只有29人的新兴公司,目前正在对用来开发开源、基于Web的分布式存储架构的软件进行alpha测试。该软件利用算法,将加密的数据切割为11“段”,并且这些数据段保存在分布式服务器上,组合起来才能提供有用的信息。

Cleversafe所采用的技术想达到两个目的:一是提高数据的安全性;二是减少存储容量的需求。公司的CEO Chris Gladwin认为,由于不再需要备份、存档和恢复数据的操作,因此Cleversafe需要保存的关键信息的容量从当前实际数据的300%减少为130%。数据切割具有与生俱来的安全性,因为任何一个存储节点都不会包含整个文件的副本,从而使数据很难被偷窃或破坏。可用性得到保证,即使11个节点中的任意5个节点出现了故障,数据仍可以得到恢复。

位于美国休斯顿的Planet.省略数据存储服务后,在线存储发展的关键还要看这家最大的在线服务提供商的动作。负责Amazon公司 Web服务管理与开发的副总裁Adam Selipsky说,Amazon公司提供的S3服务,可以将用户的数据存储在多个地方的服务器上,数据在多个磁盘阵列上保存多个副本。对正在试验一些创新型应用的开发者而言,目前的目标是成本更低,存储的数据每GB每月只需15美分,每上传1GB的数据成本为10美分,下载每GB的成本为13~18美分。Selipsky拒绝透露S3所采用的多个地方的服务器、多个磁盘阵列保存多个数据副本的技术细节,据说Amazon在其整个架构中全部采用了开源软件。

向在线移动,挑战商业公司

Illuminata公司的分析师John Webster认为,在线存储整合开源软件与网格存储技术,会对数据复制、备份与灾难回复的商业软件提供商构成威胁。假如这一技术实现方法真正成为现实,那么参与简单的基本的存储管理竞争的企业将发生剧烈的变化。不过一些观察家预言,显然用户还会为自己的最关键的商业应用购买商用软件产品。

一个原因是互联网固有的通信延迟与不可预见性,让存储管理者不能确定应用的相应时间与保证数据的可靠性。安全是用户管理的另一个主要因素。位于美国加利福尼亚的市场策划公司Pieper & Associates是一家与在线存储企业对薄公堂的中小企业用户典型。公司的副总裁Jeff Pieper认为已经与其用户签署了信息不能泄漏的协议,计划将用户的数据保存在自己由日立数据提供的容量为4TB存储设备商,以保证客户的安全。

Webster说,显然,在自己的机构内组建网格的用户,可以完全控制自己的网络,或许可以应用这种方式,甚至可以应用公司内部机器的一级存储。

不过这里有一个节省费用的问题。Reichman认为,存储的前期费用勿庸置疑会比放在一间屋子的大型存储设备少很多,但是却无法比较两者的长期管理成本。Gladwin认为,现在来讨论Cleversafe网格的具体成本有点过早。但是他认为,用户至少可以看到在磁盘空间、能耗、地面空间和管理方面可以节省的成本的大概比例。

Reichman说,当客户在从集中存储向基于Web的存储供应商转移时,主要的硬件存储供应商不可避免地会丢失一些商业机会,但是他认为服务器的供应商的收入反而会有增长,一是可以提供低成本的服务器产品,二是这些产品可以成为网格的构成节点。

Stelyos相信,这些企业会大力推进基于网格的存储,不过他认为,即使Cleversafe允许你采用成本更低的硬件,但是实际情况是一些大公司在其IT部门构建网格时,是不能容忍采用廉价的磁盘。

像其他一些在线供应商一样,Berkeley数据系统创始人兼CEO Josh Coates认为,MozyPro取代的常常是基于磁带的备份系统,而不是高端的磁盘系统。一些用户正在放弃磁带系统,因为磁带系统速度比较慢,可靠性比较低,比Berkeley 和其竞争对手提供的在线存储服务复杂等。

Gladwin甚至认为,Cleversafe可以作为一个补充,取代目前的一些存储功能,如可以把公司数据的备份交给Cleversafe完成,这样或许用户会欣然接受,用户可以要求Cleversafe及时地建立某个时间的数据快照,完成按时间点的备份工作。

不要匆忙做决定

分析师Reichman预言,中小企业会首先采用在线存储服务,以避免管理自己的存储这样复杂和困难的工作。但这些技术的功效在得到了验证之后,大公司会将其二级存储如备份等工作交给第三方在线存储公司。其他一些公司会在内部采用这些技术与方式,以方便采用低廉的磁盘,节省成本; 另一方面,用户会自己维护和管理自己的存储数据,一些银行已经开始评估这种方式。

Amazon公司的Selipsky认为,在这一市场会有亚马逊公司S3的用武之地,像一些小公司,它们需要非常简单、非常容易连接、非常容易集成,且高可靠的服务。而一些大公司的分公司或者一个部门因为缺少预算或者不能组织人员来构建大型的存储系统,但是他们每个季度可能有500美元、5000美元或者5万美元的预算,可以尝试去租用在线存储的空间,实现自己的存储需求。

任何向网格存储转移的行动都不会在一夜之间完成。一种引人瞩目的新方法如Cleversafe宣传的方法,也只是在一个特定的范围内理解了这一技术。Gladwin也指出,IT组织通常每四年或者更长时间更换其硬件设施。假如届时一些企业会选购一个新的品牌的新的技术架构,那么,必须有6个月的调试与磨合期。Gladwin认为,在未来2~3年,分布式存储在大型数据归档应用中将得到普遍应用。

到时,在那些先行者中,不管是用户还是开发者,都能深深地感到,一场巨大的存储革命正在自己的掌握中发生。(李梅编译)

链接

什么是网上存储?通过互联网提供存储服务,应用开放源码软件、网格或者低价存储架构以及一些低成本的标准硬件 。

卖点:非常低的成本,非常简单的管理,很高水平的可扩展性。

不足:对于一些高端应用,缺少性能和可靠性保证,安全性也是用户关注的一个问题。

使用领域:对于离线应用如备份与归档等是值得评估与应用的,也值得在公司防火墙之内部署。

上一篇:三大难点阻碍数字证书应用 下一篇:DLP之山外有“3”