存储虚拟化 不再犹豫

时间:2022-10-11 11:04:45

翻开IT行业杂志或者访问IT Web站点,常能看到有关虚拟化的文章。服务器、存储、应用程序、以及IT人的日常安排都可以虚拟化,这些都是和每个企业相关的事情。在我们怀着犹豫开始讨论虚拟数据的相对优点的时候,存储虚拟化已经呈现在我们眼前并且逐渐变得重要起来。

尽管存储虚拟化很重要,但它还是一个被严重滥用的术语。热心的商人和前沿的媒体都如此广泛地使用这个术语,使它的含义变得几乎模糊不清。虚拟化是对于全局数据命名空间么?它只限于SAN(Storage Area Network,存储区域网络),还是NAS(Network Attached Storage,网络附加存储)厂商也可以参与竞争?解决方案需要把自己插入到数据路径中吗?虚拟必须支持异构存储系统么?或者它只对于仅仅虚拟化自己的系统的厂商是可接受的?不幸的是,答案似乎比问题多。

总有用武之地

调查一下存储架构师希望虚拟化所能提供的功能是很有意义的。对读者进行调查的目的就是这个。需要询问他们所追求的功能是什么,以及什么是他们对存储虚拟化感到担心。架构师似乎首先追求改善灾难恢复能力和可靠性。接下来依次是更好管理、数据灵活性以及较低的资金和运行成本。多少有点令人吃惊的是,厂商所吹嘘的某些功能都排在结果的后面,包括信息生命周期管理(ILM)能力、支持异构存储阵列以及减少存储池的数目。

在某些方面,这个结果是有意义的。尽管减少存储池的数目是个很好的目标。但是,它一般并不是具有很多存储阵列的虚拟化所要实现的目标。举个例子,2005年7月底,EMC公布了其高端Symmetrix存储阵列产品线的一个新成员,它能存储1PB的数据。它几乎能够满足所有用单个阵列存满了数据的企业的需求。

调查显示,存储架构师需要稳定性甚于灵活性和良好的管理能力。ILM还只是一个概念,也不是它们的首选。大多数企业更多地关心保持业务在任何不是分阶段存储的条件下的运行。虚拟化能够做到这一点,并且通常比已有的解决方案代价更能接受,这是需要考虑的。更能接受的部分也是让思想古板的存储厂商感到吃惊,对于他们来说,这意味着成本压缩空间,而这些厂商想要得到什么呢?

从某些存储厂商的角度来看,虚拟化提供了一种打击竞争对手的途径。因此,EMC和Hitachi数据系统公司(HDS)都在自己的虚拟化方法中采取某种保护或防御姿态,而IBM、NetApp以及很多起步的厂商都试图把虚拟化作为一种赢得新的市场份额的方法。

用好网络

每种虚拟化策略都有强项和弱项,但是,它们都有一个核心问题,就是在将要虚拟化的服务器和存储之间以及存储阵列之间需要形成一个网络。这个网络可以使光纤通道(FC)或者iSCSI SAN,或者甚至是一组网络连接的NAS文档,只要存在某种促进数据汇集和数据灵活性的网络就可以了。

调查显示,当前的网络化存储的市场突破对于组织的大小依赖性很强。对于目前比较常用的虚拟存储技术NAS、SDA(Server Direct Attached,服务器直接附加)、SI(Server Internal,服务其内部)和SAN,调查结果如表1所示。

大型企业已经飞跃到网络化存储,而中小型企业还主要依靠SDA或SI存储。中小型企业担心的是他们的数据基础结构的可靠性,这种担心需要改变。在计算引擎和存储引擎之间放置一个网络,这提供了很多的途径来提高可靠性、性能和数据基础结构的可管理性。

尽管存储虚拟化有着超越网络化存储的优势,但它同样带来了新的缺陷。调查显示,存储架构师最担心的就是这一点。

由于虚拟化需要把存储系统的一种视图映射到另一种视图,所以必须保存这种映射的持久性拷贝。这种驻守的数据通常叫做元数据。每种文件系统和存储设备都需要维护元数据。在存储阵列中,数据需要和所有其他存储的数据一样地进行保护。元数据通常要保存多份拷贝,并且一般的RAID保护也要使用。

仅用阵列

虚拟化的一个可选项就是把功能性构建到阵列控制器中。这样做有几个好处。首先,购买来这些高端阵列已经在一个坚实的、可靠的系统上花费了很多钱。阵列控制器可以逐渐增强对大量的计算能力和I/O带宽的支持。

其次,在过去的几年里,阵列控制器已经变得聪明多了。数据映射、快照查找以及很多其他的应用程序都在阵列控制器中体现出来。

在多阵列中,SAN的容量可以随着应用程序的需求动态地增加,这是一项大大提高了存储利用率的功能。既然阵列控制器中存在所有这些可能性,为什么不让控制器承担更多的工作,并且让它在外部访问存储而不是从内部呢?

这种方式是HDS所采用的方法,因为它们转售了HDS解决方案,Sun公司和惠普也采用这种方法。这种解决方案也很贵。初级的解决方案大约需要15万美元,并且随着级别提高,很快达到7位数。和很多高端的HDS解决方案一样,HDS的方法对于那些已经和公司存在一定关系人以及那些已经使用阵列和相关软件的人更有吸引力。

不用阵列

不采用阵列控制器作为虚拟存储模型也有一定的原因。最可能的原因就是成本问题,以及和其他存储提供者的密切关系,因此选择了其他的不同方法。

虚拟化可能使用的另一个位置就是在存储网络自身之中。那些采用网络光纤作为虚拟化的地方的人们也有一些选择,他们可以选则使用一个存储和转发包的工具,或者是一条线速交换机。在这些选择中,他们可以和IBM或EMC这样的起步厂商合作。

IBM的方法是使用一个缓存工具,相当于构建一个没有磁盘的控制器。IBM的SAN容量控制器(SAN Volume Controller,SVC)通常驻留在存储网络中的应用程序主机和存储设备之间。SVC可以趁对实现,也可以集簇实现,这取决于性能需求。由于它相当于一个存储控制器,IBM的管理和数据灵活性应用程序可以稍作修改就移植到SVC中。由于SVC是一个单独的工具,它可以和任意多的SAN交换机和存储阵列一起工作。

SNA和NAS

把一个网络文件系统介绍到存储方程式中,这为虚拟化提供了一个明显的机会。存储的数据的位置被文件系统抽象,并且因此可以物理地移动而不会影响到文件名。各个厂商的级别,通过这种移动的自动化程度以及它对运行的应用程序的干扰程度来区分。

在文件级别的虚拟化还有其他的应用。例如,单个的全局命名空间可以在这个组织中表示。这种空间中有多个相互交错的厂商,提供不同的全局文件系统,在NAS上虚拟化NAS或者在一个SAN上虚拟化SAN。

标准

尽管有很多的标准尽力影响存储市场,和虚拟化最相关的两个标准是存储管理启动规范(Storage Management Initiative Specification,SMI-S),这是由存储网络工业协会赞助的;以及构造应用程序接口标准(Fabric Application Interface Standard),这是由ANSI的T11委员会管理的标准。

FAIS的目标是为了在一个存储网络中把控制路径和数据路径分离开而标准化方法和可编程界面。

更实际地说,FAIS为存储交换机厂商提供了一个标准界面,从而支持提供存储网络中的路由、安全等功能的应用程序。

存储工业协会使得缠上能够设计他们自己的方法来实现这些目标,而不是标准化这些高级功能。于是,所谓的智能交换机可以实现存储网络中的策略。

这显然和IP网络行业中已经采用的方法不同。它让高端的存储厂商来最大程度地控制存储网络的革新技术。存储工业的方法是否比IP工业的方法好呢?也许将在未来的五年里得到答案。

上一篇:3G时代的枭雄 下一篇:Java瘦身之路