关于RAID技术浅析

时间:2022-06-13 05:34:11

关于RAID技术浅析

[论文关键词]raid 模式 应用 功能

[论文摘要]随着计算机技术的发展,使存储数据的技术手段也发生很大变化。存储信息并且防止信息丢失就成为了一个首要问题。利用raid技术可以把数据分布到多个硬盘上,从而取得更好的稳定性和性能。

一、引言

随着计算机技术的快速发展和计算机应用的不断深入,计算机已经逐渐介入了我们的生活的方方面面,同时各个方面对计算机技术提出了更高的要求,为了适应人们的需要,计算机技术不断的在各个方面变革着。internet的普及更加剧了信息的几何化增长,于是存储信息并且防止信息丢失就成为了一个首要问题。当然用于存储信息数据的设备就是关键了:比如对于一个大型的网站来说,因为存储设备的故障导致网站的片刻的瘫痪,也可能带来巨大的损失。那么,如何解决这一问题呢?很显然单靠用多个硬盘简单的备份不能从根本上解决问题。这时一种叫做独立冗余磁盘阵列(raid)的技术就应运而生了,这种技术可以把数据分布到多个硬盘上,从而取得更好的稳定性和性能。

二、raid技术

(一)raid技术简介。raid就是一种由多块廉价磁盘构成的冗余阵列,在操作系统下是作为一个独立的大型存储设备出现。raid可以充分发挥出多块硬盘的优势,可以提升硬盘速度,增大容量,提供容错功能够确保数据安全性,易于管理的优点,在任何一块硬盘出现问题的情况下都可以继续工作,不会受到损坏硬盘的影响。

数据冗余的功能可以保证用户数据一旦发生损坏,就可利用冗余信息使损坏数据得以恢复,从而保障了用户数据的安全性。在用户看起来,组成的磁盘组就像是一个硬盘,用户可以对它进行分区,格式化等等。总之,对磁盘阵列的操作与单个硬盘一模一样。不同的是,磁盘阵列的存储性能要比单个硬盘高很多,而且可以提供数据冗余。

(二)raid的几种模式。raid的级别从raid概念的提出到现在,已经发展了多个级别,有明确标准级别分别是0、1、2、3、4、5等。但是最常用的是0、1、3、5四个级别。其他还有6、7、10、30、50等。

1.raid 0。raid 0又称为stripe或striping,即data stripping数据分条技术,它代表了所有raid级别中最高的存储性能。raid 0是由多个硬盘并发协同工作完成数据的读写,数据被均匀分布在各个硬盘上,一般情况下,使用的硬盘越多,读写的速度越快。raid0的特点是读写速度快,并且价格便宜;缺点是安全性相对较差,因为在raid0中的一个硬盘出现故障时,整个阵列的数据将会丢失。raid0是最快和最有效的磁盘阵列类型,但没有容错功能。因此,raid 0不能应用于数据安全性要求高的场合。

2.raid 1。raid1称为磁盘镜像。原理是在两个硬盘之间建立完全的镜像,即所有数据会被同时存放到两个物理硬盘上,当一个磁盘出故障时,仍可从另一个硬盘中读取数据,因此安全性得到保障。但系统的成本大大提高,因为系统的实际有效硬盘空间仅为所有硬盘空间的一半。

3.raid 3。raid3是把数据分成多个“块”,按照一定的容错算法,存放在n+1个硬盘上,实际数据占用的有效空间为n个硬盘的空间总和,而第n+1个硬盘上存储的数据是校验容错信息,当这n+1个硬盘中的其中一个硬盘出现故障时,从其它n个硬盘中的数据也可以恢复原始数据,这样,仅使用这n个硬盘也可以带伤继续工作(如采集和回放素材),当更换一个新硬盘后,系统可以重新恢复完整的校验容错信息。由于在一个硬盘阵列中,多于一个硬盘同时出现故障率的几率很小,所以一般情况下,使用raid3,安全性是可以得到保障的。与raid0相比,raid3在读写速度方面相对较慢。

4.raid4。raid4即带奇偶校验码的独立磁盘结构,raid4和raid3很像,它对数据的访问是按数据块进行的,也就是按磁盘进行的,每次是一个盘,raid4的特点和raid3也挺象,不过在失败恢复时,它的难度可要比raid3大得多了,控制器的设计难度也要大许多,而且访问数据的效率不怎么好。

5.raid5。raid5把校验块分散到所有的数据盘中。raid5使用了一种特殊的算法,可以计算出任何一个带区校验块的存放位置。这样就可以确保任何对校验块进行的读写操作都会在所有的raid磁盘中进行均衡,从而消除了产生瓶颈的可能。raid5的读出效率很高,写入效率一般,块式的集体访问效率不错。raid5提高了系统可靠性,但对数据传输的并行性解决不好,而且控制器的设计也相当困难。

6.raid 6。raid6即带有两种分布存储的奇偶校验码的独立磁盘结构,它是对raid5的扩展,主要是用于要求数据绝对不能出错的场合,使用了二种奇偶校验值,所以需要n+2个磁盘,同时对控制器的设计变得十分复杂,写入速度也不好,用于计算奇偶校验值和验证数据正确性所花费的时间比较多,造成了不必须的负载,很少人用。

7.raid7。raid7即优化的高速数据传送磁盘结构,它所有的i/o传送均是同步进行的,可以分别控制,这样提高了系统的并行性和系统访问数据的速度;每个磁盘都带有高速缓冲存储器,实时操作系统可以使用任何实时操作芯片,达到不同实时系统的需要。允许使用snmp协议进行管理和监视,可以对校验区指定独立的传送信道以提高效率。可以连接多台主机,当多用户访问系统时,访问时间几乎接近于0。但如果系统断电,在高速缓冲存储器内的数据就会全部丢失,因此需要和ups一起工作,raid7系统成本很高。

8.raid10。raid10即高可靠性与高效磁盘结构它是一个带区结构加一个镜象结构,可以达到既高效又高速的目的。这种新结构的价格高,可扩充性不好。

9.raid53。raid7即高效数据传送磁盘结构,是raid3和带区结构的统一,因此它速度比较快,也有容错功能。但价格十分高,不易于实现。

三、raid级别的的选择

使用的容错算法和分块大小决定raid使用的应用场合,在通常情况下,raid3比较适合大文件类型且安全性要求较高的应用,如视频编辑、硬盘播出机、大型数据库等;而raid5适合较小文件的应用,如文字、图片、小型数据库等。raid级别的选择有三个主要因素:可用性(数据冗余)、性能和成本。

四、raid技术的实现方法

raid实现有两种方法,一种是用专门的控制新片来完成,控制芯片可以做成raid卡的形式,也可以集成在主板上。另一种方法是用软件的方法来实现,比如win2000就含有软件raid的功能。

总之,冗余磁盘阵列raid技术,能够将有效数据和校验数据均匀分布在多个硬盘中并加入校验数据,当有硬盘损坏时,通过校验数据恢复损坏硬盘申的数据。在恢复过程中,不影响系统的服务。同时,raid系统可以大幅度提高磁盘数据1/0(input/outpu志;输入输出)的性能。通过配置并使用raid系统,可以最大限度地减少由于硬件损坏造成的系统故障和数据丢失。

参考文献:

[1]基于网络raid结构的ip存储广域网性能研究 / 崔宝江著。

[2]二级网络条纹数据布局及其相关问题的研究/ 刘晓光。

[3]《网络技术精要建网管网500问》曾明/李建军等著 电子工业出版社2003. 11。

上一篇:浅议自然语言信息处理的智能化应用 下一篇:浅谈多媒体信息处理技术教改中的探索