浅析RAID技术在信息化建设中的应用

时间:2022-10-24 10:09:58

浅析RAID技术在信息化建设中的应用

[摘要]随着时代的发展和科技的进步,各个领域的数据存储就需要越来越可靠和稳定,同时提高读写速率也是极为重要的,因此,作为一种被广泛认同的存储管理技术,即RAID技术,在如今这个时代迅速发展且被大量运用。本文就信息化建设方面来详述RAID技术,由于不同的信息化建设部门采用的RAID模式不一样,因此针对RAID模式的不同进行分析研究,在总结其优点和缺点的同时并提出建议,以此更好地提高效率。文中最后表述了RAID技术的应用实践并说明了应该如何对其进行日常维护,这也有利于RAID技术能够更好地服务于信息化建设当中。

[关键词]RAID技术;信息化建设;应用

0引言

信息化建设主要是针对农业、工业及教育科学技术等方面,同时也有利于我国信息资源开发领域的发展,由国家进行统一规划及实行,其对我国现代化建设也有十分重要的意义。随着现代化进程的推动,各行各业所需的相关信息量越来越多,需要更高效率的信息处理技术,因此计算机和通信技术在这种形势下迅速发展,其中,由于性能优势而备受我国各大领域信赖的RAID技术得到了广泛运用和发展。

1RAID技术

起初,David A.Patterson等人提出了RAID(Redundant Arrays of Inexpensive Disks)即廉价冗余磁盘阵列这个概念。作为加利福利亚大学伯克利分校的研究人员,David A.Patterson等人原本是榱私饩鲇捎诖排绦阅艿脑龀に俣雀喜簧CPU性能而不能与之相匹配的问题,但是由于RAID技术越来越可靠、安全,且其可扩展性等不断提高,也就顺其自然地被广泛运用到各个领域的实际存储系统中。RAID技术利用冗余数据使数据本身具有高可靠性,且通过将数据条带化从而增强I/O的并行性,这样有利于数据存储的高效性和安全性。冗余数据就是指备份或编码原有数据,通常利用复制、域运算及异域运算的手段进行,且把经过处理的数据放到不同磁盘中进行存储,由此得到有相应容错能力的磁盘阵列。而数据条带化则是把被分成些许独立数据段的整段数据放到不同磁盘中进行存储,这样进程可以并行访问多个磁盘,因此磁盘的I/O并行度得到增强,即形成了具有更高I/O带宽的磁盘阵列。

但是,冗余数据的方式不同就会使得磁盘阵列的容错能力及I/O能力不同。比如,单块磁盘存储冗余数据的磁盘阵列容错能力低于两块磁盘,但是其空间利用率就相对较高。也就是说两块磁盘存储冗余数据使得磁盘阵列空间利用率降低,但却增加了数据的安全性及可靠性。

所以,为了满足不同情况下所需的磁盘阵列容错能力和I/O能力,也就出现了不同等级的RAID技术。

2RAID技术的工作原理及特点

2.1RAID技术工作原理

RAID 0:RAID 0由于其没有数据冗余功能,不能被称作真正的RAID结构。其分割数据的单位是位或者字节,其在多个磁盘上是以并行读写的方式进行的,所以数据传输率较高。RAID 0不能保障数据可靠,只能提高性能,且如果有一个磁盘损坏就会使所有数据受到影响,这也是其不适用于要求数据较高安全性情况的原因所在。

当将磁盘阵列设置成RAID 0模式时,磁盘阵列的总容量等于该阵列最小磁盘容量乘上磁盘数量。例如:5块300GB的硬盘和一个250 GB硬盘组成RAID 0,则可得到的磁盘空间是1 500 GB(250 GB×6)。

RAID 1:其数据冗余是利用磁盘数据镜像的方式,即采用成对且独立的磁盘相互备份数据来实现数据冗余。如果原始数据处于繁忙状态而不及时提供有效数据,则可以通过镜像拷贝直接读取相关数据,这也是RAID 1能使读取性能增强的体现。RAID 1的数据安全性及可靠性较高,当然其单位成本高于其他磁盘阵列。由于其具有能自动在镜像磁盘中读写的性能,即便是有一个磁盘损坏,也不会对数据产生影响,无需重新组成。

设置成RAID 1模式的阵列容量等于两个磁盘中较小那个的容量。例如,一个100 GB的硬盘和一个120 GB的硬盘组成RAID 1,则其RAID 1卷的容量等于100 GB。

RAID 0+1:RAID 0+1是RAID 0和RAID 1的组合,又称为RAID 10。它既用条块化读写,同时又使用镜像操作。RAID(O+1)完全使用硬盘来实现资料备份,因此允许多个硬盘损坏。在每次写人数据,磁盘阵列控制器会将资料同时写入该两组“大容量数组硬盘组”内。同RAID 1一样,虽然其硬盘使用率亦只有50%,但它却是最具高效率的规划方式。

RAID 2:其是在RAID 0的基础上延伸得到的,RAID 2可以以字节为单位来分割数据,其磁盘阵列的容错能力是采用海明码方式得到的,这也使得其实行过程变得繁杂而逐渐被淘汰。

RAID 3:与RAID 2很相似的是两者都是把数据条带化后而存储于不同的磁盘上,不同的是RAID 3采用简易的奇偶校验且将处理后的信息存储于单块磁盘中。假如一块数据磁盘损坏,那存储奇偶校验信息的单块磁盘和其他数据磁盘则能再次产生数据;若奇偶校验信息存储盘损坏的话,数据还是可以正常使用。RAID 3能有效传输庞大的连续数据,但是由于奇偶校验信息存储盘的存在,则不能很好地进行随机数据的写功能。

RAID 4:是用特定磁盘来存储校验信息,这点与RAID 3很相似,但是RAID 4数据存储的单位是数据块。由于一个固定大小的数据单元就是一个数据块,因此只要数据块完整,就能顺利地对数据进行编解码和恢复产生。虽然RAID4由于校验效率要高于RAID 3,写入速度要高于RAID 3,但其数据恢复要比RAID 3困难的多,控制器设计难度也非常大,所以数据访问效率比较低。

RAID 5:具有存储性能高、数据安全性好及存储成本控制等的一系列优点,其读写速度较快且空间利用率也较高,但是假使一块硬盘损坏就会影响整个系统性能。RAID 5能够保障系统数据的安全,虽然没有镜像的高保障性,但是其磁盘空间利用率较高。RAID 5的数据读取速率与RAID 0相差不大,但是由于其有奇偶校验信息存储盘,使得其写入数据的速率低于单个磁盘的RAID 0,而RAID 5的一个奇偶校验信息对应多个数据使得其磁盘空间利用率高于RAID 1。

RAID 6:多了一个独立的奇偶校验信息存储盘,具有两个独立的使用不同算法的奇偶校验信息存储盘,增加了数据的可靠性,就算是两个奇偶校验信息存储盘都损坏也对数据产生不了影响。由于其写“损失”比RAID 5大,这也就降低了写的性能。

RAID 7:与前面的技术都不同,其是一种新型的RAID标准。RAID 7能够智能地进行实时操作,其具有的软件工具能够进行存储管理,还能与主机脱离而独自运作,且完全不需要CPU支持。RAID 7磁盘结构的传输是通过优化后的高速数据进行的,同步I/0传送且能单独掌控,这对系统并行性有很大的提升作用,同时也能使系统访问数据的速度得到有效增加;由于高速缓冲存储器在各个磁盘中都具有,不同实时系统在无论哪一个操作芯片都能控制实时操作系统的条件下而得到需求满足,也就是多个用户可以连接多台主机进行接近零时间系统访问,非常便捷。

最常用的RAID0~5级的描述、速度与容错功能见表1。

2.2RAID技术特点

就RAID不同级别的发展及运用方面:

第一,RAID控制器的读写功能是运用磁盘阵列的并行数据实现的,这样不仅摆脱了磁盘机电设计的影响,还有利于存取速度的增大,也就是说几张磁盘阵列的读写速度就是单盘读写速度的几倍,因此能有效地运用到多种应用。

第二,RAID系统的数据存储容量很大,主机可以根据需要随时运用磁盘上的相关数据。对于较为复杂的RAID系统,用户可以利用控制器传数据的有关方式对多个磁盘进行级别连接。比如九十张磁盘的寻址操作可由一个设置完善的RAID的高性能控制器进行同一时间的控制。

第三,RAID系统奇偶校验技术的应用对数据可靠性的增强十分有帮助。其控制器在磁盘上进行数据写功能的同时还能把相关的奇偶校验冗余数据进行如实记录,这样一来,即便磁盘损坏,记录下来的奇偶校验信息也能把丢失的相关信息重新计算出来,且不影响RAID控制器的性能。

3RAID技术在信息存储中的应用

3.1RAID的实现方式

磁盘阵列的实现是通过软件阵列和硬件阵列这两种形式。

软件阵列:连接普通SCSI卡的多块硬盘被网络操作系统本身具有的磁盘管理功能分成逻辑盘并组成软件阵列,比如NOVELL的Net Ware操作系统具有软件阵列功能和RAID 1功能。软件阵列能冗余数据,可是会降低磁盘子系统的相关性能。

硬件阵列:通过专门的磁盘阵列卡形成,磁盘阵列卡在如今的非入门及服务器中很常见,无论是否集成在主板上都能形成硬件阵列。其中,动态修改阵列级别、超高速缓冲及自动数据恢复等功能都能通过硬件阵列实现,另外硬件阵列还具有数据保护、可靠、实用及可控等特性。磁盘阵列卡有一个专门的处理器用来进行数据的高速处理,另外还有一个专门的存贮器用来进行数据的高速缓冲。由此,磁盘阵列卡就可以实现服务器操作磁盘这个功能,这也就不会占用太多的CPU资源,还能节省系统内存,且对磁盘子系统的性能没有影响。

3.2RAID应用场景

数据的存储可根据不同的需求选择不同的数据RAID方式。

RAID 0:由于RAID 0数据冗余性差但磁盘读写效率和磁盘利用率高的特点,一般应用于小型私人盘阵中,不适合应用于大型商业或者数据安全性较高的场合。

RAID 1:采用备份盘的方式,安全性高,因此多应用于财务部门、付款部门等需要高可用性以及对数据的安全有较高要求的部门。

RAID 0+1:由于具有RAID 1和RAID 0两种方式的特点,RAID 10的数据安全性和读写效率高,但建设成本较大。因此该种方式多应用于图像处理、数据库服务器、一般文件服务器、备份磁盘驱动器及在信息化建设中对存储速度和数据安全性都有要求的单位。

RAID 2:该种方式由于只是RAID 0的延伸,并且实现方式更加复杂,已经逐渐被淘汰。

RAID 3:由于RAID 3不能很好地执行随机数据的写功能,可用于写连续数据的工作环境,如绘图、数据仓储、视讯编辑、影像、高速数据撷取、多媒体等单位应用。

RAID 4:和RAID 3的方式类似,虽然校验速度高于RAID 3,但其数据恢复要比RAID 3更加复杂,其应用的场合较少。

RAID 5:具有存储性能高、数据安全性好及存储成本控制等的一系列优点,已成为大部分存储系统首选的RAID方式,许多政府机关、科研单位、企业等的存储系统都是采用RAID 5方式。

RAID 6:由于RAID 6的建设成本比RAID 5高,同时其方式的设计复杂,其应用性要远小于RAID 5,只有对数据安全性有特殊要求的部分单位和部门应用。

RAID 7:由于RAID 7为一种新型RAID标准,其应用的成本很高,暂时只有部分高I/0需求的科研单位测试使用。

3.3硬盘数据恢复

RAID系统与操作系统及其他软件相比,简单来说其就是一个硬盘,其他的磁盘都无法看到,比如说分区及格式化等操作都是围绕一个硬盘进行。因此,RAID数据恢复在很多数据恢复软件中进行的过程其实和一个硬盘数据恢复相比没什么不同,并且像Recover4all等在一个硬盘上实现数据恢复的软件也具备这个特性。

根据不同的RAID自身损坏的情况实行不同的解决方案。一般都是由于操作错误而失去了RAID逻辑盘,这种情况下一定不要初始化逻辑盘,而是只需按照原来的方式来设置RAID⑹并重新启动就行了。也有一些RAID卡,如果将其RAID逻辑盘重新构建就会再次条带化各硬盘,而且数据也因此可能再也无法恢复。所以,应该先明确用户用的是哪种RAID,操作系统有没有损坏以及是否需要刷新RAID系统等后才能决定要不要恢复RAID系统。

3.4RAID的安全管理

3.4.1注意对日志文件的运行进行检查

磁盘阵列内部的运行状况都被一一记录在日志文件中,其中含有事件序列号、设备位置、发生时间等相关信息,有利于查出磁盘阵列出现的问题并有效排除不相干部分。

3.4.2注意对系统配置参数进行备份

逻辑配置、状态配置等相关参数,比如所用RAID类型、逻辑盘大小、条带容量、物理磁盘组成种类及各物理磁盘的通道号、型号、目标序列号等数据应该在磁盘阵列系统建成后做好详细记录。

3.4.3注意对重要数据进行定时备份

阵列控制器冗余、备用电池及双UPS电源供电等技术由于设备成本及技术繁杂等而不能同时使用,因此,重要的工作需要通过磁带、磁盘等介质对数据进行定时备份,也可以采用操作系统对数据进行本地备份,另外还可以利用网络系统对数据进行远程备份。

3.4.4注意对热备用磁盘进行建立

作为RAID技术的新型技术,即热备用磁盘技术。在磁盘阵列中,正常运行时,一个待机的磁盘会自动替代物理磁盘中损坏的那个,此时利用逻辑驱动器的冗余数据,原来损坏磁盘中存储的数据会被利用逻辑驱动器冗余数据的阵列控制器采用校验算法而在热备用磁盘上再次建立。

这种重新建立数据的热备用磁盘,其空间容量应该比损坏磁盘的容量大或者两者相等,在平时必须保证其不被占用,而且其阵列控制器必须能正常地自动进行数据重新建立。一个阵列对应一个热备用磁盘,系统管理员一旦发现热备用磁盘数据丢失的机率增大,就应该立即把相应的新热备用磁盘代替损坏的磁盘,如此才有利于维护相关性能的正常。

3.4.5注意对数据一致性进行定期检查

为了保证数据的一致性,应该每周一到两次来仔细检查RAID互为镜像磁盘的数据,当然也可以重新检验主数据,这样也能达到效果。

4结语

目前,我国各领域已经普遍且较为成熟地运用RAID技术,其作用不可忽视。随着信息化建设进程的推动,企业需要结合自身发展情况来决定采用哪种RAID模式,只有这样,才有利于增强企业本身的信息化管理能力,同时对办公水平的提高也有十分重要的意x。所以,为了我国信息化建设的全面发展,应该深入研究RAID技术,并为此奠定有力基础。

上一篇:探析路由器的安全配置 下一篇:高校图书馆运行问题之浅析