什么是磁盘阵列_天涯博客_有见识的人都在此_天涯社区

磁盘阵列是RAID的中文名称,也就是将多个物理磁盘组成一个逻辑磁盘。目前RAID常用的有RAID0,RAID1,RAID0+1/1+0,RAID5。
我们以两个80GB的磁盘为例。
RAID0是将两个磁盘连接变成一个逻辑磁盘,结果是我们得到了一个120GB的逻辑磁盘,数据是分别写在2个磁盘中的,读取时从2个盘中一起读,可以成倍的提高存储子系统的性能。但这种方法安全性是最差的,一旦有一个硬盘损坏,所有数据就都没有了。
RAID1是将2个硬盘划分为两部分,一个存数据,另一个做备份,也就是说80GB存数据80GB做备份。这样的数据安全性是{zh0}的,但磁盘空间利用率很低,只有50%。
至于RAID0+1/1+0和RAID5是要用4个或以上的硬盘才能组建的。RAID1+0/0+1是结合了RAID0和RAID1各自的优点,即既有安全性有可以提高系统性能,但组建成本太高,一般只用在服务器上。
现在的硬盘分为PATA和SATA两种接口,其中PATA硬盘就是我们常说的并口硬盘,{zg}传输速率是133Mb/s,而SATA是串口的,目前主流的产品{zg}传输速率是150Mb/s,下一代标准是300Mb/s。但由于硬盘的内部传输率不高,只有60-70Mb/s,所以SATA接口并不能带来实质性的性能提升,但由于SATA的数据线只有7根,所以会比80线的PATA硬盘传输距离更远,机箱内的散热也会更好一些。
PATA硬盘现在的所有主板都支持,是一个40针的长方形接口。而SATA只有从865时代才开始由主板直接支持,是一个7针的L型接口。
关于缓存,其大小和主板的支持无关,但和性能密切相关,8M的当然比2M的好,但价格也会高一些。

~~~~~~~~~~~~~~~~~~~~~~~~~~
磁盘阵列是一种把若干硬磁盘驱动器按照一定要求组成一个整体,整个磁盘阵列由阵列控制器管理的系统。冗余磁盘阵列RAID(Redundant Array of Independent Disks)技术1987年由加州大学伯克利分校提出,最初的研制目的是为了组合小的廉价磁盘来代替大的昂贵磁盘,以降低大批量数据存储的费用(当时RAID称为Redundant Array of Inexpensive Disks 廉价的磁盘阵列),同时也希望采用冗余信息的方式,使得磁盘失效时不会使对数据的访问受损失,从而开发出一定水平的数据保护技术。
磁盘阵列的工作原理与特征:
RAID的基本结构特征就是组合(Striping),捆绑2个或多个物理磁盘成组,形成一个单独的逻辑盘。组合套(Striping Set)是指将物理磁盘组捆绑在一块儿。在利用多个磁盘驱动器时,组合能够提供比单个物理磁盘驱动器更好的性能提升。 数据是以块(Chunks)的形式写入组合套中的,块的尺寸是一个固定的值,在捆绑过程实施前就已选定。块尺寸和平均I/O需求的尺寸之间的关系决定了组合套的特性。总的来说,选择块尺寸的目的是为了{zd0}程度地提高性能,以适应不同特点的计算环境应用。
磁盘阵列优点:
磁盘阵列有许多优点:首先,提高了存储容量;其次,多台磁盘驱动器可并行工作,提高了数据传输率;...RAID技术确实提供了比通常的磁盘存储更高的性能指标、数据完整性和数据可用性,尤其是在当今面临的I/O总是滞后于CPU性能的瓶颈问题越来越突出的情况下,RAID解决方案能够有效地弥补这个缺口。

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

磁盘阵列(Disk Array)是由一个硬盘控制器来控制多个硬盘的相互连接,使多个硬盘的读写同步,减少错误,增加效率和可靠度的技术。
目前,磁盘阵列技术被越来越多的人所认识和接受。磁盘阵列技术可以详细地划分为若干级别0-5RAID技术,现在又发展了新的RAID Level 10,30,50级别。什么是RAID呢/?RAID就是廉价冗余磁盘阵列(Redundant Array of Inexpensive Disk)的简称。RAID的优势总结起来就是:安全可靠、速度快、数据容量大。
下面我们分别介绍一下技术。
RAID1也称硬盘镜像。它是最传统的一种容错技术。实现起来非常简单。即把两个硬盘连结在一个控制器上,对硬盘里的数据实现{bfb}的备份。当我们把数据写到其中某一块硬盘上的时候,它同时也被写在另一块镜像硬盘上。当一个硬盘发生损坏时,另一块硬盘还可以正常工作,两个硬盘上的数据在任何时间里都是一样的,任何一个盘都可以当成工作盘,实现了数据备份的目的。但是,我们也可以清楚地看到,这种备份方式虽然简单、方便、读盘速度快,但是从价格上说用户必须付出双倍的投入。
现在广泛使用的是RAID3和RAID5。RAID3技术就是校验码集中在一块硬盘上,RAID3,把三块以上的硬盘集中在一个控制器上,在顺序读写方面速度很快;RAID5的校验码则分布在所有的硬盘中,随机读写访问上有优势。用户投入大,但是,比起RAID1来说用户可以节省成本。
中国大恒信息技术公司在2000年9月正式发布新一代磁盘阵列系统——大恒ACCSTOR DS2000磁盘阵列,它使用64位的POWER PC RISC CPU,可配置高达1GB的缓存。每通道的突发数据传输可达533MB/S,配合多通道的数据吞吐,大幅提升每秒的I/O处理和读写性能,其整体性能比32位X86的RAID高出500%;整体的背板化的设计及SCSI Cable全面支持Ultra160,使用户轻松地从80MB/S升级到160MB/S。为用户的数据安全、高速存储提供了可靠的{zj0}解决方案。大恒ACCSTOR DS2000磁盘阵列支持RAID Level0,1,3,5,10,30,50,NRAID,or JBOD。在更高阶的容错性能上,提供{zxj}的Active/Active的冗余双控制器价构的磁盘阵列。大恒ACCSTOR DS2000磁盘阵列具备高可管理性,便于见空。提供了对数据的充分保护及在线维修的功能:坏盘自动检测、报警、热备、自动重建、热交换等,监控电源、风扇、温度、SCSI ID、MFBF的状态;模块化的设计使系统更加容易维护和管理。提供基于JAVA的图形截面的远程管理软件,对操作环境作实时的管理,将所有的运行状况及设置显示出来,一目了然。系统可自我侦测,故障时可通过蜂鸣器、MODEM、网络报警。由于采用高性能的控制器和先进的整体设计,使产品的性能很高,而价格却大大低于同类产品。

~~~~~~~~~~~~~~~~~~~~~~~~~

Raid磁盘阵列技术详细介绍

 随着计算机应用的日益普及,人们对计算速度和性能的要求也逐渐提高。在一个完整的计算机系统中,CPU和内存的作用固然重要,但是数据存储设备性能的好坏和速度的快慢也直接影响到整个系统的表现。本文所要讲解的RAID技术起初主要应用于服务器xx市场,但是随着个人用户市场的成熟和发展,正不断向低端市场靠拢,从而为用户提供了一种既可以提升硬盘速度,又能够确保数据安全性的良好的解决方案。本文将对RAID技术进行较为详细的介绍,希望能够对广大读者有所帮助。
 入门基础
 RAID是英文Redundant Array of Inexpensive Disks的缩写,中文简称为磁盘阵列。其实,从RAID的英文原意中,我们已经能够多少知道RAID就是一种由多块廉价磁盘构成的冗余阵列。虽然RAID包含多块磁盘,但是在操作系统下是作为一个独立的大型存储设备出现。RAID技术分为几种不同的等级,分别可以提供不同的速度,安全性和xxx。
 人们在开发RAID时主要是基于以下设想,即几块小容量硬盘的价格总和要低于一块大容量的硬盘。虽然目前这一设想还没有成为现实,RAID在节省成本方面的作用还不是很明显,但是RAID可以充分发挥出多块硬盘的优势,实现远远超出任何一块单独硬盘的速度和吞吐量。除了性能上的提高之外,RAID还可以提供良好的容错能力,在任何一块硬盘出现问题的情况下都可以继续工作,不会受到损坏硬盘的影响。
 RAID 0
 我们在前文中已经提到RAID分为几种不同的等级,其中,RAID 0是最简单的一种形式。RAID 0可以把多块硬盘连接在一起形成一个容量更大的存储设备。最简单的RAID 0技术只是提供更多的磁盘空间,不过我们也可以通过设置,使用RAID 0来提高磁盘的性能和吞吐量。RAID 0没有冗余或错误修复能力,但是实现成本是{zd1}的。
 RAID 0最简单的实现方式就是把几块硬盘串联在一起创建一个大的卷集。磁盘之间的连接既可以使用硬件的形式通过智能磁盘控制器实现,也可以使用操作系统中的磁盘驱动程序以软件的方式实现。图示如下:



 在上述配置中,我们把4块磁盘组合在一起形成一个独立的逻辑驱动器,容量相当于任何任何一块单独硬盘的4倍。如图中彩色区域所示,数据被依次写入到各磁盘中。当一块磁盘的空间用尽时,数据就会被自动写入到下一块磁盘中。
 这种设置方式只有一个好处,那就是可以增加磁盘的容量。至于速度,则与其中任何一块磁盘的速度相同,这是因为同一时间内只能对一块磁盘进行I/O操作。如果其中的任何一块磁盘出现故障,整个系统将会受到破坏,无法继续使用。从这种意义上说,使用纯RAID 0方式的可靠性仅相当于单独使用一块硬盘的1/4(因为本例中RAID 0使用了4块硬盘)。
 虽然我们无法改变RAID 0的可靠性问题,但是我们可以通过改变配置方式,提供系统的性能。与前文所述的顺序写入数据不同,我们可以通过创建带区集,在同一时间内向多块磁盘写入数据。具体如图所示:



 上图中,系统向逻辑设备发出的I/O指令被转化为4项操作,其中的每一项操作都对应于一块硬盘。我们从图中可以清楚的看到通过建立带区集,原先顺序写入的数据被分散到所有的四块硬盘中同时进行读写。四块硬盘的并行操作使同一时间内磁盘读写的速度提升了4倍。
 在创建带区集时,合理的选择带区的大小非常重要。如果带区过大,可能一块磁盘上的带区空间就可以满足大部分的I/O操作,使数据的读写仍然只局限在少数的一、两块硬盘上,不能充分的发挥出并行操作的优势。另一方面,如果带区过小,任何I/O指令都可能引发大量的读写操作,占用过多的控制器总线带宽。因此,在创建带区集时,我们应当根据实际应用的需要,慎重的选择带区的大小。
 我们已经知道,带区集可以把数据均匀的分配到所有的磁盘上进行读写。如果我们把所有的硬盘都连接到一个控制器上的话,可能会带来潜在的危害。这是因为当我们频繁进行读写操作时,很容易使控制器或总线的负荷超载。为了避免出现上述问题,建议用户可以使用多个磁盘控制器。示意图如下:



 这样,我们就可以把原先控制器总线上的数据流量降低一半。当然,{zh0}解决方法还是为每一块硬盘都配备一个专门的磁盘控制器。

 RAID 1
 虽然RAID 0可以提供更多的空间和更好的性能,但是整个系统是非常不可靠的,如果出现故障,无法进行任何补救。所以,RAID 0一般只是在那些对数据安全性要求不高的情况下才被人们使用。
 RAID 1和RAID 0截然不同,其技术重点全部放在如何能够在不影响性能的情况下{zd0}限度的保证系统的可靠性和可修复性上。RAID 1是所有RAID等级中实现成本{zg}的一种,尽管如此,人们还是选择RAID 1来保存那些关键性的重要数据。
 RAID 1又被称为磁盘镜像,每一个磁盘都具有一个对应的镜像盘。对任何一个磁盘的数据写入都会被复制镜像盘中;系统可以从一组镜像盘中的任何一个磁盘读取数据。显然,磁盘镜像肯定会提高系统成本。因为我们所能使用的空间只是所有磁盘容量总和的一半。下图显示的是由4块硬盘组成的磁盘镜像,其中可以作为存储空间使用的仅为两块硬盘(画斜线的为镜像部分)。



 RAID 1下,任何一块硬盘的故障都不会影响到系统的正常运行,而且只要能够保证任何一对镜像盘中至少有一块磁盘可以使用,RAID 1甚至可以在一半数量的硬盘出现问题时不间断的工作。当一块硬盘失效时,系统会忽略该硬盘,转而使用剩余的镜像盘读写数据。
 通常,我们把出现硬盘故障的RAID系统称为在降级模式下运行。虽然这时保存的数据仍然可以继续使用,但是RAID系统将不再可靠。如果剩余的镜像盘也出现问题,那么整个系统就会崩溃。因此,我们应当及时的更换损坏的硬盘,避免出现新的问题。
 更换新盘之后,原有好盘中的数据必须被复制到新盘中。这一操作被称为同步镜像。同步镜像一般都需要很长时间,尤其是当损害的硬盘的容量很大时更是如此。在同步镜像的进行过程中,外界对数据的访问不会受到影响,但是由于复制数据需要占用一部分的带宽,所以可能会使整个系统的性能有所下降。
 因为RAID 1主要是通过二次读写实现磁盘镜像,所以磁盘控制器的负载也相当大,尤其是在需要频繁写入数据的环境中。为了避免出现性能瓶颈,使用多个磁盘控制器就显得很有必要。下图示意了使用两个控制器的磁盘镜像。



 使用两个磁盘控制器不仅可以改善性能,还可以进一步的提高数据的安全性和可用性。我们已经知道,RAID 1最多允许一半数量的硬盘出现故障,所以按照我们上图中的设置方式(原盘和镜像盘分别连接不同的磁盘控制),即使一个磁盘控制器出现问题,系统仍然可以使用另外一个磁盘控制器继续工作。这样,就可以把一些由于意外操作所带来的损害降低到{zd1}程度。
 RAID 0+1
 单独使用RAID 1也会出现类似单独使用RAID 0那样的问题,即在同一时间内只能向一块磁盘写入数据,不能充分利用所有的资源。为了解决这一问题,我们可以在磁盘镜像中建立带区集。因为这种配置方式综合了带区集和镜像的优势,所以被称为RAID 0+1。
 热插拔
 一些面向xx应用的磁盘镜像系统都可以提供磁盘的热插拔功能。所谓热插拔功能,就是允许用户在不关闭系统,不切断电源的情况下取出和更换损害的硬盘。如果没有热插拔功能,即使磁盘损坏不会造成数据的丢失,用户仍然需要暂时关闭系统,以便能够对硬盘进行更换。现在,使用热插拔技术只要简单的打开连接开关或者转动手柄就可以直接取出硬盘,而系统仍然可以不间断的正常运行。
 校验
 RAID 3和RAID 5都分别使用了校验的概念提供容错能力。简单的说,我们可以把校验想象为一种二进制的校验和,一个可以告诉你其它所有字位是否正确的特殊位。
 在数据通信领域,奇偶校验被用来确定数据是否被正确传送。例如,对于每一个字节,我们可以简单计算数字位1的个数,并在字节内加入附加校验位。在数据的接收方,如果数字位1的个数为奇数,而我们使用的又是奇数校验的话,则说明该字节是正确的。同样对偶数校验也是如此。然而,如果数字位1的个数和校验位的奇偶性不一致的话,则说明数据在传送过程中出现了错误。
 RAID系统也采用了相似的校验方法,可以在磁盘系统中创建校验块,校验块中的每一位都用来对其它关联块中的所有对应位进行校验。
 在数据通讯领域,虽然校验位可以告诉我们某个字节是否正确,但是无法告诉我们到底是哪一位出现了问题。这就是说我们可以检测错误,但是不能改正错误。对于RAID,这是远远不够的。固然错误的检测非常重要,但是如果不能对错误进行修复,我们就无法提高整个系统的可靠性。
 举个例子来说,假设我们发现校验块中第10个字节的第5位不正确。如果这个校验块包含的是另外8个数据块的校验信息,那么哪一个数据块才是问题的罪魁祸首呢?也许你可能会想为每一个数据块都建立一个校验块就可以解决问题。但是这种方法很难实现。事实上,RAID主要是借助磁盘控制器的错误报告检测错误位置,并进行修复。如果磁盘控制器在读取数据时没有发出任何“抱怨”,那么系统将会视该数据为正确数据,继续使用。

 RAID 3
 RAID 3采用的是一种较为简单的校验实现方式,使用一个专门的磁盘存放所有的校验数据,而在剩余的磁盘中创建带区集分散数据的读写操作。例如,在一个由4块硬盘构成的RAID 3系统中,3块硬盘将被用来保存数据,第四块硬盘则专门用于校验。这种配置方式可以用3+1的形式表示,具体如图:



 在上图中,我们用相同的颜色表示使用同一个校验块的所有数据块,斜线标出的部分为校验块。校验块和所有对应的数据块一起构成一个带区。
 第四块硬盘中的每一个校验块所包含的都是其它3块硬盘中对应数据块的校验信息。RAID 3的成功之处就在于不仅可以象RAID 1那样提供容错功能,而且整体开销从RAID 1的50%下降为25%(RAID 3+1)。随着所使用磁盘数量的增多,成本开销会越来越小。举例来说,如果我们使用7块硬盘,那么总开销就会将到12.5%(1/7)。
 在不同情况下,RAID 3读写操作的复杂程度不同。最简单的情况就是从一个完好的RAID 3系统中读取数据。这时,只需要在数据存储盘中找到相应的数据块进行读取操作即可,不会增加任何额外的系统开销。
 当向RAID 3写入数据时,情况会变得复杂一些。即使我们只是向一个磁盘写入一个数据块,也必须计算与该数据块同处一个带区的所有数据块的校验值,并将新值重新写入到校验块中。例如,当我们向上图中的绿色数据块写入数据时,必须重新计算所有3个绿色数据块的校验值,然后重写位于第四块硬盘的绿色校验块。由此我们可以看出,一个写入操作事实上包含了数据读取(读取带区中的关联数据块),校验值计算,数据块写入和校验块写入四个过程。系统开销大大增加。
 我们可以通过适当设置带区的大小使RAID系统得到简化。如果某个写入操作的长度恰好等于一个完整带区的大小(全带区写入),那么我们就不必再读取带区中的关联数据块计算校验值。我们只需要计算整个带区的校验值,然后直接把数据和校验信息写入数据盘和校验盘即可。
 到目前为止,我们所探讨的都是正常运行状况下的数据读写。下面,我们再来看一下当硬盘出现故障时,RAID系统在降级模式下的运行情况。
 RAID 3虽然具有容错能力,但是系统会受到影响。当一块磁盘失效时,该磁盘上的所有数据块必须使用校验信息重新建立。如果我们是从好盘中读取数据块,不会有任何变化。但是如果我们所要读取的数据块正好位于已经损坏的磁盘,则必须同时读取同一带区中的所有其它数据块,并根据校验值重建丢失的数据。
 当我们更换了损坏的磁盘之后,系统必须一个数据块一个数据块的重建坏盘中的数据。整个过程包括读取带区,计算丢失的数据块和向新盘写入新的数据块,都是在后台自动进行。重建活动{zh0}是在RAID系统空闲的时候进行,否则整个系统的性能会受到严重的影响。
 RAID 3的性能问题
 除了我们在上文讨论过的有关数据写入和降级模式的问题之外,在使用RAID 3的过程中还有其他一些性能上的问题需要引起我们的注意。RAID 3所存在的{zd0}一个不足同时也是导致RAID 3很少被人们采用的原因就是校验盘很容易成为整个系统的瓶颈。
 我们已经知道RAID 3会把数据的写入操作分散到多个磁盘上进行,然而不管是向哪一个数据盘写入数据,都需要同时重写校验盘中的相关信息。因此,对于那些经常需要执行大量写入操作的应用来说,校验盘的负载将会很大,无法满足程序的运行速度,从而导致整个RAID系统性能的下降。鉴于这种原因,RAID 3更加适合应用于那些写入操作较少,读取操作较多的应用环境,例如数据库和WEB服务器等。
 RAID 5
 RAID 3所存在的校验盘的性能问题使几乎所有的RAID系统都转向了RAID 5。在运行机制上,RAID 5和RAID 3xx相同,也是由同一带区内的几个数据块共享一个校验块。
 RAID 5和RAID 3的{zd0}区别在于RAID 5不是把所有的校验块集中保存在一个专门的校验盘中,而是分散到所有的数据盘中。RAID 5使用了一种特殊的算法,可以计算出任何一个带区校验块的存放位置。具体如图所示:



 注意图中的校验块已经被分散保存在不同的磁盘中,这样就可以确保任何对校验块进行的读写操作都会在所有的RAID磁盘中进行均衡,从而xx了产生瓶颈的可能。

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

就是RAID
RAID是英文Redundant Array of Independent Disks的缩写,翻译成中文即为独立磁盘冗余阵列,或简称磁盘阵列。简单的说,RAID是一种把多块独立的硬盘(物理硬盘)按不同方式组合起来形成一个硬盘组(逻辑硬盘),从而提供比单个硬盘更高的存储性能和提供数据冗余的技术。组成磁盘阵列的不同方式成为RAID级别(RAID Levels)。

数据冗余的功能是在用户数据一旦发生损坏后,利用冗余信息可以使损坏数据得以恢复,从而保障了用户数据的安全性。





郑重声明:资讯 【什么是磁盘阵列_天涯博客_有见识的人都在此_天涯社区】由 发布,版权归原作者及其所在单位,其原创性以及文中陈述文字和内容未经(企业库qiyeku.com)证实,请读者仅作参考,并请自行核实相关内容。若本文有侵犯到您的版权, 请你提供相关证明及申请并与我们联系(qiyeku # qq.com)或【在线投诉】,我们审核后将会尽快处理。
—— 相关资讯 ——