磁盘管理之RAID

更新时间：2022-10-07 09:09:03

一、RAID简介

RAID（Redundant Array of Inexpensive Disks，简称RAID）的基本目的是把多个小型廉价的磁盘驱动器合并成一组阵列来达到大型昂贵的驱动器所无法达到的性能或冗余性。这个驱动器阵列在计算机眼中就如同一个单一的逻辑贮存单元或驱动RAID 是一种在多个磁盘上分散信息的方法。它使用磁盘分条（disk striping，RAID 级别 0）、磁盘镜像（disk mirroring，RAID 级别 1）、和带有奇偶校验的磁盘分条（disk striping with parity，RAID 级别 5）之类的技术来达到冗余性，减低潜伏时间，并且（或者）增加磁盘读写的带宽，提高从硬盘崩溃中恢复的能力。

RAID 的基本原理是，数据必须使用一致的形式被分散到阵列中的驱动器上。

要打到这个目的，数据必须被分割成大小一致的“块”（大小通常是32K 或64K，也可使用不同大小）。每一块都会根据所用的 RAID 级别而写入其中的一个硬盘驱动器。当数据要被读取时，这个进程就会反过来进行，造成多个驱动器好像是一个大驱动器的假象。

二、RAID特性：

RAID主要满足于2个特性：

高性能（数据读、写）有些场景下需要读写都比较高；要求足够可靠（冗余）

三、raid级别：

RAID0 - RAID7

RAID10,RAID50 等可以将raid组合起来使用

RAID控制器：baidu

级别只是用来描述多块磁盘不同的组合逻辑

1、RAID0：乔带设备，是一种能够实现将数据并行存储在多块磁盘上，如下图所示：

RAID0实现把要存放的数据划分成不同的独立的块可以看到左边的D0、D1…等，这里的数据块跟硬盘本身的block块是两码事，一般来讲这个块比block要大的多，而要实现往多个磁盘上存储的时候，那么这些数据块将会按照顺序d0开始分别存储到不同的磁盘上，依次循环，d0放在第一块盘上 d1放到第二块盘上，以此类推。

当来了一块的时候再进行依次循环，所以存储数据是完全平均分布在硬盘上来实现，性能上会有极大提升，因为实现了并行存储,把一个数据切割成N块形成一个条带。

2、RAID1：镜像

以镜像为荣誉方式对虚拟磁盘上的数据做多份拷贝，放在成员磁盘上，如下图所示：

因此存储数据仍然需要RAID卡来实现，只不过raid控制器（raid卡）仍然会将数据分成多份，但是数据存储是多块硬盘上是一样的。两块硬盘上的每个扇区都是各自完全对应的，如果其中一块硬盘出现故障可将替换一块新硬盘，当将一块新硬盘插入到服务器内，RAID1会立即做一次镜像同步（srync）重新将新加的硬盘和对应硬盘建立对应关系，按位逐个复制到新硬盘，从而达成冗余

#RAID本身非常消耗带宽，因此必须实施监控raid

RAID1的特性：

3、RAID2：校验冗余（通过3块硬盘来实现冗余）

把数据分散为位或块，加入汉明码，间隔写入到磁盘阵列的每个磁盘中

在成员磁盘上的地址都一样

RAID2是通过异或运算提来供错误检查及恢复：

Raid3，raid4，raid5里面都有校验磁盘的概念，其中奇偶校验盘涉及到异或运算。
异或运算XOR：
1.先说异或的逻辑符号：^.
2.异或的逻辑定义：同则假，异则真（0^0=0，1^1=0， 0^1=1 ，1^0=1）
3.计算机中的逻辑运算用1表示真，0表示假。
4.两个字节按位异或的例子：
01111001
11100111 ：异或运 ^
-------------------
10011110
5.假设一个3个数字的异或运算模型：3块硬盘HD1,HD2,HD3的数据信息全通过校验盘HD4存放校验信息
hd1 hd2 hd3 --hd4
0 0 0 --0
0 0 1 --1
0 1 0 --1
0 1 1 --0
1 0 0 --1
1 0 1 --0
1 1 0 --0
1 1 1 --1
从这个模型理解异或运算的概念：偶数个1的结果为0，奇数个1的结果为1；
6.得出n个数字异或运算的技巧：成双的1抵消后，剩下的是0还是1，即使异或的结果。
比如：0^1^0^1^0^1^0^0^1^0^1^0^0=1
(13个数字异或运算)
7.这也可以理解异或运算满足结合律
(a^b)^c=a^(b^c)