Différents niveaux RAID offrent différents avantages. Certains offrent des gains de performances en regroupant la capacité de stockage et les E/S en lecture/écriture, tandis que d’autres protègent contre les pannes matérielles grâce à la redondance des données.
Parmi ces niveaux, RAID 5 et 6 ont été deux des plus populaires ces derniers temps, car ils offrent une combinaison de performances et de sécurité. En raison de leurs diverses similitudes, il peut être déroutant de déterminer quand il est préférable d’utiliser RAID 5 ou RAID 6.
En tant que tel, nous discuterons de ce que sont exactement ces deux niveaux RAID , de leurs principales similitudes et différences, et du moment où utiliser l’un ou l’autre dans cet article.
Table des matières
Qu’est-ce que le RAID 5 ?
Comme indiqué, différents niveaux RAID se concentrent sur la protection des données et l’amélioration des performances à des degrés divers. RAID 5 fournit ces deux éléments via la parité distribuée entrelacée de blocs.
Cela signifie que la répartition se produit au niveau du bloc. La taille de ces blocs, également connue sous le nom de taille de bloc, est à la charge de l’utilisateur, mais elle varie généralement de 64 Ko à 1 Mo.
De plus, pour chaque bande, un bloc de données de parité est écrit. Ces blocs de parité sont répartis sur l’ensemble de la baie au lieu d’être stockés sur un disque de parité dédié.
Nous expliquerons pourquoi RAID 5 gère la parité de cette manière plus loin dans l’article, mais en fin de compte, cela se traduit par la réservation d’un disque d’espace pour les données de parité.
Avantages:
- Tolérance aux pannes contre les pannes de disque unique
- Grande capacité de stockage utilisable
- Vitesse de lecture élevée
- Peut être configuré avec un contrôleur matériel ou mis en œuvre via un logiciel
Les inconvénients:
- Pénalité sur la performance en écriture
- Ne peut gérer qu’une seule panne de disque. Tout autre conduit à l’échec de la matrice
- Processus de reconstruction risqué
Qu’est-ce que le RAID 6 ?
RAID 6 ressemble beaucoup à RAID 5, mais il utilise deux blocs de parité distribués sur une bande au lieu d’un. Ce seul détail change tout, du niveau de tolérance aux pannes fourni par la baie aux performances et au stockage utilisable.
La double parité d’écriture rend le tableau beaucoup plus fiable, mais du même coup, les performances d’écriture souffrent également du double de la pénalité. Les performances de lecture, cependant, tout comme RAID 5, sont excellentes.
Avantages:
- Tolérance aux pannes contre deux pannes de disque
- Excellentes performances de lecture
- La reconstruction après une panne de disque est plus sûre
Les inconvénients:
- Surcoût de performances d’écriture plus élevé
- Deux disques d’espace nécessaires pour la parité
RAID 5 Vs RAID 6 – Principales différences
RAID 5 et 6 diffèrent principalement par le fait que RAID 6 utilise deux blocs de parité par bande, tandis que RAID 5 n’en utilise qu’un. Mais comme indiqué, cela entraîne également un certain nombre d’autres différences, que nous aborderons dans les sections suivantes.
Tolérance aux pannes
La première chose que le nombre de blocs de parité a un impact est le niveau de tolérance aux pannes. Dans une matrice RAID 5, un bloc de données de parité de la taille d’un bloc est écrit pour chaque bande. En cas de panne de disque, les données perdues peuvent être recalculées à l’aide des données de parité et des données des autres disques de la matrice.
Cela signifie essentiellement qu’une matrice RAID 5 peut gérer une panne de disque sans aucune perte de données. Habituellement, de toute façon. Cette tolérance aux pannes était la raison pour laquelle RAID 5 était très populaire jusque dans les années 2010. De nos jours cependant, le RAID 5 est rarement utilisé car sa fiabilité n’est plus à la hauteur. Cela est dû à la façon dont la plupart des contrôleurs RAID matériels gèrent les reconstructions.
Si le contrôleur rencontre une erreur de lecture irrécupérable (URE) lors de la reconstruction, il marquera généralement l’intégralité de la baie comme ayant échoué afin d’empêcher toute nouvelle corruption des données. À moins que vous n’ayez des sauvegardes ou que vous ne prévoyiez de récupérer des données à partir de disques individuels, les données sont perdues.
La taille des disques durs a augmenté de façon exponentielle au cours des deux dernières décennies, mais les améliorations de la vitesse de lecture/écriture ont été beaucoup plus modérées. Essentiellement, la taille des baies augmentait à des taux beaucoup plus élevés que les vitesses de transfert de données, ce qui signifiait que les temps de reconstruction commençaient à devenir très longs.
Selon la configuration, la reconstruction de la matrice après la panne d’un disque peut prendre de quelques heures à plusieurs jours. De tels temps de reconstruction signifiaient une plus grande chance de rencontrer des URE lors de la reconstruction, ce qui se traduit par une plus grande probabilité de défaillance de l’ensemble de la baie.
Ces dernières années, les taux d’apparition d’URE dans les disques durs ont considérablement diminué grâce aux améliorations technologiques. Pour cette raison, RAID 5 est toujours utilisé ici et là. Mais le consensus général de l’industrie est de toujours opter pour RAID 6 ou d’autres niveaux, et pour une bonne raison.
Dans RAID 6, les données de parité sont écrites deux fois par bande. Cela signifie qu’une matrice RAID 6 peut supporter jusqu’à deux pannes de disque sans perte de données. Cela rend RAID 6 beaucoup plus fiable et donc mieux adapté aux grandes baies contenant des données importantes.
Performances d’écriture
Une matrice RAID 5 doit lire les données, calculer la parité, écrire les données, puis la parité. De ce fait, RAID 5 subit une pénalité sur les charges de travail impliquant des écritures.
RAID 6 implique de calculer et d’écrire deux fois la parité, ce qui est excellent pour la fiabilité, mais cela signifie également qu’il subit deux fois plus de surcharge pour les opérations d’écriture.
Pour les petites tailles d’E/S (généralement 256 Ko et moins), RAID 5 et 6 ont des performances d’écriture très comparables. Mais avec des tailles d’E/S plus grandes, RAID 5 est définitivement supérieur.
Nombre de disques
RAID 5 nécessite deux disques pour la répartition et un disque d’espace pour stocker les données de parité. Cela signifie qu’une matrice RAID 5 nécessite au minimum 3 unités de disque.
RAID 6 est similaire, mais il nécessite un minimum de 4 disques car les données de parité occupent l’espace de deux disques.
Stockage utilisable
Dans une matrice RAID 5, le stockage utilisable peut être calculé avec (N – 1) x (plus petite taille de disque), où N est le nombre d’unités de disque. Par exemple, nous avons montré une matrice RAID 5 avec trois disques de 1 To ci-dessous. Un disque d’espace est utilisé pour stocker les données de parité, et comme la plus petite taille de disque est de 1 To, l’espace utilisable est de 2 To.
Il est important d’essayer d’utiliser des disques de même taille, sinon le plus petit disque créerait un goulot d’étranglement qui se traduirait par beaucoup d’espace inutilisable. L’exemple ci-dessous montre le même scénario, où le disque de 500 Go a rendu 1,5 To inutilisable.
Dans une matrice RAID 6, le stockage utilisable est calculé avec (N – 2) x (plus petite taille de disque). Encore une fois, il est important d’utiliser des disques de même taille pour s’assurer qu’il n’y a pas d’espace inutilisable dans la baie.
Calcul de parité
Dans RAID 5, une opération XOR est effectuée sur chaque octet de données pour calculer les informations de parité dans RAID 5. Par exemple, disons que le premier octet de données dans une matrice à 4 disques ressemble à ceci :
A1-11010101
A2-10001100
A3-10101100
Si nous effectuons une opération XOR sur les deux premières bandes (A1 et A2) puis faisons de même avec la sortie et la troisième bande (A3), la sortie est l’information de parité (Ap). Dans ce cas, sa valeur est 11110101.
Lorsqu’un disque (par exemple, le disque 1) tombe en panne, voici ce qui se passe. Tout d’abord, A2 XOR A3 nous donne la sortie 00100000. Lorsque nous utilisons cette sortie dans une opération XOR avec Ap, nous obtenons en conséquence 11010101, qui correspond aux données perdues.
00100000
11110101
11010101
C’est essentiellement ainsi que les données de parité sont calculées et utilisées pour recalculer les données perdues dans RAID 5.
RAID 6 est beaucoup plus complexe car il calcule la parité deux fois. Selon la configuration, cela est mis en œuvre de différentes manières, telles que le calcul des données de double contrôle (parité et Reed-Solomon), les données de contrôle de double parité orthogonale, la parité diagonale, etc.
Contrôleur RAID
RAID 5 peut être mis en œuvre par des moyens matériels et logiciels. Le premier implique évidemment l’utilisation d’un contrôleur RAID matériel dédié. Étant donné que RAID 5 nécessite un calcul de parité, il s’agit de la route recommandée.
Ceci est particulièrement important dans certains cas, comme avec un NAS , où le processeur n’est pas assez puissant pour gérer les calculs sans créer de goulot d’étranglement important.
Bien qu’il ne soit pas idéal pour des raisons de performances, le RAID 5 peut également être configuré à l’aide de solutions logicielles. Par exemple, Windows vous permet de regrouper vos disques à l’aide de la fonction d’espaces de stockage. Vous pouvez également créer un volume RAID 5 via la gestion des disques.
RAID 6, en revanche, nécessite un contrôleur RAID matériel. Cela est dû au fait que les calculs polynomiaux effectués pour calculer la deuxième couche de parité sont assez gourmands en ressources processeur.
RAID 5 et RAID6 sont-ils similaires ?
Il devrait être évident à ce stade que bien que RAID 5 et 6 présentent des différences essentielles, ils sont également similaires à bien des égards. Pour commencer, contrairement à RAID 1, RAID 5 et 6 offrent une tolérance aux pannes via la parité au lieu de la mise en miroir.
Plus précisément, ils utilisent la parité distribuée, qui est différente des disques de parité dédiés utilisés par RAID 2, 3 et 4. Avec la parité distribuée, vous n’avez pas à vous soucier des goulots d’étranglement comme avec un disque à parité unique.
RAID 5 et 6 ont d’excellentes performances de lecture grâce à la répartition des données. Mais du même coup, les deux subissent également des pénalités sur les performances d’écriture, bien qu’à des degrés divers.
Qu’est-ce qui est bien avec RAID 5 ?
RAID 5 offre un bon mélange de stockage utilisable, de protection des données et de performances. Vous pouvez également le configurer avec moins de disques, ce qui en fait une option économique.
Si vous voulez penser en termes de performances, RAID 5 est le mieux adapté aux charges de travail impliquant principalement des opérations de lecture telles que les serveurs de messagerie.
En ce qui concerne la tolérance aux pannes, nous avons déjà expliqué comment RAID 5 est devenu moins fiable au fil des ans. C’est toujours bien pour les baies de petite taille, mais avec des baies plus grandes, où il y a plus de chances d’échec des reconstructions, nous ne recommanderions pas RAID 5.
Quand le RAID 6 est-il meilleur ?
La fiabilité du RAID 6 se fait au détriment des performances d’écriture et du stockage utilisable. Cependant, cette légère disparité vaut sans doute le coup lorsque les données sur les disques sont importantes.
RAID 6 n’est pas le meilleur pour les baies plus petites (par exemple, 4 disques), car une partie importante du stockage est perdue à cause de la redondance. Si la redondance est requise dans de petites baies, RAID 5 ou quelque chose comme RAID 10 serait préférable.
Au lieu de cela, RAID 6 est le mieux adapté aux baies plus grandes où il y a une chance de perdre beaucoup plus de données si la configuration n’est pas fiable.
Verdict final – RAID 5 contre RAID 6
RAID 5 n’est pas totalement fiable et reste utilisable pour les petites baies. Mais avec des données vraiment critiques, vous voudrez donner la priorité à la protection sur les différences de performances mineures, et c’est là que RAID 6 prend le gâteau.
Quel que soit le niveau RAID pour lequel vous optez, cependant, il est important de comprendre que RAID n’est pas une sauvegarde. La redondance du RAID protège uniquement contre les pannes de disque. Même une matrice RAID 6 peut échouer lors des reconstructions.
Si les données sur les disques sont suffisamment importantes pour que vous puissiez utiliser RAID 6 ou d’autres versions « fiables », vous ne devez pas non plus effectuer de sauvegardes et de lectures de patrouille à la légère. Enfin, pour récapituler, voici les principales différences entre RAID 5 et RAID 6 :
RAID 5 | RAID 6 | |
Couches de parité | Les données de parité sont calculées une fois. | Les données de parité sont calculées deux fois. |
Tolérance aux pannes | Peut tolérer une panne de disque. | Peut tolérer deux pannes de disque. |
Performances d’écriture | Les performances d’écriture souffrent d’une certaine pénalité. | Les performances d’écriture souffrent d’une surcharge comparativement plus importante. |
Disques minimaux | Au moins 3 disques sont requis. | Au moins 4 disques sont requis. |
Stockage utilisable | Offre un plus grand stockage utilisable. | Le stockage utilisable est comparativement inférieur. |
Calcul de parité | La parité est calculée par une simple opération XOR. | La parité est calculée en utilisant XOR avec d’autres algorithmes complexes. |
Mise en œuvre | Peut être mis en œuvre à l’aide de solutions matérielles ou logicielles. | Nécessite un contrôleur RAID matériel dédié. |