Teamlog - RAID

Cet article a décrit le stockage RAID. Il a été écrit par un consultant Teamlog, Nicolas Stampf 28/10/2003.

Article lu   fois.

L'auteur

Site personnel

Liens sociaux

Viadeo Twitter Facebook Share on Google+   

Introduction

RAID est l'acronyme anglais de Redundant Array of Inexpensive Disks. Il s'agit d'un ensemble de standards destinés à regrouper des disques peu chers pour en faire une capacité de stockage plus importante et plus performante à un prix moindre comparé à de gros disques performants.

Au fil des ans, l'acronyme a vu se remplacer le I de Inexpensive par le I de Independant. L'objectif est actuellement d'essentiellement assurer la redondance des informations, donc fournir des fonctionnalités de sécurité permettant d'assurer l'Intégrité et la Disponibilité des données.

Il existe aujourd'hui plusieurs standards de « niveaux de RAID » ainsi que quelques autres solutions hybrides. L'une d'entre elles est propriétaire (RAID 7), les autres sont des combinaisons dont il convient de vérifier l'implémentation précise pour s'assurer du niveau exact de sécurité et de performance apporté.

RAID 0

GRAPPE DE DISQUES AVEC STRIPING

RAID 1

MIROIR DE DISQUE

RAID 2

GRAPPE DE DISQUES EN PARALLÈLE AVEC DONNÉES DE CONTRÔLE SEPAREÉES

RAID 3

GRAPPE DE DISQUES EN PARALLÈLE AVEC DISQUE DE PARITÉ

RAID 4

STRIPING AVEC PARITÉ

RAID 5

STRIPING ET PARITÉ ALTERNÉE

RAID 6

GRAPPE DE DISQUES INDÉPENDANTS AVEC DEUX SCHÉMAS DE PARITÉ

RAID 7

PROPRIÉTAIRE

RAID 10

HAUTE DISPONIBILITÉ ET HAUTE PERFORMANCE

RAID 50

HAUTE PERFORMANCE

RAID 53

HAUTE PERFORMANCE

RAID 0+1

 

RAID 0 : grappe de disques avec striping

Il s'agit d'une solution permettant d'améliorer grandement les performances en lecture/écriture. Les données sont stockées en parallèle, sous forme de blocs (en anglais : bandes - strips). Par contre, cette solution n'offre aucune mesure de sécurité.

Les données sont réparties sur tous les disques de la grappe et accédées en parallèle.

Le RAID 0 peut s'effectuer à partir de deux disques.

Image non disponible

Avantages

* Rapidité.
* Facilité d'implémentation.

Inconvénients

* Aucune sécurité en Disponibilité et en Intégrité.
* Les risques de perte de données sont multipliés par le nombre de disques en place : si l'un d'eux est en faute, toutes les données sont perdues.

RAID 1 : miroir de disque

Dans ce mode de fonctionnement, deux disques dupliquent les mêmes informations. L'accès est plus rapide en lecture (il est possible de lire des informations depuis les deux disques en même temps), par contre, l'écriture n'est pas améliorée.

Image non disponible

Avantages

* Accélération de la lecture.
* Disponibilité des données en cas de faille d'un disque.

Inconvénients

* Nécessite un 2e disque, pour dupliquer les données, donc pas très efficace.

RAID 2 : grappe de disques en parallèle avec données de contrôle séparées

Des disques en parallèle stockent les informations de manière répartie. D'autres disques stockent les informations de contrôle (ECC - Eight bits error checking and correcting). En cas d'erreur d'un disque, la correction de l'information s'effectue à la volée.

Image non disponible

Avantages

* Excellent débit.
* Correction des erreurs à la volée.

Inconvénients

* Coût de revient élevé.

RAID 3 : grappe de disques en parallèle avec disque de parité

Les données sont réparties sur plusieurs disques avec un découpage des octets, mais les données de contrôle sont stockées sur un seul disque supplémentaire.

Le RAID 3 nécessite trois disques au minimum pour être mis en place.

Image non disponible

Avantages

* Bon débit en lecture et en écriture.

Inconvénients

* Les accès en parallèle diminuent les performances.

RAID 4 : striping avec parité

Les données sont stockées en parallèle sous forme de blocs. Le fonctionnement est similaire au RAID3, mais avec des blocs de données plutôt qu'une fragmentation des octets.

Image non disponible

Avantages

* Haut débit en lecture.
* Bon ratio données/parité en nombre de disques.

Inconvénients

* Pas d'écritures simultanées (le disque de parité est le goulet d'étranglement).
* Lecture d'un bloc de données réduit à la vitesse d'un seul disque.

RAID 5 : striping et parité alternée

Les données stockées en blocs et les informations de parité sont stockées sur les disques, en parallèle. Pas de disque dédié à la parité. Les informations de parité ne figurent jamais sur le même disque que les informations dont elles sont issues.

Image non disponible

Avantages

* Débit de lecture le plus élevé.
* Débit en écriture moyen.

Inconvénients

* Lecture de blocs individuels de même rapidité qu'un disque seul.
* Reconstitution des données mal aisée en cas de faute d'un disque.

RAID 6 : grappe de disques indépendants avec deux schémas de parité

Les blocs de données sont répartis sur plusieurs disques en parallèle. Deux schémas de calcul de la parité sont répartis différemment sur les disques.

Nécessite N+2 disques pour fonctionner à cause du double schéma de parité.

Meilleur niveau de tolérance aux pannes que le RAID 5.

Image non disponible

Avantages

* Bon débit en lecture.
* Supporte des fautes sur plusieurs disques simultanément.

Inconvénients

* Très mauvais débit en écriture.

RAID 7 : propriétaire

Solution propriétaire « Storage Computer Corporation ». Les données sont réparties sur plusieurs disques et un disque est dédié à la parité. Un système de cache est en place pour les opérations de lecture et d'écriture. Il calcule la parité et l'écrit lui-même sur le disque dédié. Un système d'exploitation temps réel est intégré au contrôleur pour gérer les accès.

Avantages

* Très efficace par rapport aux autres solutions RAID (notamment pour la lecture grâce au cache).
* Possibilité d'accroître les performances d'écriture en rajoutant des disques.

Inconvénients

* Prix.
* Solution propriétaire.
* Besoin d'une alimentation secourue à cause du cache.

RAID 10 : haute disponibilité et haute performance

Le RAID 10, qui se met en place à partir de quatre disques, est la superposition de deux technologies : le RAID 1 et le RAID 0. Les données sont découpées en blocs (RAID 0) écrits sur des disques distincts qui sont eux-mêmes dupliqués sur des disques miroirs (RAID 1).

Avantages

* Haute disponibilité (grâce aux miroirs).
* Bonne performance (grâce aux découpages en bandes).

Inconvénients

* Cher, car il faut commencer avec quatre disques.

RAID 50 : haute performance

Cette technologie utilise le RAID 0 et le RAID 5. Les données sont d'abord découpées en blocs pour être réparties sur le RAID 0, puis ces blocs sont eux-mêmes découpés en sous-blocs déposés sur les disques finals, avec les données de parité également sur les disques.

Avantages

* La performance.

Inconvénients

* Le coût.

RAID 53 : haute performance

Le RAID 53 est en fait une combinaison de RAID 0 (découpage des données en blocs sur différents disques) et de RAID 3 (parité sur un disque dédié). Ce niveau de RAID devrait s'appeler RAID 30.

Le fonctionnement est identique au RAID 50, mais les données de parité ne figurent que sur un seul disque.

Avantages

* Performances.

Inconvénients

* Le coût : il faut cinq disques au minimum pour fonctionner.

RAID 0+1

Dans ce mode de fonctionnement, on dispose d'un ensemble miroir RAID 1 dans lequel les sous-ensembles sont des disques de données strippées en RAID 0.

Image non disponible

Avantages

* Même tolérance aux pannes que le RAID 5.
* La perte d'un disque ne laisse que le fonctionnement du découpage par blocs : le RAID 0.

Inconvénients

* Le coût, car il nécessite quatre disques au minimum.

Conclusion

Cet article a décrit le stockage RAID. Il a été écrit par un consultant Teamlog, l'original est consultable sur le site Teamlog
Nicolas Stampf 28/10/2003

À consulter également, sur Developpez.com : le Raid 1 logiciel sous Linux, ou le mirroring pas à pas, par nyal.

Vous avez aimé ce tutoriel ? Alors partagez-le en cliquant sur les boutons suivants : Viadeo Twitter Facebook Share on Google+   

Copyright © Teamlog 2002/2003 - Tous droits réservés