Remplacement à chaud - RAID logiciel
Objectif
Si l'un des disques de votre serveur est hors d'usage, vous avez la possibilité de le remplacer à chaud si vous disposez d'un modèle Haut de gamme compatible.
Découvrez les principales étapes pour remplacer à chaud un disque sur un serveur en RAID logiciel.
Prérequis
- Bénéficier d'un serveur mHG, HG ou BHG.
- Posséder un RAID logiciel (avec une carte LSI).
- Disposer d'un accès SSH (Linux) ou RDP (Windows).
- Avoir installé l'utilitaire « sas2ircu » (utilisez le moteur de recherche Broadcom pour le trouver).
En pratique
Sous Linux
Étape 1 : identifier le disque concerné
Afin d'illustrer le propos de ce guide, nous partons du principe que nous avons reçu une alerte pour le disque /dev/sdb. Celui-ci est défectueux et nous souhaitons le remplacer à chaud. Adaptez donc les éléments de cette documentation à votre situation.
Débutez par tester et vérifier le « Serial Number » du disque concerné.
Vous constatez ainsi que :
- le disque « SDB » est effectivement hors d'usage du fait d'erreurs non corrigées (« uncorrected errors ») ;
- son « Serial Number » correspond bien à l'alerte reçue (via le datacenter ou tout autre outil de monitoring).
Pour obtenir uniquement le « Serial Number » :
Étape 2 : récupérer la position du disque
Vous devez maintenant retrouver le « Slot ID » et l'« Enclosure ID » du disque concerné. Pour cela, utilisez l'outil « sas2ircu » préalablement installé sur le serveur.
Débutez alors par vérifier que les disques sont bien connectés via une carte LSI.
Si tel est le cas, déterminez l'ID de cette carte LSI.
L'index correspond à l'ID. Ici, la carte a donc l'index/ID 0.
Avec cette information, récupérez à présent pour le disque concerné (via son « Serial Number ») : le « Slot ID » et l'« Enclosure ID ».
Cette commande permet d'obtenir les informations du disque, dont le « Serial Number » qui est ici le K4GW439B.
Dans notre exemple, nous avons donc récupéré l'« Enclosure ID » (correspondant à 1) et le « Slot ID » (correspondant à 3).
Étape 3 : allumer le disque
Muni des informations récupérées durant les étapes précédentes, allumez la LED du disque hors d'usage en vue de son remplacement avec la commande ./sas2ircu 0 locate EncID:SlotID on. Personnalisez celle-ci selon votre situation, comme dans l'exemple ci-dessous :
Vous pouvez désactiver le clignotement du disque, en remplaçant « on » par « off » dans la commande.
Étape 4 : sortir le disque défectueux du RAID
Si ce n'est pas déjà le cas, passez le disque défectueux en « »Faulty ». Puis regardez l'état du RAID.
Dans cet exemple, le disque défectueux fait partie de md1 et md2 (sdb1 et sdb2). Nous allons donc passer celui-ci en « »Faulty », respectivement sdb1 dans md1 et sdb2 dans md2.
À l'issue de ces manipulations, vérifiez de nouveau l'état du RAID.
Les sdb1 et sdb2 sont bien passés en faulty (F). Vous pouvez à présent sortir le disque du RAID.
Vérifiez enfin que le disque n'est plus présent.
Le disque défectueux est désormais prêt à être remplacé par un technicien en datacenter. Une fois l'opération effectuée, vous n'aurez plus qu'à resynchroniser le RAID. Pour cela, aidez-vous de la documentation suivante : RAID logiciel.
Sous Windows
Étape 1 : identifier le disque
Afin d'illustrer le propos de ce guide, nous partons du principe que nous avons reçu une alerte pour le disque /dev/sdb. Celui-ci est défectueux et nous souhaitons le remplacer à chaud. Adaptez donc les éléments de cette documentation à votre situation.
Il est important de lancer le terminal de commande en tant qu'administrateur, afin de ne pas obtenir d'erreur.
Débutez par tester et vérifier le « Serial Number » du disque concerné. Dans la capture ci-dessous, le stockage n'est pas réellement hors d'usage mais nous ferons comme si c'était le cas.

Vous constatez ainsi que :
- le disque « SDB » est effectivement hors d'usage du fait d'erreurs non corrigées (« uncorrected errors ») ;
- son « Serial Number » correspond bien à l'alerte reçue (via le datacenter ou tout autre outil de monitoring).
Étape 2 : récupérer la position du disque
Vous devez maintenant retrouver le « Slot ID » et l'« Enclosure ID » du disque concerné. Pour cela, utilisez l'outil « sas2ircu » préalablement installé sur le serveur.
Débutez par déterminer l'ID de cette carte LSI.

Notre carte LSI a donc l'index/ID « 0 ».
Avec cette information, récupérez à présent pour le disque concerné (via son « Serial Number ») : le « Slot ID » et l'« Enclosure ID ».

Cette commande permet d'obtenir les informations du disque, dont le « Serial Number » qui est ici le K4G187WB.
Dans notre exemple, nous avons donc récupéré l'« Enclosure ID » (correspondant à 1) et le « Slot ID » (correspondant à 1).
Étape 3 : allumer le disque
Muni des informations récupérées durant les étapes précédentes, allumez la LED du disque hors d'usage en vue de son remplacement avec la commande .\sas2ircu 0 locate EncID:SlotID on. Personnalisez celle-ci selon votre situation, comme dans l'exemple ci-dessous :

Vous pouvez désactiver le clignotement du disque, en remplaçant « on » par « off » dans la commande.
Étape 4 : sortir le disque défectueux du RAID
Réalisez cette manipulation depuis l'interface « Gestion des disques » de votre serveur Windows.
Le disque défectueux est désormais prêt à être remplacé par un technicien en datacenter. Une fois l'opération effectuée, vous n'aurez plus qu'à resynchroniser le RAID. Pour cela, aidez-vous de la documentation suivante : RAID logiciel.
Aller plus loin
Remplacement à chaud - RAID Matériel
Échangez avec notre communauté d'utilisateurs.
-
Secure Shell (SSH) : un protocole de réseau sécurisé utilisé pour établir des connexions entre un client et un serveur. Il permet d'exécuter des commandes à distance de manière sécurisée. ↩