Remplacer un disque défectueux
Objectif
Si vous constatez un défaut de disque ou que notre système vous a envoyé une notification par e-mail pour vous avertir de la défaillance d’un disque, vous devez prendre les mesures nécessaires pour le remplacer dès que possible.
Ce guide vous explique comment identifier qu'un disque est défectueux et comment faire la demande de remplacement auprès de nos équipes.
OVHcloud fournit des services dont la configuration et la gestion relèvent de votre responsabilité. Il est donc de votre responsabilité de vous assurer de leur bon fonctionnement.
Ce guide est conçu pour vous aider avec les tâches courantes. Néanmoins, nous vous recommandons de contacter un prestataire de services spécialisé ou de contacter la communauté OVHcloud si vous rencontrez des difficultés. Plus d'informations dans la section Aller plus loin de ce guide.
Prérequis
- Posséder un serveur dédié.
- Avoir un accès administrateur (sudo) à votre serveur via SSH.
En pratique
Sauvegarder vos données
Avant de faire quoi que ce soit, il est nécessaire d'effectuer une sauvegarde de vos données. Le seul but d’un RAID, à l'exception du RAID 0 est de protéger vos données contre les défaillances des disques. Une fois qu’un disque est inutilisable, toutes vos données dépendent de la santé du ou des disques restants.
S'il est rare que deux disques soient défaillants en même temps, ce cas n’est pas impossible. Aucun changement de disque ne sera effectué sans :
- une confirmation de votre part de la sauvegarde de vos données ;
- une confirmation que vous acceptez en connaissance de cause leur perte potentielle dûe au remplacement du disque.
Détecter qu'un disque est défectueux
À la moindre alerte e-mail ou vérification de votre part vous signalant une défaillance, il est indispensable de vérifier la santé de tous vos disques. Et si deux disques faisant partie d'un même ensemble RAID présentent des défaillances, nous remplacerons en priorité celui comportant le plus d'erreurs.
Serveur disposant d'un RAID logiciel
Si vous possédez un serveur disposant d'un RAID logiciel, référez-vous au guide « RAID Logiciel » afin de trouver les disques installés sur votre serveur.
Une fois que vous avez trouvé le chemin d'accès à vos disques, vous pouvez les tester en utilisant la commande smartctl de cette manière :
N'oubliez pas de remplacer /dev/sdX par le chemin d'accès à votre disque, le sdX étant le disque concerné, sdA, sdB, etc.
Cela vous permettra également de récupérer le numéro de série (Serial Number) du ou des disques à remplacer afin de les communiquer au technicien.
Voici un exemple du résultat retourné :
La ligne importante dans notre cas sera donc la suivante :
Serial Number: 5329T58N
Serveur disposant d'un RAID matériel
Si vous possédez un serveur disposant d'un RAID matériel, référez-vous au guide « RAID Matériel » et utilisez la procédure concernant votre type de contrôleur RAID pour trouver les chemins d'accès à vos disques.
Une fois que vous avez trouvé le chemin d'accès à vos disques, vous pouvez les tester en utilisant la commande smartctl de cette manière :
N'oubliez pas de remplacer /dev/sdX par le chemin d'accès à votre disque, le sdX étant le disque concerné, sdA, sdB, etc.
Dans certains cas, vous pouvez obtenir le message suivant : /dev/sda [megaraid_disk_00][SAT]: Device open changed type from 'megaraid' to 'sat'.
Il vous faudra alors remplacer megaraid par sat+megaraid comme suit : smartctl -d sat+megaraid,N -a /dev/sdX.
Pour une carte Raid LSI, vous pouvez tester les disques en utilisant la commande smartctl de cette manière :
Le numéro du RAID est à préciser (/dev/sg0 = 1er RAID, /dev/sg1 = 2e RAID, etc.)
Serveur avec un disque NVMe
Dans le cas d'un disque NVMe, il sera nécessaire de placer le serveur en mode rescue et installer l'outil nvme-cli.
Il faudra alors utiliser la commande nvme list afin de récupérer les numéros de série de vos disques :
Demander le remplacement du disque
Remplacer le disque à froid (coupure du serveur requise)
Pour demander le remplacement d'un disque, il vous suffit de créer un ticket auprès de notre support depuis votre Centre d'aide OVHcloud. Afin d'accélérer le processus, il convient de fournir les éléments liés aux tests. Voici un récapitulatif de ce qu'il faut :
- le numéro de série du disque à remplacer ainsi que de tous les autres disques sains. Pour récupérer le numéro de série du disque à remplacer, consultez ce guide. Si, pour une raison ou une autre, il n'est pas possible d'extraire le numéro de série du disque, veuillez le notifier dans le ticket, et nous communiquer le numéro de série du ou des disques à ne pas remplacer.
Comme précisé précédemment, les numéros de tous les disques sont importants. Ils seront transmis au technicien en datacenter et éviteront une erreur lors de l'opération ;
-
la date et l'heure de début de l'intervention. Vous devez prévoir une courte interruption de service, mais vous pouvez planifier l'intervention 24 h/24 - 7 j/7 ;
-
La confirmation que vos données sont sauvegardées ou que vous acceptez la perte potentielle de ces informations.
Remplacer le disque à chaud (sans coupure du serveur)
Ce type de remplacement n'est possible que pour les serveurs dédiés avec une carte RAID.
Dans le cas d'un remplacement à chaud sur un serveur avec une carte MegaRAID, il vous est demandé de faire clignoter la LED du disque à remplacer une fois l'intervention programmée pour faciliter le travail de nos équipes.
Si votre serveur dispose d'une carte MegaRAID, voici les commandes à utiliser :
- pour démarrer le clignotement de la LED ;
- pour arrêter le clignotement de la LED ;
Équivalent via la commande storcli :
- pour démarrer le clignotement de la LED :
sh
storcli /c0/e0/s0 start locate
- pour arrêter le clignotement de la LED :
sh
storcli /c0/e0/s0 stop locate
Malgré le clignotement de la LED n'oubliez pas de bien préciser dans le ticket d'assistance le numéro de série et le slot du disque.
Une fois le remplacement effectué
Si vous possédez un serveur en RAID matériel, le RAID va se reconstruire par lui-même. Attention, l'auto-rebuild, activé par défaut, ne doit pas avoir été désactivé par vos soins. Notez que le processus de resynchronisation peut prendre quelque minutes et diminuer les performances de lecture/écriture de votre RAID.
Si vous possédez un serveur en RAID logiciel, il convient de lancer manuellement la resynchronisation de vos disques. Pour cela, n'hésitez pas à vous reporter à la documentation liée au « RAID logiciel ».
Aller plus loin
Pour des prestations spécialisées (référencement, développement, etc), contactez les partenaires OVHcloud.
Si vous souhaitez bénéficier d'une assistance à l'usage et à la configuration de vos solutions OVHcloud, nous vous proposons de consulter nos différentes offres de support.
Échangez avec notre communauté d'utilisateurs.