Gestión y reconstrucción del RAID software en servidores en modo de arranque legacy (BIOS)
Información sobre la traducción
Esta traducción ha sido generada de forma automática por nuestro partner SYSTRAN. En algunos casos puede contener términos imprecisos, como en las etiquetas de los botones o los detalles técnicos. En caso de duda, le recomendamos que consulte la versión inglesa o francesa de la guía. Si quiere ayudarnos a mejorar esta traducción, por favor, utilice el botón «Contribuir» de esta página.
Objetivo
El RAID (Redundant Array of Independent Disks) es un conjunto de técnicas diseñadas para mitigar la pérdida de datos en un servidor replicándolos en varios discos.
El nivel de RAID predeterminado para las instalaciones de servidores de OVHcloud es RAID 1, lo que duplica el espacio ocupado por sus datos, reduciendo así a la mitad el espacio de disco utilizable.
Esta guía explica cómo gestionar y reconstruir un RAID software en caso de reemplazar un disco en su servidor en modo de arranque legacy (BIOS).
Antes de comenzar, tenga en cuenta que esta guía se centra en los servidores dedicados que utilizan el modo de arranque legacy (BIOS). Si su servidor utiliza el modo UEFI (tarjetas madre más recientes), consulte esta guía Gestión y reconstrucción del RAID software en servidores en modo de arranque UEFI.
Para verificar si un servidor se ejecuta en modo BIOS o en modo UEFI, ejecute el siguiente comando:
Requisitos
- Tener un servidor dedicado con una configuración de RAID software.
- Tener acceso a su servidor mediante SSH como administrador (sudo).
- Conocimiento del RAID y las particiones.
Procedimiento
Presentación del contenido
Información básica
En una sesión de línea de comandos, escriba el siguiente código para determinar el estado actual del RAID.
Este comando nos indica que dos dispositivos de RAID software están actualmente configurados, md4 siendo el más grande. El dispositivo de RAID md4 está compuesto por dos particiones, llamadas nvme0n1p4 y nvme1n1p4.
El [UU] significa que todos los discos funcionan normalmente. Un _ indica un disco defectuoso.
Si posee un servidor con discos SATA, obtendrá los siguientes resultados:
Aunque este comando devuelve nuestros volúmenes de RAID, no nos indica el tamaño de las particiones mismas. Podemos encontrar esta información con el siguiente comando:
El comando fdisk -l también le permite identificar el tipo de partición. Esta es una información importante para reconstruir su RAID en caso de fallo de un disco.
Para las particiones GPT, la línea 6 mostrará: Disklabel type: gpt. Esta información solo es visible cuando el servidor está en modo normal.
Siempre basándonos en los resultados de fdisk -l, podemos ver que /dev/md2 se compone de 888.8GB y /dev/md4 contiene 973.5GB.
Alternativamente, el comando lsblk ofrece una vista diferente de las particiones:
Tenga en cuenta los dispositivos, las particiones y sus puntos de montaje, ya que esto es importante, especialmente tras la sustitución de un disco. Esto le permitirá verificar que las particiones están correctamente montadas en sus puntos de montaje respectivos en el nuevo disco.
En nuestro ejemplo, tenemos:
- Particiones que forman parte de md2 (
/): sda2 y sdb2. - Particiones que forman parte de md4 (
/home): sda4 y sdb4. - Particiones de intercambio (swap): sda3 y sdb3.
- Particiones de arranque BIOS: sda1 y sdb1.
La partición sda5 es un config drive, es decir, un volumen de solo lectura que proporciona al servidor sus datos de configuración iniciales. Solo se lee una vez durante el arranque inicial y puede eliminarse después.
Simular una falla de disco
Ahora que disponemos de toda la información necesaria, podemos simular una falla de disco. En este ejemplo, haremos que el disco sda falle.
El medio preferido para lograrlo es el entorno en modo rescue de OVHcloud.
Reinicie primero el servidor en modo rescue y conéctese con las credenciales proporcionadas.
Para retirar un disco del RAID, el primer paso es marcarlo como Failed y retirar las particiones de sus matrices RAID respectivas.
A partir de la salida anterior, sda se compone de dos particiones en RAID que son sda2 y sda4.
Retirar el disco defectuoso
Comenzamos marcando las particiones sda2 y sda4 como Failed.
Hemos simulado ahora una falla del RAID, cuando ejecutamos el comando cat /proc/mdstat, obtenemos el siguiente resultado:
Como podemos ver arriba, el [F] junto a las particiones indica que el disco está fallando o defectuoso.
A continuación, retiramos estas particiones de las matrices RAID.
Para asegurarnos de obtener un disco que sea similar a un disco vacío, utilizamos el siguiente comando. Reemplace sda por sus propios valores:
El disco aparecerá ahora como un disco nuevo y vacío:
Si ejecutamos el siguiente comando, vemos que nuestro disco ha sido correctamente "limpiado":
El estado de nuestro RAID debería ser ahora similar al siguiente:
Los resultados anteriores muestran que ahora solo aparecen dos particiones en las matrices RAID. Hemos conseguido que el disco sda falle y ahora podemos proceder a su sustitución.
Para obtener más información sobre cómo preparar y solicitar la sustitución de un disco, consulte esta guía.
El siguiente comando proporciona más detalles sobre la matriz o matrices RAID:
Reconstruir el RAID
Este proceso puede variar en función del sistema operativo instalado en su servidor. Le recomendamos que consulte la documentación oficial de su sistema operativo para obtener los comandos adecuados.
En la mayoría de los servidores con RAID por software, tras sustituir un disco, el servidor puede arrancar en modo normal (en el disco sano) para reconstruir el RAID. Sin embargo, si el servidor no puede arrancar en modo normal, se reiniciará en modo de rescate para proceder a la reconstrucción del RAID.
Reconstrucción del RAID en modo normal
En nuestro ejemplo, hemos sustituido el disco sda.
Una vez sustituido el disco, debemos copiar la tabla de particiones del disco sano (en este ejemplo, sdb) al nuevo (sda).
El comando debe tener el siguiente formato: sgdisk -R /dev/nuevo_disco /dev/disco_sano.
El comando debe tener el siguiente formato: sfdisk -d /dev/disco_sano | sfdisk /dev/nuevo_disco.
Una vez realizada esta operación, el siguiente paso consiste en asignar un GUID aleatorio al nuevo disco para evitar cualquier conflicto con los GUID de otros discos:
Si aparece el siguiente mensaje:
Simplemente ejecute el comando partprobe. Si sigue sin ver las particiones recién creadas (por ejemplo, con lsblk), debe reiniciar el servidor antes de continuar.
A continuación, añadimos las particiones al RAID:
Use el siguiente comando para supervisar la reconstrucción del RAID:
Finalmente, añadimos una etiqueta y montamos la partición [SWAP] (si aplica).
Para añadir una etiqueta a la partición SWAP:
A continuación, obtenga los UUID de ambas particiones de intercambio:
Reemplazamos el antiguo UUID de la partición de intercambio (sda4) por el nuevo en /etc/fstab.
Ejemplo:
Según los resultados anteriores, el UUID antiguo es b7b5dd38-9b51-4282-8f2d-26c65e8d58ec y debe sustituirse por el nuevo b3c9e03a-52f5-4683-81b6-cc10091fcd15.
Asegúrese de sustituir el UUID correcto.
A continuación, comprobamos que todo está correctamente montado con el siguiente comando:
Ejecute el siguiente comando para activar la partición de intercambio:
A continuación, recargue el sistema con el siguiente comando:
La reconstrucción del RAID ahora está terminada.
Reconstrucción del RAID en modo rescue
Si el servidor no consigue reiniciarse en modo normal tras una sustitución de disco, nuestro equipo lo reiniciará en modo de rescate en el datacenter.
En este ejemplo, hemos sustituido el disco sdb.
Una vez reemplazado el disco, debemos copiar la tabla de particiones del disco en buen estado (en este ejemplo, sda) al nuevo (sdb).
El comando debe tener el siguiente formato: sgdisk -R /dev/nuevo_disco /dev/disco_sano
Ejemplo:
El comando debe tener el siguiente formato: sfdisk -d /dev/disco_sano | sfdisk /dev/nuevo_disco
Ejemplo:
Una vez realizada esta operación, el siguiente paso consiste en asignar un GUID aleatorio al nuevo disco para evitar conflictos con los GUID de otros discos:
Si aparece el siguiente mensaje:
Puede simplemente ejecutar el comando partprobe.
Ahora podemos reconstruir la matriz RAID añadiendo de nuevo las nuevas particiones (sdb2 y sdb4):
Use el comando cat /proc/mdstat para supervisar la reconstrucción del RAID:
Por último, añadimos una etiqueta y montamos la partición [SWAP] (si procede).
Una vez finalizada la reconstrucción del RAID, montamos la partición que contiene la raíz de nuestro sistema operativo en /mnt. En nuestro ejemplo, esta partición es md2.
Añadimos la etiqueta a nuestra partición de intercambio con el siguiente comando:
A continuación, montamos los siguientes directorios para asegurarnos de que cualquier manipulación que realicemos en el entorno chroot funcione correctamente:
A continuación, accedemos al entorno chroot:
Recuperamos los UUID de ambas particiones de intercambio:
Ejemplo:
A continuación, reemplazamos el antiguo UUID de la partición de intercambio (sdb4) por el nuevo en /etc/fstab:
Ejemplo:
En nuestro ejemplo anterior, el UUID a reemplazar es d6af33cf-fc15-4060-a43c-cb3b5537f58a por el nuevo b3c9e03a-52f5-4683-81b6-cc10091fcd15.
Asegúrese de reemplazar el UUID correcto.
A continuación, nos aseguramos de que todo esté correctamente montado:
Active la partición de intercambio con el siguiente comando:
Salimos del entorno chroot con exit y volvemos a cargar el sistema:
Desmontamos todos los discos:
Hemos terminado con éxito la reconstrucción del RAID en el servidor y ahora podemos reiniciar el servidor en modo normal.
Más información
Reemplazo a caliente - RAID software
Reemplazo a caliente - RAID hardware
Para servicios especializados (posicionamiento, desarrollo, etc.), contacte con los socios OVHcloud.
Si desea beneficiarse de una asistencia en el uso y configuración de sus soluciones OVHcloud, le invitamos a consultar nuestras distintas ofertas de soporte.
Si necesita una formación o asistencia técnica para la implementación de nuestras soluciones, contacte con su comercial o haga clic en este enlace para obtener un presupuesto y solicitar un análisis personalizado de su proyecto a nuestros expertos del equipo Professional Services.
Interactúe con nuestra comunidad de usuarios.