Gestão e reconstrução de um RAID software nos servidores que utilizam o modo de arranque UEFI
Informações sobre a tradução
Esta tradução foi automaticamente gerada pelo nosso parceiro SYSTRAN. Em certos casos, poderão ocorrer formulações imprecisas, como por exemplo nomes de botões ou detalhes técnicos. Recomendamos que consulte a versão inglesa ou francesa do manual, caso tenha alguma dúvida. Se nos quiser ajudar a melhorar esta tradução, clique em "Contribuir" nesta página.
Objetivo
Um Redundant Array of Independent Disks (RAID) é uma tecnologia que atenua a perda de dados num servidor ao replicar os dados em dois discos ou mais.
O nível RAID predefinido para as instalações de servidores OVHcloud é o RAID 1, que duplica o espaço ocupado pelos seus dados, reduzindo assim o espaço de disco utilizável para metade.
Este guia explica como gerir e reconstruir um RAID software após a substituição de um disco no seu servidor em modo UEFI.
Antes de começar, note que este guia está focado em servidores dedicados que utilizam o modo UEFI como modo de arranque. Este é o caso das placas-mãe modernas. Se o seu servidor utiliza o modo de arranque legacy (BIOS), consulte este guia: Gestão e reconstrução de um RAID software em servidores no modo de arranque legacy (BIOS).
Para verificar se um servidor está a funcionar no modo BIOS legacy ou no modo UEFI, execute o seguinte comando:
Para mais informações sobre a UEFI, consulte o seguinte artigo: https://uefi.org/about.
Requisitos
- Um servidor dedicado com uma configuração RAID software
- Acesso administrativo (sudo) ao servidor através de SSH
- Compreensão do RAID, partições e GRUB
Ao longo deste guia, utilizamos os termos disco principal e disco secundário. Neste contexto:
- O disco principal é o disco cuja partição ESP (EFI System Partition) está montada pelo Linux.
- O(s) disco(s) secundário(s) são todos os outros discos do RAID.
Instruções
Quando compra um novo servidor, pode sentir a necessidade de realizar uma série de testes e ações. Um tal teste pode ser simular uma falha de disco para compreender o processo de reconstrução do RAID.
Visão geral do conteúdo
- Informações básicas
- Compreensão da partição do sistema EFI (ESP)
- Simulação de falha de disco
- Reconstrução do RAID (com ESP não espelhadas)
- Reconstrução do RAID (com ESP em espelho)
- Adição da etiqueta à partição SWAP (se aplicável)
Informações básicas
Numa sessão de linha de comandos, introduza o seguinte comando para determinar o estado atual do RAID:
De acordo com os resultados, temos atualmente dois dispositivos RAID software configurados, md2 e md3, com md3 sendo o maior dos dois. md3 é composto por duas partições, chamadas nvme0n1p3 e nvme1n1p3.
O [UU] significa que todos os discos estão a funcionar normalmente. Um _ indicaria um disco defeituoso.
Em outros casos, obteria os seguintes resultados:
De acordo com os resultados, temos atualmente três dispositivos RAID software configurados, md1, md2 e md3, com md3 sendo o maior dos dois. md3 é composto por duas partições, chamadas nvme0n1p3 e nvme1n1p3.
Se tiver um servidor com discos SATA, obterá os seguintes resultados:
Este comando mostra-nos os volumes RAID, mas não o tamanho das partições. Podemos encontrar esta informação com fdisk -l:
fdisk -l
Este comando também permite identificar o tipo de partição.
Para partições GPT, a linha 6 exibe: Disklabel type: gpt.
Esta informação só é visível quando o servidor está no modo normal.
Ainda com base nos resultados, podemos ver que /dev/md2 é composto por 1022 MiB e /dev/md3 contém 474,81 GiB. Se executarmos o comando mount, também podemos encontrar a disposição dos discos.
Como alternativa, o comando lsblk oferece uma visão diferente das partições:
Além disso, se executarmos lsblk -f, obtemos mais informações sobre estas partições, tais como o LABEL e o UUID:
Note os dispositivos, as partições e os pontos de montagem, pois isso é importante, especialmente após a substituição de um disco. Isso permitirá verificar que as partições estão corretamente montadas nos seus respetivos pontos de montagem no novo disco.
No nosso exemplo, temos:
- Duas matrizes RAID:
/dev/md2e/dev/md3. - Partições pertencentes ao RAID: nvme0n1p2, nvme0n1p3, nvme1n1p2 e nvme0n1p3 com os pontos de montagem
/boote/. - Partições que não pertencem ao RAID: nvem0n1p1, nvme0n1p4 e nvme1n1p4 com os pontos de montagem
/boot/efie [SWAP]. - Uma partição não tem ponto de montagem: nvme1n1p1.
A partição nvme0n1p5 é uma partição de configuração, ou seja, um volume somente leitura ligado ao servidor que lhe fornece os dados de configuração inicial.
Compreender a partição do sistema EFI (ESP)
Desdobrar esta secção
O que é uma partição do sistema EFI?
Uma partição do sistema EFI é uma partição que pode conter os carregadores de arranque, os gestores de arranque ou as imagens do kernel de um sistema operativo instalado. Também pode conter programas utilitários do sistema destinados a serem executados antes do arranque do sistema operativo, bem como ficheiros de dados tais como registos de erros.
A partição do sistema EFI está incluída no RAID ?
A partir de dezembro de 2025, apenas as seguintes versões do sistema operativo espelham a partição do sistema EFI no RAID para novas instalações ou reinstalações:
- Debian 13
- Proxmox 9
- Ubuntu 25.10
- AlmaLinux e Rocky Linux 10
- Fedora 43
Para versões anteriores destes sistemas operativos, a partição EFI não é espelhada no RAID; são criadas várias ESP, uma por disco. No entanto, apenas uma ESP é montada de cada vez, e todas as ESP contêm os mesmos ficheiros. A partição do sistema EFI é montada em /boot/efi, e o disco em que está montada é selecionado pelo Linux no arranque.
Pode utilizar o comando lsblk para verificar se a sua partição faz parte de uma configuração RAID.
De acordo com os resultados acima, podemos ver que apenas uma partição do sistema EFI está montada em /boot/efi. As ESP, portanto, não estão espelhadas (repliadas).
De acordo com os resultados acima, podemos ver que as duas partições do sistema EFI estão montadas em /boot/efi. Estão, portanto, espelhadas no RAID.
O conteúdo da partição do sistema EFI muda regularmente?
Em geral, o conteúdo desta partição não muda muito, o seu conteúdo só deve mudar durante as atualizações do carregador de arranque (bootloader) (por exemplo, GRUB).
No entanto, se a sua partição EFI não estiver espelhada, recomendamos que execute um script automático ou manual para sincronizar todas as ESP, de modo que contenham todos os mesmos ficheiros atualizados. Assim, se o disco em que esta partição está montada falhar, o servidor poderá reiniciar a partir da ESP de um dos outros discos.
O que acontece se o disco principal (com a partição do sistema EFI montada) falhar?
Se a sua ESP não estiver espelhada, pode encontrar as seguintes dificuldades:
Note que, embora abaixo examinemos os casos mais comuns, existem várias outras razões pelas quais um servidor pode não conseguir arrancar em modo normal após a substituição de um disco.
Estudo de caso 1 - Nenhuma modificação ou atualização maior (por exemplo, GRUB) foi feita no sistema operativo.
- O servidor é capaz de arrancar em modo normal e pode proceder à reconstrução do RAID.
- O servidor não consegue arrancar em modo normal. Utilize o ambiente do modo rescue para reconstruir o RAID e recriar a partição EFI no novo disco.
Estudo de caso 2 - Foram feitas atualizações maiores do sistema (por exemplo, GRUB) e as ESP estão sincronizadas.
- O servidor é capaz de arrancar em modo normal porque todas as ESP contêm informações atualizadas e a reconstrução do RAID pode ser feita em modo normal.
- O servidor não consegue arrancar em modo normal. Utilize o ambiente do modo rescue para reconstruir o RAID e recriar a partição EFI no novo disco.
Estudo de caso 3 - Foram feitas atualizações maiores do sistema (por exemplo, GRUB) no sistema operativo e as partições ESP não foram sincronizadas.
- O servidor não consegue arrancar em modo normal, utilize o ambiente do modo rescue para reconstruir o RAID, recriar a partição do sistema EFI no novo disco e reinstalar o bootloader (por exemplo, GRUB).
- O servidor é capaz de arrancar em modo normal (isso pode acontecer no caso de um sistema operativo ser atualizado mas a versão de GRUB permanecer inalterada), o que permite proceder à reconstrução do RAID.
Em alguns casos, o arranque a partir de uma ESP obsoleta pode falhar; por exemplo, uma atualização maior de GRUB pode tornar o binário GRUB na ESP incompatível com os novos módulos GRUB na partição /boot.
Como posso sincronizar as minhas partições do sistema EFI e com que frequência devo sincronizá-las?
Se a sua partição do sistema EFI não estiver espelhada, tenha em conta os seguintes pontos:
Note que o processo pode variar consoante o seu sistema operativo. Por exemplo, o Ubuntu pode sincronizar várias partições do sistema EFI a cada atualização de GRUB, mas é o único sistema operativo que o faz. Recomendamos que consulte a documentação oficial do seu sistema operativo para compreender como gerir as ESP.
Neste guia, o sistema operativo utilizado é o Debian.
Recomendamos que sincronize as suas ESP regularmente ou após cada atualização maior do sistema. Por defeito, todas as partições do sistema EFI contêm os mesmos ficheiros após a instalação. No entanto, se uma atualização maior do sistema estiver envolvida, a sincronização das ESP é essencial para manter o conteúdo atualizado.
A execução de um script é um meio eficaz de sincronizar regularmente as suas partições. Abaixo encontrará um script que pode utilizar para sincronizar manualmente as suas ESP. Também pode configurar um script automático para as sincronizar diariamente ou a cada arranque do sistema.
Antes de executar o script, certifique-se de que rsync está instalado no seu sistema:
Debian/Ubuntu
CentOS, Red Hat e Fedora
Para executar um script em Linux, precisa de um ficheiro executável:
- Comece por criar um ficheiro .sh no diretório da sua escolha, substituindo
script_namepelo nome da sua escolha.
- Abra o ficheiro com um editor de texto e adicione as seguintes linhas:
Guarde e feche o ficheiro.
- Torne o script executável
- Execute o script
- Se não estiver no diretório
Quando o script é executado, o conteúdo da partição EFI montada será sincronizado com as outras. Para aceder ao conteúdo, pode montar uma destas partições EFI não montadas no ponto de montagem: /var/lib/grub/esp.
Simulação de uma falha de disco
AAgora que dispomos das informações necessárias, podemos simular uma falha de disco. Neste exemplo, vamos provocar a falha do disco principal nvme0n1 (note que é o disco em que está montada a ESP).
O método preferido para o fazer é através do modo rescue da OVHcloud.
Reinicie o servidor em modo rescue e ligue-se com as credenciais fornecidas.
Para remover um disco do RAID, o primeiro passo é marcá-lo como Failed e remover as partições dos respetivos arrays RAID.
Nota: trata-se apenas de uma ilustração; adapte os comandos à sua própria configuração.
A partir do resultado acima, nvme0n1 tem duas partições em RAID que são nvme0n1p2 e nvme0n1p3.
Remoção do disco defeituoso
Primeiro, marcamos as partições nvme0n1p2 e nvme0n1p3 como defeituosas (Failed).
Em seguida, executamos o comando cat /proc/mdstat:
Como podemos ver acima, o [F] ao lado das partições indica que o disco está defeituoso ou em falha.
Em seguida, removemos estas partições dos arrays RAID para eliminar completamente o disco do RAID.
O estado do RAID deverá agora parecer-se com isto:
Agora, apenas duas partições aparecem atualmente nos arrays RAID. Conseguimos provocar com sucesso a falha do disco nvme0n1.
ara obter um disco semelhante a um disco vazio, execute o seguinte comando em cada partição, depois no disco:
O disco aparece agora como um disco novo e vazio:
Execute o seguinte comando para verificar que o disco foi realmente "apagado":
Para mais informações sobre a preparação e a solicitação de substituição de um disco, consulte este guia.
Além disso, se executar o seguinte comando, obterá mais detalhes sobre os arrays RAID:
Podemos agora proceder à substituição do disco e à reconstrução do RAID.
Reconstrução do RAID (com ESP não espelhadas)
Este processo pode variar consoante o sistema operativo instalado no seu servidor. Recomendamos que consulte a documentação oficial do seu sistema operativo para obter os comandos adequados.
Se o seu servidor conseguir arrancar em modo normal após a substituição do disco, siga simplesmente as etapas descritas nesta secção se a sua partição EFI não estiver espelhada ou nesta secção se a sua partição EFI estiver espelhada.
Reconstrução do RAID após a substituição do disco principal (modo rescue)
Uma vez o disco substituído, copie a tabela de partições do disco saudável (neste exemplo, nvme1n1) para o novo disco (nvme0n1).
Para as partições GPT
O comando deve estar neste formato: sgdisk -R /dev/novo disco /dev/disco saudável
Exemplo:
Execute lsblk para se certificar de que as tabelas de partições foram corretamente copiadas:
Em seguida, aleatorize o GUID do novo disco para evitar quaisquer conflitos com os GUID de outros discos:
Se receber a seguinte mensagem:
Execute simplesmente o comando partprobe.
Em seguida, reconstruímos o array RAID. O seguinte excerto mostra como adicionar as novas partições (nvme0n1p2 e nvme0n1p3) ao array RAID.
Para verificar o processo de reconstrução:
Depois de terminada a reconstrução do RAID, execute o seguinte comando para se certificar de que as partições foram corretamente adicionadas ao RAID:
De acordo com os resultados acima, as partições do novo disco foram corretamente adicionadas ao RAID. No entanto, a partição EFI System e a partição SWAP (em alguns casos) não foram duplicadas, o que é normal, pois não fazem parte do RAID.
Os exemplos acima ilustram apenas as etapas necessárias com base numa configuração de servidor predefinida. Os resultados de cada comando dependem do tipo de hardware instalado no seu servidor e da estrutura das suas partições. Em caso de dúvida, consulte a documentação do seu sistema operativo.
Se precisar de assistência profissional para a administração do seu servidor, consulte os detalhes da secção Quer saber mais? deste guia.
Recriação da partição EFI System
Para recolocar a partição EFI System no novo disco, temos de formatar nvme0n1p1 e replicar o conteúdo da partição EFI System saudável (no nosso exemplo: nvme1n1p1) para esta última.
Aqui, assumimos que as duas partições foram sincronizadas e contêm ficheiros actualizados.
Se uma actualização importante do sistema, tal como uma actualização do kernel ou do GRUB, tiver ocorrido e as duas partições não tiverem sido sincronizadas, consulte esta secção uma vez que tenha terminado a criação da nova partição EFI System.
Primeiro, formate a partição:
Em seguida, nomeie a partição EFI_SYSPART (este nome é específico da OVHcloud):
Em seguida, duplique o conteúdo de nvme1n1p1 para nvme0n1p1.
Comece por criar dois diretórios, nomeados « old » e « new » neste exemplo :
Em seguida, monte nvme1n1p1 no diretório « old » e nvme0n1p1 no diretório « new » para fazer a distinção:
Copie os ficheiros do diretório « old » para o diretório « new »:
Depois disso, desmonte as duas partições:
Em seguida, monte a partição contendo a raiz do sistema operativo em /mnt. Neste exemplo, esta partição é md3.
Monte os seguintes diretórios para se certificar de que todas as modificações feitas no ambiente chroot funcionam corretamente:
Em seguida, utilize o comando chroot para aceder ao ponto de montagem e verifique se a nova partição do sistema EFI foi corretamente criada e se o sistema reconhece os dois ESP:
Para mostrar as partições ESP, execute o comando blkid -t LABEL=EFI_SYSPART:
Os resultados acima mostram que a nova partição EFI foi criada corretamente e que o LABEL foi aplicado corretamente.
Depois disso, saia do ambiente chroot:
Em seguida, consulte esta secção para recolocar a partição SWAP (se aplicável).
Reconstrução do RAID com ESP não sincronizados após actualizações importantes do sistema (GRUB)
Desdobre esta secção
Siga as etapas desta secção apenas se aplicável ao seu caso.
Se o disco principal for substituído enquanto contém partições do sistema EFI que não foram sincronizadas após actualizações importantes do sistema que modificaram o GRUB, o arranque a partir de um dos discos secundários com uma ESP obsoleta pode falhar.
Neste caso, para além de reconstruir o RAID e recolocar a partição do sistema EFI em modo rescue, também terá de reinstalar o GRUB nela.
Uma vez criada a ESP (como explicado acima) e reconhecida pelo sistema, ainda no ambiente choot, crie a pasta /boot/efi para montar a nova partição do sistema EFI nvme0n1p1.
Em seguida, reinstale o carregador de arranque GRUB (bootloader):
Depois, execute o seguinte comando:
Depois disso, saia do ambiente chroot:
Em seguida, consulte esta secção para recolocar a partição SWAP (se aplicável).
Reconstrução do RAID após a substituição do disco principal (modo normal)
Desdobre esta secção
Se o seu servidor conseguir arrancar em modo normal após a substituição do disco, pode seguir as etapas abaixo para reconstruir o RAID.
Uma vez substituído o disco, copiamos a tabela de partições do disco saudável (neste exemplo, nvme1n1) para o novo (nvme0n1).
Para as partições GPT
O comando deve estar neste formato: sgdisk -R /dev/novo disco /dev/disco saudável.
Uma vez feito isto, o passo seguinte consiste em atribuir um GUID aleatório ao novo disco para evitar conflitos de GUID com outros discos:
Se receber a seguinte mensagem:
Execute simplesmente o comando partprobe. Se ainda não conseguir ver as novas partições criadas (com o comando lsblk), terá de reiniciar o servidor antes de continuar.
Em seguida, adicione as partições ao RAID:
Utilize este comando para seguir a reconstrução do RAID: cat /proc/mdstat.
Uma vez terminada a reconstrução, recolha a partição do sistema EFI no novo disco.
- Primeiro, certifique-se de que as ferramentas necessárias estão instaladas:
Debian e Ubuntu
CentOS
- Formate a partição. No nosso exemplo
nvme0n1p1:
- Atribua a etiqueta
EFI_SYSPARTà partição (este nome é específico da OVHcloud):
Uma vez feito isto, pode sincronizar as duas partições com o script fornecido neste guia.
- Verifique que a nova partição EFI System foi corretamente criada e que o sistema a reconhece:
Em seguida, consulte esta secção para recolocar a partição SWAP (se aplicável).
Reconstrução do RAID (com ESP em espelho)
Desdobre esta secção
A reconstrução do RAID com todas as partições em espelho é mais simples; basta copiar os dados do disco saudável para o novo disco e recolocar a partição [SWAP] (se aplicável).
De acordo com as ilustrações acima, o estado do RAID deverá ser semelhante a este após uma falha do disco:
Uma vez substituído o disco, a primeira etapa consiste em copiar a tabela de partições do disco saudável (neste exemplo, nvme1n1) para o novo disco (nvme0n1).
Para as partições GPT
O comando deve estar no seguinte formato: sgdisk -R /dev/novo disco /dev/disco saudável.
No nosso exemplo:
Execute lsblk para se certificar de que as tabelas de partições foram corretamente copiadas:
O passo seguinte consiste em atribuir um GUID aleatório ao novo disco para evitar conflitos de GUID com outros discos:
Se receber a seguinte mensagem:
Execute o comando partprobe.
Podemos agora reconstruir a matriz RAID. O seguinte extrato de código mostra como adicionar novamente as novas partições (nvme0n1p2 e nvme0n1p3) à matriz RAID.
Para verificar o processo de reconstrução:
Uma vez terminada a reconstrução, execute o seguinte comando para se certificar de que as partições foram corretamente adicionadas ao RAID:
Em seguida, consulte esta secção para recolocar a partição SWAP (se aplicável).
De acordo com as ilustrações acima, o estado do RAID deverá ser semelhante a este após uma falha do disco:
Uma vez substituído o disco, a primeira etapa consiste em copiar a tabela de partições do disco saudável (neste exemplo, nvme1n1) para o novo disco (nvme0n1).
Para as partições GPT
O comando deve estar no seguinte formato: sgdisk -R /dev/novo disco /dev/disco saudável.
Em seguida, randomize o GUID do novo disco para evitar qualquer conflito com os GUID de outros discos:
Se receber a seguinte mensagem:
Execute simplesmente o comando partprobe. Se ainda não conseguir ver as novas partições criadas (ex. com lsblk), terá de reiniciar o servidor antes de continuar.
Em seguida, adicione as partições ao RAID:
Utilize o seguinte comando para monitorizar a reconstrução do RAID:
Uma vez terminada a reconstrução do RAID, consulte esta secção para recolocar a partição SWAP (se aplicável).
Adição da etiqueta à partição SWAP (se aplicável)
Desdobre esta secção
Fora do ambiente chroot, recolha a partição [SWAP] nvme0n1p4 e adicione a etiqueta swap-nvmenxxx:
Verifique que a etiqueta foi corretamente aplicada:
Aceda novamente ao ambiente chroot:
Recupere o UUID das duas partições SWAP:
Em seguida, substitua o antigo UUID da partição SWAP (nvme0n1p4) pelo novo no ficheiro /etc/fstab:
Exemplo:
Com base nos resultados acima, o antigo UUID é b7b5dd38-9b51-4282-8f2d-26c65e8d58ec e deve ser substituído pelo novo b3c9e03a-52f5-4683-81b6-cc10091fcd15. Certifique-se de substituir o UUID correto.
Em seguida, verifique que tudo está corretamente montado com o seguinte comando:
Ative a partição SWAP:
Saia do ambiente chroot com exit e recarregue o sistema:
Desmonte todos os discos:
Temos agora terminado com sucesso a reconstrução RAID no servidor e podemos agora reiniciá-lo em modo normal.
Para recolocar a partição SWAP, proceda da seguinte forma:
- Primeiro, recolha a partição em nvme0n1p4 e adicione a etiqueta swap-nvme0n1p4:
- Recupere os UUID das duas partições SWAP:
- Substitua o antigo UUID da partição SWAP (nvme0n1p4) pelo novo em
/etc/fstab:
Exemplo:
De acordo com os resultados acima, o UUID antigo é b7b5dd38-9b51-4282-8f2d-26c65e8d58ec e deve ser substituído pelo novo b3c9e03a-52f5-4683-81b6-cc10091fcd15.
Certifique-se de substituir o UUID correto.
Em seguida, execute o seguinte comando para ativar a partição SWAP:
Em seguida, recarregue o sistema:
Concluímos com sucesso a reconstrução do RAID.
Quer saber mais?
Para serviços especializados (SEO, desenvolvimento, etc.), contacte os parceiros da OVHcloud.
Se precisar de assistência para utilizar e configurar as suas soluções OVHcloud, consulte as nossas ofertas de suporte.
Se precisar de formação ou de assistência técnica para implementar as nossas soluções, contacte o seu representante comercial ou clique neste link para obter um orçamento e solicitar que a equipa de Professional Services intervenha no seu caso de utilização específico.
Fale com a nossa comunidade de utilizadores.