Substituir um disco com defeito
Informações sobre a tradução
Esta tradução foi automaticamente gerada pelo nosso parceiro SYSTRAN. Em certos casos, poderão ocorrer formulações imprecisas, como por exemplo nomes de botões ou detalhes técnicos. Recomendamos que consulte a versão inglesa ou francesa do manual, caso tenha alguma dúvida. Se nos quiser ajudar a melhorar esta tradução, clique em "Contribuir" nesta página.
Sumário
Se verificar que um disco tem problemas ou que o nosso sistema lhe enviou uma notificação por e-mail para o avisar da falha de um disco, deverá tomar as medidas necessárias para o substituir o mais rápido possível.
Este guia explica-lhe como identificar um disco defeituoso e como fazer o pedido de substituição junto dos nossos serviços.
A utilização e a gestão dos serviços OVHcloud são da responsabilidade do cliente. Como não temos acesso a estas máquinas, não podemos administrá-las nem fornecer-lhe assistência. O cliente é o único responsável pela gestão e pela segurança do serviço.
Este guia fornece as instruções necessárias para usar as funcionalidades básicas de um servidor dedicado. Se encontrar alguma dificuldade relacionada com o processo, deverá contactar um serviço especializado. Para mais informações, aceda à secção deste guia intitulada: «Quer saber mais?»
Requisitos
- Dispor de um servidor dedicado.
- Ter um acesso administrador (sudo) ao seu servidor via SSH.
Instruções
Fazer backup dos dados
Antes de mais, é necessário fazer um backup dos seus dados. O único objetivo de um RAID, com a exceção do RAID 0, é proteger os dados contra as falhas dos discos. Quando um disco fica inutilizável, todos os dados dependem da integridade do(s) disco(s) restante(s).
Embora seja raro que dois discos tenham problemas em simultâneo, esta situação não é impossível. Não se substituirá nenhum disco sem:
- uma confirmação da sua parte quanto ao backup dos dados;
- uma confirmação de que aceita, com plena consciência, a potencial perda dos dados no seguimento da substituição do disco.
Como detetar um disco com problemas
Sempre que receber um alerta por e-mail ou que constate uma falha, é indispensável que verifique a integridade de todos os seus discos. Se dois discos que fazem parte de um mesmo conjunto RAID apresentarem problemas, substituiremos em primeiro lugar o que apresentar mais erros.
Servidor com recurso a um RAID por software
Se possui um servidor que recorre a RAID por software, consulte o guia «RAID por software» para encontrar os discos instalados no seu servidor.
Quando tiver encontrado o caminho de acesso aos discos, pode testá-los da seguinte forma através do comando smartctl:
Não se esqueça de substituir /dev/sdX pelo caminho de acesso ao seu disco, sendo sdX o disco em causa, isto é, sdA, sdB, etc.
Isto também permitirá que obtenha o número de série (Serial Number) do(s) disco(s) a substituir, de modo a comunicar essa informação ao técnico.
Eis um exemplo do resultado apresentado:
Portanto, a linha importante no nosso caso será a seguinte:
Serial Number: 5329T58N
Servidor com recurso a um RAID por hardware
Se possui um servidor que recorre a RAID por hardware, consulte o guia «RAID por hardware» - EN e realize o procedimento adequado ao seu tipo de controlador RAID para encontrar os caminhos de acesso aos discos.
Quando tiver encontrado o caminho de acesso aos discos, pode testá-los da seguinte forma através do comando smartctl:
Não se esqueça de substituir /dev/sdX pelo caminho de acesso ao seu disco, sendo sdX o disco em causa, isto é, sdA, sdB, etc.
Em certos casos, poderá obter a mensagem seguinte: /dev/sda [megaraid_disk_00][SAT]: Device open changed type from 'megaraid' to 'sat'.
Então, terá de substituir megaraid por sat+megaraid como se segue: smartctl -d sat+megaraid,N -a /dev/sdX.
No caso de uma placa RAID LSI, pode testar os discos utilizando o comando smartctl, tal como se descreve a seguir:
O número do RAID deve ser especificado (/dev/sg0 = 1.º RAID, /dev/sg1 = 2.º RAID, etc.).
Servidor com um disco NVMe
No caso de um disco NVMe, será preciso pôr o servidor em modo rescue e instalar a ferramenta nvme-cli.
Então será necessário utilizar o comando nvme list para obter os números de série dos discos:
Pedir a substituição do disco
Substituir o disco a frio (desligando o servidor)
Para pedir a substituição de um disco, basta criar um ticket junto do serviço de apoio técnico, a partir da Centro de Ajuda. De modo a acelerar o processo, é conveniente fornecer os elementos ligados aos testes. Aqui fica uma lista do que é preciso:
- O número de série do disco a substituir, bem como de todos os outros discos sem problemas. Para obter o número de série do disco a substituir, consulte este guia. Se por alguma razão não conseguir obter o número de série do disco, queira mencioná-lo no ticket e comunicar-nos o número de série do(s) disco(s) a não substituir.
Como já indicado, os números de todos os discos são importantes. Eles serão transmitidos ao técnico no datacenter e evitarão a ocorrência de erros durante a operação.
-
A data e a hora do início da intervenção. Deve prever uma curta interrupção do serviço, mas pode planear a intervenção para qualquer hora do dia ou da noite, num dos sete dias da semana.
-
A confirmação de que fez o backup dos dados ou de que aceita a potencial perda destas informações.
Substituir o disco a quente (sem desligar o servidor)
Este tipo de substituição só é possível para os servidores dedicados com uma placa RAID.
No caso de uma substituição a quente num servidor com uma placa MegaRAID, quando a intervenção for programada ser-lhe-á pedido que faça piscar o LED do disco a substituir, para facilitar o trabalho dos técnicos.
Se o seu servidor dispõe de uma placa MegaRAID, estes são os comandos a utilizar:
- para fazer piscar o LED:
- para interromper o piscar do LED:
Equivalente através do comando storcli:
- para fazer piscar o LED:
sh
storcli /c0/e0/s0 start locate
- para interromper o piscar do LED:
sh
storcli /c0/e0/s0 stop locate
Apesar deste procedimento, não se esqueça de especificar no ticket de assistência o número de série e a slot do disco.
Após a substituição
Se possui um servidor em RAID por hardware, o RAID vai restabelecer-se de forma autónoma. Atenção: o auto-rebuild, ativado de forma padrão, não deve ter sido desativado por si. O processo de ressincronização pode levar alguns minutos e prejudicar o desempenho de leitura/escrita do RAID.
Se possui um servidor em RAID por software, convém que execute manualmente a ressincronização dos discos. Para isso, consulte a documentação associada ao «RAID por software».
Quer saber mais?
Para serviços especializados (referenciamento, desenvolvimento, etc), contacte os parceiros OVHcloud.
Se pretender usufruir de uma assistência na utilização e na configuração das suas soluções OVHcloud, consulte as nossas diferentes ofertas de suporte.
Fale com nossa comunidade de utilizadores.