VMware HA (High Availability)

Contactar

Gestionar la política de reinicio con la función HA

Bases de conocimiento

KB0044747

514 visualizaciones

18.11.2020

Managed Bare Metal

Objetivo

La función principal de VMware HA(Alta disponibilidad) es reiniciar las máquinas virtuales en otro host del cluster en caso de fallo del hardware. Con HAtambién se pueden supervisar las máquinas virtuales y las aplicaciones.

Esta guía explica cómo configurar esta función

Requisitos

Estar conectado a la interfaz vSphere.
Tener contratado un Managed Bare Metal de OVHcloud.

Procedimiento

Activación

La funcionalidad HA está activa por defecto en el primer cluster que OVHcloud le proporciona cuando contrata el servicio Managed Bare Metal.

Si se crea un cluster nuevo, se puede activar la funcionalidad HA en el proceso de creación del cluster o posteriormente.

Si HA no está activo en su cluster, diríjase a la pestaña Configure de su cluster, y a la sección Disponibilidad de vSphere en la parte de Servicios.

Haga clic en Editar y marque la casilla para activar la funcionalidad HA.

Es importante activar también la supervisión del host. Esta configuración permite el envío de latidos entre los host ESXi para detectar una posible avería. Será necesario desactivarla para llevar a cabo ciertas tareas como las actualizaciones con el update manager. En ese caso, el host estará aislado.

Configuración

Fallos y respuestas

Esta primera categoría permite definir la política de reinicio de las máquinas virtuales en función de los posibles fallos.

Respuesta en caso de fallo del host

Esta categoría va a definir la política de reinicio de las máquinas virtuales en caso de pérdida de un host.

Es posible definir que se reinicien sus máquinas virtuales de forma automática. También se puede activar el reinicio por defecto en el cluster. Puede afinar esta configuración por máquina virtual en la pestaña Reemplazo de las MV.

También puede definir una condición diferente a la que viene por defecto (Recursos asignados), que vSphere HA comprobará antes de proceder con el reinicio.

Respuesta al aislamiento del host.

Esta categoría le permite definir las acciones que deben llevarse a cabo en caso de pérdida de conectividad de red en un host.

Puede elegir entre:

No hacer nada.
Apagar las máquinas virtuales e intentar reiniciarlas en otro host disponible.
Apagar el host en cuestión e intentar reiniciar las máquinas virtuales en otro host disponible.

Almacén de datos con PDL

En caso de que falle un almacén de datos con estado PDL (pérdida permanente de dispositivo), se pueden definir las acciones que deben llevarse a cabo:

No hacer nada.
No hacer nada pero generar logs de los eventos.
Apagar las máquinas virtuales e intentar reiniciarlas en los host que siguen teniendo conectividad con el almacén de datos.

Almacén de datos con APD

En caso de que falle un almacén de datos con estado APD (all path down), se pueden definir las acciones que deben llevarse a cabo:

No hacer nada.
No hacer nada pero generar logs de los eventos.
Apagar las máquinas virtuales e intentar reiniciarlas.

Supervisión de las MV

La supervisión de las máquinas virtuales está disponible después de instalar las VMware tools. En caso de no haber respuesta a través de las tools(latidos), la máquina virtual se reiniciará de forma automática. Se puede realizar una configuración avanzada con respecto a esta funcionalidad (por ejemplo, con intervalos de reinicio).

Control de admisión

vSphere HA utiliza el control de admisión para garantizar que se reserven recursos suficientes para la recuperación de máquinas virtuales cuando se produce un fallo en el host.

El control de admisión impone restricciones sobre el uso de recursos. No se permite ninguna acción que pueda infringir estas restricciones. Algunos ejemplos de acciones que pueden no estar permitidas son:

Encendido de una máquina virtual
Migración de una máquina virtual
Aumento de la reserva de CPU o de memoria de una máquina virtual

El control de admisión de vSphere HA se basa en la cantidad de errores de host que el clúster puede tolerar sin perder la capacidad de conmutación por error. La capacidad de conmutación por error del host puede definirse de tres formas:

Almacén de datos de latidos

Cuando el host principal de un cluster HA no puede comunicarse con un host subordinado en la red de gestión, el host principal utiliza el latido de almacén de datos para determinar si el host subordinado tiene fallos, si se encuentra en una partición de red o si está aislado de la red.

Opciones avanzadas

Es posible realizar varios ajustes de configuración avanzada en el cluster.

Para ello, debe dirigirse a esta página.

Regla HA

En la sección configuración, en la pestaña Reglas MV/Host, se puede crear una regla del tipo «Máquinas virtuales a máquinas virtuales».

Esta añadirá una condición de reinicio para garantizar que las máquinas virtuales de un primer grupo se enciendan antes de encender las de un segundo grupo.

Esta regla puede añadirse como complemento de las prioridades de reinicio configurables en la pestaña Sustituciones de MV.

Más información

Interactúe con nuestra comunidad de usuarios en https://community.ovh.com/en/.

¿Le ha servido de ayuda esta página?

Sí

No

Bases de conocimiento

Categoría

VMware HA (High Availability)

Objetivo

Requisitos

Procedimiento

Activación

Configuración

Fallos y respuestas

Respuesta en caso de fallo del host

Respuesta al aislamiento del host.

Almacén de datos con PDL

Almacén de datos con APD

Supervisión de las MV

Control de admisión

Almacén de datos de latidos

Opciones avanzadas

Regla HA

Más información

Artículos relacionados