VMware HA (High Availability)
Einleitung
Die Hauptfunktion von VMware HA (High Availability) ist, virtuelle Maschinen im Falle einer Hardwarestörung auf einem anderen Host des Clusters neu zu starten. Darüber hinaus ermöglicht HA die Überwachung von VMs und Anwendungen.

In dieser Anleitung erfahren Sie, wie Sie diese Funktion konfigurieren.
Voraussetzungen
- Sie sind auf Ihrem vSphere Interface eingeloggt.
- Sie verfügen über ein Managed Bare Metal Produkt.
Beschreibung
Aktivierung
HA ist standardmäßig im Basis-Cluster, das Ihnen OVHcloud bei Lieferung Ihrer Managed Bare Metal bereitstellt, aktiviert.
Wird ein neues Cluster erstellt, können Sie HA direkt bei Erstellen des Clusters oder auch im Nachhinein aktivieren.
Wenn HA in Ihrem Cluster nicht aktiviert ist, gehen Sie in den Tab Konfigurieren Ihres Clusters und dann im Bereich Services in den Tab vSphere Availability.
Klicken Sie auf Bearbeiten und setzen Sie einen Haken, um die HA-Funktion zu aktivieren.
Außerdem ist wichtig, dass Sie das Monitoring des Hosts aktivieren. Mit dieser Einstellung können Taktsignale zwischen den ESXi-Hosts gesendet werden, um eine mögliche Störung zu ermitteln. Diese Funktion muss wieder deaktiviert werden, um zum Beispiel Aktualisierungen über den Update Manager durchzuführen. In diesem Fall wird der Host isoliert.

Einstellungen
Fehler und Reaktionen
Diese erste Kategorie erlaubt das Festlegen der Neustarteinstellungen für VMs im Falle verschiedener möglicher Fehler.
Reagieren auf Hostfehler
Diese Kategorie legt die Neustarteinstellungen Ihrer VMs im Falle eines Hostausfalls fest.
So können Sie bestimmen, ob Ihre virtuellen Maschinen automatisch neu gestartet werden oder nicht.
Eine standardmäßige Neustartverwaltung für das Cluster ist ebenfalls möglich. Sie können dies für jede virtuelle Maschine im Tab VM-Außerkraftsetzungen genauer einstellen.
Darüber hinaus können Sie eine andere Bedingung als die standardmäßige Einstellung (Zugeteilte Ressourcen) auswählen, die vSphere HA vor Ausführen des Neustarts überprüfen wird.

Reaktion bei Hostisolierung
Diese Kategorie erlaubt es Ihnen, die Aktionen festzulegen, die bei Verlust der Netzwerkkonnektivität eines Hosts durchzuführen sind.
Sie können auswählen aus:
- Nichts tun.
- Die virtuellen Maschinen herunterfahren und versuchen, diese auf einem anderen verfügbaren Host neu zu starten.
- Den betroffenen Host ausschalten und versuchen, die virtuellen Maschinen auf einem anderen verfügbaren Host neu zu starten.

Datenspeicher mit PDL
Wenn ein Datenspeicher mit PDL-Status (permanent device loss) ausfällt, können Sie hier festlegen, welche Aktionen ausgeführt werden sollen:
- Nichts tun.
- Nichts tun, aber Event-Logs erstellen.
- Virtuelle Maschinen herunterfahren und versuchen, diese auf Hosts neu zu starten, die noch über Konnektivität zum Datenspeicher verfügen.

Datenspeicher mit APD
Wenn ein Datenspeicher mit APD-Status (all paths down) ausfällt, können Sie hier festlegen, welche Aktionen ausgeführt werden sollen:
- Nichts tun.
- Nichts tun, aber Event-Logs erstellen.
- Virtuelle Maschinen herunterfahren und versuchen, diese neu zu starten.

VM-Überwachung
Das Monitoring für virtuelle Maschinen ist nach Installation der VMware Tools verfügbar. Bei Nichtverfügbarkeit über die Tools (Taktsignale) wird die virtuelle Maschine automatisch neu gestartet. Was diese Funktion betrifft, sind auch erweiterte Einstellungen möglich (zum Beispiel Neustartintervalle).

Zugangssteuerung
vSphere HA nutzt die Zugangssteuerung, um sicherzustellen, dass ausreichend Ressourcen für die Wiederherstellung virtueller Maschinen im Falle eines Hostfehlers reserviert sind.
Die Zugangssteuerung legt Einschränkungen für die Ressourcenverwendung fest. Aktionen, die gegen diese Einschränkungen verstoßen könnten, sind nicht zulässig. Unter anderem sind folgende Aktionen möglicherweise nicht zulässig:
- Anschalten einer virtuellen Maschine
- Migration einer virtuellen Maschine
- Erhöhen der CPU- oder Arbeitsspeicherreservierung einer virtuellen Maschine
Grundlage der Zugangssteuerung von vSphere HA ist die Anzahl der Hostfehler, die das Cluster tolerieren darf, während die Failover-Funktion weiterhin gewährleistet bleibt. Die Failover-Kapazität der Hosts kann auf drei verschiedene Arten definiert werden:
Taktsignal-Datenspeicher
Wenn der Master-Host in einem HA-Cluster nicht über das Verwaltungsnetzwerk mit einem untergeordneten Host kommunizieren kann, verwendet der Master-Host Datenspeicher-Taktsignale, um festzustellen, ob der untergeordnete Host ausgefallen ist, sich in einer Netzwerkpartition befindet oder vom Netzwerk isoliert ist.
Erweiterte Optionen
Sie können mehrere erweiterte Konfigurationseinstellungen in Ihrem Cluster verwenden.
Die Einstellungen finden Sie auf dieser Seite.
HA-Regel
Im Bereich Konfiguration im Tab VM/Host-Regeln können Sie eine Regel des Typs “Virtuelle Maschinen zu virtuelle Maschinen” erstellen.
Diese fügt eine Neustartbedingung hinzu, um sicherzustellen, dass alle virtuellen Maschinen einer ersten Gruppe vor den VMs einer zweiten Gruppe gestartet werden.
Diese Regel kann gut zu den im Tab VM-Außerkraftsetzungen einstellbaren Neustartprioritäten hinzugefügt werden.
Weiterführende Informationen
Für den Austausch mit unserer User Community gehen Sie auf https://community.ovh.com/en/.