Tester la perte temporaire d'un hôte via l'activation du mode résilience
Objectif
Si vous souhaitez réaliser un test de résilience sur votre infrastructure VMware on OVHcloud, le mode résilience permet de simuler la perte temporaire d'un host afin de valider la continuité d'activité de votre production en cas d'incident.
Découvrez comment tester la perte temporaire d'un hôte avec le mode résilience sur votre infrastructure VMware on OVHcloud
Prérequis
- Disposer d'une offre VMware on OVHcloud.
- Être connecté à l'espace client OVHcloud.
En pratique
Cette opération s'effectue depuis les APIs OVHcloud et aura pour effet de couper l'accessibilité au réseau pour le host sélectionné puis sa désactivation pour une durée définie préalablement (min: 10min, max: 24h, default: 1h).
Ce test est indépendant du système de surveillance, évitant ainsi le remplacement automatique du host.
Les VMs seront ainsi mises hors tension, la migration puis le redémarrage vers le ou les hosts restant(s) seront opérés par vSphere HA si la fonctionnalité est correctement configurée sur votre cluster.
Pour plus d'information concernant vSphere HA, vous pouvez consulter la documentation VMware « Fonctionnement de vSphere HA ».
Vous pourrez ainsi estimer le temps de reprise d'activité à partir du lancement du test et la simulation de l'incident (RTO) jusqu'au redémarrage des VMs.
Voici les appels à exécuter afin de lister et obtenir les identifiants de votre infrastructure, de votre datacentre et de l'hôte sur lesquels nous souhaitons réaliser ce test.
Récupérez le nom de votre infrastructure (pcc-xx-xx-xx) :
Récupérez ensuite l'identifiant de votre datacentre :
Enfin, récupérez l'identifiant de votre hôte :
Une fois toutes les informations obtenues, afin de valider que vous pouvez lancer l'action, utilisez l'appel suivant qui va valider les conditions de réalisation du test et ainsi éviter toute perte d'activité :
Si le test est réalisable le résultat est : true.
Pour lancer le test, utilisez l'appel suivant :
L'hôte sera alors déconnecté et passera en mode « Pas de réponse » jusqu'à la fin du test :

Vous pouvez vérifier le statut de l'action à l'aide de l'appel suivant :
Si le test a bien été lancé sur le host, le résultat sera alors : enabled.
Si nécessaire, vous pouvez également arrêter le test avant la durée choisie via l'appel suivant :
Parmi les informations renvoyées on retrouvera la planification de la tâche updateHostResilienceOff.
La connectivité de l'hôte sera rétablie à la fin du test et votre infrastructure VMware on OVHcloud retrouvera ses conditions normales d'utilisation.
Aller plus loin
Si vous avez besoin d'une formation ou d'une assistance technique pour la mise en oeuvre de nos solutions, contactez votre commercial ou cliquez sur ce lien pour obtenir un devis et demander une analyse personnalisée de votre projet à nos experts de l’équipe Professional Services.
Échangez avec notre communauté d'utilisateurs.