La réponse de cet article est déjà dans le titre mais j’ai récemment été confronté à un problème de communication entre une de mes Edge Node et le Host Transport Node (ESXi) sauf qu’aucun message d’erreur n’indiquait clairement le problème, c’est pourquoi j’ai eu l’envie de vérifier le séquencement d’initialisation d’une Edge Node mais je l’avoue, j’ai trouvé mon problème bien avant d’avoir vérifié le script d’initialisation de la Edge Node, c’est par simple curiosité que j’ai été jusqu’au bout du tshoot.

Par la suite je ferai un second article sur la possibilité de resizer ou non une Edge Node même si ce sont des VMs « jetables ».


Environnement :

  • NSX 4.1.2.1.0 (Build 22667861)
  • AMD Threadripper 3960x (128Go RAM / 6To NVME)
A diagram of a network

Description automatically generated

En première ligne voici les symptômes que j’avais lorsque la VM était UP côté vCenter mais pas la communication EdgeNode/HostTransportNode.

A screenshot of a computer

Description automatically generated
A screen shot of a computer

Description automatically generated

La configuration et communication HostTransport Node/Manager est bonne

A screenshot of a computer

Description automatically generated
A screenshot of a computer

Description automatically generated

La Edge Node arrive à ping correctement l’IP du Host Transport Node ainsi que sa TEP donc jusqu’ici mis à part le premier message d’erreur rien d’alarmant.

A screen shot of a computer program

Description automatically generated

Une fois les logs vérifiés quelques erreurs ressortaient mais rien n’indiquait clairement un problème de sizing, cependant 3 erreurs m’ont interpellée :

  • La première indiquait un « get » assez basique qui n’aboutissait pas
  • La seconde indiquait un problème de connexion mais en réalité le fichier n’existait pas
  • La troisième m’a clairement interpelé et c’est cette erreur qui m’a fait aller vérifier le script d’initialisation NSX-Edge (/opt/vmware/nsx-edge/bin/config.py)
A screen shot of a computer

Description automatically generated

A tout hasard j’ai tenté un reboot qui bien evidemment (helpdesk de niveau moins 1 😊) n’a pas résolu le problème mais ça m’a quand même permit de voir ce message d’erreur :

A computer screen with white text

Description automatically generated

Pour rappel lorsque vous déployer une Edge Node vous définissez le sizing à ce niveau :

A screenshot of a computer

Description automatically generated

Le script a plusieurs phases de vérifications que ce soit au niveau du type de vendor CPU, les vmnic, ou encore le vCPU Count qui va déterminer le sizing (small, large, extra large,…). C’est d’ailleurs ce dernier qui nous intéresse est bien évidemment.

A screen shot of a computer program

Description automatically generated
A computer screen with white and purple text

Description automatically generated

Si nous regardons le script précédent nous pouvons voir qu’il se base sur des variables qui ne sont ni plus ni moins que des fichiers « json » qui sont regardés à chaque démarrage. Exemple pour le « config.json » qui contient le sizing de la VM.

A computer screen shot of a computer program

Description automatically generated

Les Edges Nodes sont des appliances où le sizing est primordial car il est checké à chaque démarrage à travers le script « config.py » dans « /opt/vmware/nsx-edge/bin/ ».

Il faut donc suivre les recommandations VMware notamment lorsque vous souhaitez utiliser des services avancés (L7 Load Balancer, L7 Access Profile, TLS Inspection,..) car ils sont également checké au démarrage.

Sur le second article je me concentrerai sur le resizing des appliances même si ce n’est pas recommandé par VMware et que cela demande quelques configurations si jamais vous ne voulez pas redéployer une nouvelle Edge Node.

No responses yet

Leave a Reply

Your email address will not be published. Required fields are marked *