Proxmox VE: guida completa per rimuovere un nodo dal cluster

Può capitare di dover rimuovere un nodo da un cluster Proxmox VE, ad esempio perché l’host è guasto, deve essere reinstallato o dismesso.

In questa guida vedremo i passaggi corretti per sganciare un nodo dalla struttura del cluster senza compromettere la stabilità dell’ambiente.

1. Preparazione: migrazione di VM e container

Prima di procedere, assicurati che tutte le VM e i container siano migrati o backupati su altri nodi del cluster. La rimozione di un nodo con risorse attive può causare perdita di dati.


Comandi utili per spostare risorse:

  • Lista VM: qm list
  • Migrazione VM: qm migrate <VMID> <nodo-destinazione>
  • Lista container: pct list
  • Migrazione container: pct migrate <CTID> <nodo-destinazione>

È fondamentale che non ci siano risorse attive sul nodo che vuoi rimuovere per evitare perdita di dati.

2. Arrestare i servizi sul nodo da rimuovere

Collegarsi via SSH o da Shell al nodo che vuoi rimuovere e ferma i servizi di cluster:

systemctl stop pve-cluster
systemctl stop corosync

Nota: Questi comandi fermano il filesystem del cluster e interrompono la sincronizzazione tra i nodi.

Comandi eseguiti dalla Shell del nodo:

  • Selezionare il nodo da rimuovere.
  • Selezionare “Shell”.
  • Eseguire il commando: “systemctl stop pve-cluster”:
  • Successivamente eseguire il comando “systemctl stop corosync”:

3. Separare il nodo

Il comando pmxcfs -l avvia il filesystem cluster in modalità locale, permettendo di modificare o cancellare i file di configurazione del nodo quando non è più sincronizzato con il resto del cluster.

Questo comando non rimuove automaticamente il nodo dalla configurazione del cluster.

  • Essendoci posizionati sul nodo da rimuovere, dopo aver eseguito il comando non vedremo più gli altri due nodi del cluster:

4. Rimuovere il nodo dal cluster

Collegarsi ad uno degli altri nodi del cluster (non quello da rimuovere) e verifica lo stato del cluster:

  • pvecm status

Poi eliminare il nodocon il comando:

  • pvecm delnode <nome-nodo>

Ad esempio in questo caso il comando sarà: pvecm delnode prox-03

Nota: Il comando “pvecm delnode <nome-nodo>deve essere eseguito da un nodo ancora attivo nel cluster, non dal nodo che stai rimuovendo.

A questo punto il nodo e nuovamente indipendente, ma dagli altri nodi del cluster viene visto come offline:

  • Posizionandoci sulla shell di uno dei nodi del cluster (è indifferente su quale nodo del cluster) eseguire il comando “pvecm delnode hostname” (hostname=nome del nodo da rimuovere).

Nota: in questo caso il comando completo sarà “pvecm delnode prox-03”:

Verifica dello stato del cluster:

  • eseguire il comando: “pvecm status”:
  • Nella sezione “Quorum information” nel campo “Nodes” viene riportato il numero dei nodi attivi, in questo caso ne rimangono due:
  • Dopo aver ripulito il cluster, riavviare il nodo rimosso “reboot -f“:

5. Pulizia finale sul nodo rimosso

Sul nodo appena rimosso potresti ancora vedere riferimenti al cluster nella GUI o nella configurazione.

Per pulirli completamente:

  • Ferma di nuovo i servizi:
    • systemctl stop pve-cluster
    • systemctl stop corosync
  • Digitare il commando “systemctl stop corosync”:
  • Eseguire il command “pmxcfs -l“:
  • Eseguire il comando “rm /etc/pve/corosync.conf”:
  • Eseguire il comando “rm -r /etc/corosync/*“:
  • Eseguire il commando “killall pmxcfs“:

Dopo aver eseguito il comando “killall pmxcfs, riavviare normalmenteil servizio "pve-cluster” per far tornare il nodo standalone prima del reboot.

  • Eseguire il commando “systemctl start pve-cluster“:
  • Riavviare il nodo “reboot -f“:
  • Così il nodo sarà pulito e standalone, pronto per un nuovo utilizzo o una reinstallazione.

6. Considerazioni finali

  • Assicurati sempre di mantenere quorum nel cluster rimanente.
  • In caso di nodo non raggiungibile, puoi forzare la rimozione con:

pvecm delnode <nome-nodo> –force

  • Controlla “/etc/pve/nodes/” sugli altri nodi per rimuovere eventuali cartelle residue che influenzano la visualizzazione nella GUI.

Eliminare “/etc/pve/nodes/<nome>” sui nodi rimanenti solo se continua a comparire nella UI dopo la rimozione.

Nota: Se il cluster ha solo due nodi, può verificarsi perdita di quorum dopo la rimozione: in questi casi l’opzione –force (pvecm delnode <nome-nodo> –force) e/o la modifica del quorum con il comando”pvecm expected 1” può essere necessaria.


By: Alessandro Romeo – Enjoy 👍