De mi Manual de Proxmox VE 4.x: Solución de Problemas (P7) [Cometí un error grave: ¡Un clúster con solamente 2 nodos… y ahora le quité uno!]

Saludos nuevamente.

Primero que todo, disculpas por la tardanza.

Ahora bien, luego de no escribir durante de 6 meses en el blog, vengo con un post que, a mi juicio, les va a servir a muchos.

Se acuerdan del post sobre la configuración de un Clúster de Proxmox VE, donde les mostré el proceso de creación, modificación y eliminación de nodos en el mismo, claro, siempre recalcando que mínimo con 3 nodos. Entonces, sabiendo eso, cometí el error de crear un clúster con solamente dos nodos, el cual cada vez que sufría un apagón y me dejaba uno de los dos nodos tendido en el suelo, aquello se me convertía en una verdadera tormenta eléctrica.

Ahora que estoy “robándome” los nodos de una infraestructura para otra, uno de los elementos en el proceso fue el segundo nodo del clúster antiguo. Por tanto, para poder prevenir cualquier problema futuro, y mientras esté usando la infra vieja, debo eliminar definitivamente este nodo de dicho clúster, cuyo proceso describiré a continuación.

Eliminación de un nodo en un clúster de solamente dos nodos

Antes de explicarles el proceso, una vez más recalco que el número mínimo de nodos para crear un Clúster de Proxmox VE 4.x es de 3, por lo que si se ha creado uno con dos nodos, se convierten en un verdadero problema.

Entrando en materia, al tener el segundo nodo caído, se corre el riesgo de que si se reinicia el único nodo vivo, ningún EV iniciará porque no se ha alcanzado el quorum necesario para levantar los recursos del clúster: los EVs. Entonces, para evitar eso antes de que ocurra la catástrofe, lo primero que nos viene a la mente como medida desesperada es quitar el nodo que ya no existe:

root@prx4-n0:~# pvecm delnode prx4-n1

cluster not ready – no quorum?

Pero recuerden: el clúster no está operativo porque cada nodo tiene un voto y falta uno de ellos, por lo que falla la operación. Esto se convierte en un problema serio. ¿Qué hacer? Primero que todo, ir a los foros de Proxmox VE, específicamente a esta URL:

https://forum.proxmox.com/threads/removing-cluster-nodes-cluster-not-ready-no-quorum.23622/

Como dice el hilo en el foro, que fue lo primero que se me ocurrió, fue darle 2 como número de votos total, pero me sale esto:

root@prx4-n0:~# pvecm expected 2
Unable to set expected votes: CS_ERR_INVALID_PARAM

¿Por qué? Pues, porque esto es aplicable a un clúster con 3 nodos donde uno de ellos haya fallecido, no a uno con 2. Ah, ¿cómo hago entonces? Pues, especificar 1 a Corosync como número de votos totales para que funcione el clúster (o sea, el estado inicial de un nodo Proxmox VE sin estar integrado a clúster alguno):

root@prx4-n0:~# pvecm expected 1

Ya solucionado el problema, procedemos a eliminar el nodo en cuestión:

root@prx4-n0:~# pvecm delnode prx4-n1
Killing node 2

¡¡¡Bien!!! Eliminado el nodo definitivamente. Pero la alegría no te puede cegar, dado que el siguiente paso que hay que realizar es chequear el estado del cluster, o mejor, lo que queda de él:

root@prx4-n0:~# pvecm status
Quorum information
——————
Date: Sat Nov 11 12:19:40 2017
Quorum provider: corosync_votequorum
Nodes: 1
Node ID: 0x00000001
Ring ID: 1/4432
Quorate: Yes

Votequorum information
———————-
Expected votes: 1
Highest expected: 1
Total votes: 1
Quorum: 1
Flags: Quorate

Membership information
———————-
Nodeid Votes Name
0x00000001 1 10.0.1.18 (local)

Lo cual indica que todo volvió a su estado inicial antes de llevar a cabo la locura de tener ese clúster de sólo 2 nodos.

De seguro muchos se preguntarán por qué no hice eso antes, bueno, no lo hice antes por haraganería, y ahora tuve que hacerlo porque necesitaba habilitar un almacenamiento de tipo subdirectorio y no podía porque el difunto clúster no estaba operativo. 😀

Espero le sirva. 🙂

Acerca de Hector Suarez Planas

Es Licenciado en Ciencia de la Computación (3 de julio de 2002). Ha sido Administrador de Red en varias organizaciones, Programador y Analista de Sistemas. Actualmente se desempeña como Administrador de Red del Telecentro Tele Turquino de Santiago de Cuba. Tiene experiencia con sistemas Windows y GNU/Linux, Infraestructura de Redes (Cisco, AlliedTelesis, Netgear y HP ProCurve, Vyatta/VyOS), Servidores tanto físicos como virtuales (plataformas VMWare, Proxmox VE y Xen), Sistemas de Seguridad Informática (Snort/Suricata IDS, appliances AlienVault OSSIM), programador (Delphi, C++ Builder, Perl [poco], Python [algo]), entre otras cosas. Actualmente estoy incursionando en todo lo que tiene relación con Cloud Computing (OpenStack) y Centros de Datos. :-)
Esta entrada fue publicada en Proxmox VE. Guarda el enlace permanente.

18 respuestas a De mi Manual de Proxmox VE 4.x: Solución de Problemas (P7) [Cometí un error grave: ¡Un clúster con solamente 2 nodos… y ahora le quité uno!]

  1. Osmany dijo:

    Hola hector, que bueno que volviste, estoy haciendo unas pruebas de Proxmox 5 y tengo una duda, lo instale sobre un disco de 1TB y me dice en la pestaña de almacenamiento que de espacio solo tengo unos 90GB, y me salto la duda, donde metio lo demas, como esta en LVM no veo como agregar un almacenamiento local como directorio local y ahi guardar las vms,disco,contenedores,etc

  2. leo dijo:

    Necesito añadir un servidor Huawei por iSCSI a un Proxmox 5.0

  3. ybritozamora dijo:

    Saludos, Hector colega con mucha experiencia en el tema.
    Tengo un problema: estoy implementando el proxmox 4.4 (tengo el 5.1 pero no se si instalarlo con este iso reciente) en mi empresa y deseo implementar en el junto con un servidor de correo en LINUX, un servidor Windows server pero con el 2016 para el Active Directory, pero el instalador del Virtio que poseo solo incluye hasta el WS2012r2.
    La pregunta resulta: como pudeo instalar el WS 2016.
    Me podrías ayudar en esto.

    Saludos cordiales

    • Hector Suarez Planas dijo:

      Saludos, ybritozamora.

      Primero que todo, gracias por su comentario.

      Puede usar perfectamente la verisón 5.1 de Proxmox VE sin problemas. Ah, eso sí, le sugiero descargue la versión 1.146 de la imagen de VirtIO para que use los driver en su más reciente versión.

      Espero le sirva. 🙂

  4. henryced1988 dijo:

    Saludos soy nuevo en esto necesito buscar el samba 4 como puedo hace

  5. jorgep dijo:

    Saludos Hector:

    Antes que nada felicitarlo por tan buen sitio dedicado a brindar información muy util a toda persona en el mundo de las redes.
    Recién monté dos servidores de proxmox en cluster guiado por tus post y van de maravilla pero presento un problema con la hora. La hora del proxmox y el bios no coincide aun estando la configuracion regional del proxmox en America/Havana. Si la trato cambiar desde la consola del proxmox con hwclock no lo hace. Como puedo solucionar el problema porque cada vez que se va la corriente tengo que ajustar la hora de el servidor de dominio virtual manualmente?

    • Hector Suarez Planas dijo:

      Saludos, JorgeP.

      Primero que todo, gracias por su comentario.

      La solución a su problema está en usar un Servidor de Hora (NTP) del cual su nodo se sincronice. En mi caso, yo tengo 4 NTPs en mi red (dos externos y dos internos, uno principal y otro de respaldo), sí, suena raro, pero así es. Entonces, a la hora de obtener la hora tengo dos fuentes: la primera, tomando la hora del NTP de mi proveedor; la segunda, “robándome” la hora del servicio Web del dominio Mail.RU (¿por qué ese? Pues, porque Yahoo.es y Google.com resultaron ser decepcionates para mi, hasta ahora mail.ru no me ha dado problemas).

      Espero te sirva.

      🙂

  6. el_yoe dijo:

    Saludos Hector, le felicito al igual han echo otros por tan buen sitio. Tengo la siguiente duda:
    Descargué una PC virtual de un sistema que quiero montar y el formato es vmdk, la probé en VMWare y funciona perfectamente, pero necesito montarla en Proxmox 5.1. El tema es que me han dicho que hay que convertirla antes pero no se exactamente cual es el proceso para, primero, que quede en un solo archivo, y luego para convertirla y alarla desde el proxmox. Espero que me pueda ayudar, saludos.

    • Hector Suarez Planas dijo:

      Saludos, el_yoe.

      Primero que todo, gracias por su comentario.

      Eso lo puede hacer migrando el disco duro VMDK hacia otro storage. Por ejemplo, d ehacerlo hacia el almacenamiento local, Proxmox VE convertirá dicha imagen vmdk a un volúmen lógico LVM.

      Espero le sirva. 🙂

  7. Joel dijo:

    Hola Hector
    Cuando te refieres a tres serian dos proxmox y un server NFS
    o tres Proxmox y un NFS?

  8. Edmundo Fierro dijo:

    Les comparto, quizá sirva. A modo de probar y aprender, monté un segundo servidor en cluster con mi servidor personal. No arrancó el cluster, ni las VMs, después de leer y batallar un poco decidí dejar de lado el cluster, procedí a borrar el nodo que ya no utilizaría, continuó el error.

    Una vez que se baja el quorum a 1 (o al numero adecuado, dependiendo de la cantidad de servidores en el cluster) las VMs que no iniciaban, inician. Pero al reiniciar el servidor, volvió a presentar el mismo error.

    Intenté en vano, editar /etc/pve/cluster.conf, que si están abajo los servicios pve-cluster y corosync, el archivo esta vacío!… si activo los servicios, dicho conf esta protegido contra lectura y edición.
    Que me funcionó? detener pve-cluster con systemctl stop pve-cluster, luego volví a borrar el nodo con pvecm delnode NOMBRE DEL NODO, esto me dio como salida “killing node 2”.

    Con esto, solucioné finalmente el problema de borrar el nodo.

    Saludos a todos, y en especial a ti Héctor, muy buena idea de mantener este sitio y manual.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *