Kenapa Jumlah Vote Lebih Penting dari Jumlah Node di HA Proxmox VE

Hai semuanya, apa kabar? Mungkin teman-teman (saya juga) ada yang pernah berpikir bahwa semakin banyak node yang digunakan, maka cluster semakin aman. Bisa jadi benar, tapi.. tidak selalu. Sebenarnya, yang lebih menentukan adalah jumlah vote dan apakah quorum tercapai atau tidak.

Proxmox VE dan Multi-Master

Proxmox VE menggunakan konsep multi-master yang artinya semua node setara. Tidak ada “single master ” yang berkuasa. Kita juga dapat mengelola cluster dari node mana saja.
image host
Karena semua node setara, dibutuhkan mekanisme untuk menentukan siapa yang bisa mengambil keputusan saat terjadi kendala komunikasi. Di sinilah konsep vote & quorum berperan.

Vote di Proxmox VE

Secara sederhana, vote adalah hak suara dari sebuah node. Secara default satu node memiliki satu buah vote. Vote digunakan oleh Corosync untuk beberapa hal. Misalnya menentukan kondisi cluster, mengambil keputusan saat ada gangguan, dan mencegah kondisi split-brain.
image host
Misalnya ada cluster dengan anggota sebanyak 3 node, maka total votes-nya adalah 3. Begitu juga dengan cluster berisi 4 node, maka total votes-nya adalah 4.

Quorum di Proxmox VE

Quorum adalah kondisi di mana cluster memiliki cukup vote untuk dianggap sah dan aman melanjutkan operasi/berjalan. Rumus sederhana dari quorum adalah sebesar lebih dari 50% jumlah vote. Misalnya, untuk cluster dengan 3 node, nilai vote yang dianggap mencapai quorum adalah sebesar 2.

Contoh Perhitungan Quorum

3 Node

Nilai votes untuk mencapai quorum= 2. Artinya, cluster masih aman selama 2 node masih aktif. Artinya, yang boleh mati hanya 1 node. Apabila node yang mati ada 2 buah, maka quorum hilang atau tidak tercapai.

4 Node

Niai votes untuk mencapai quorum = 3. Artinya, cluster harus punya 3 node yang aktif. Yang boleh mati hanya 1 node. Apabila node yang mati ada 2 buah, maka quorum hilang atau tidak tercapai.

Kadang hal seperti ini yang dapat memicu semacam miskonsepsi 4 node lebih baik dari 3 node. Tidak sepenuhnya benar, karena secara quorum, toleransi kegagalannya sama-sama hanya 1 node.

Maka dari itu, implementasi Proxmox VE lebih disarankan untuk menggunakan node berjumlah ganjil (minimal 3) untuk keperluan high availability.
image host

Apakah Penggunaan 4 Node Sia-Sia?

Tidak juga. Maksudnya adalah penggunaan node berjumlah ganjil (dalam hal ini, 4) dalam konteks quorum & HA toleransinya sama seperti 3 node, yaitu hanya 1 node yang boleh mati

Penggunaan 4 node masih berguna dalam konteks umum. Misalya kapasitas resource (CPU, RAM, storage) yang lebih besar, memungkinkan distribusi beban VM yang lebih setara/optimal, dan juga proses maintenance yang bisa lebih fleksibel.

Singkatnya, 4 node tetap bermanfaat secara operasional, meskipun peningkatan toleransi HA baru benar-benar terasa saat cluster memiliki jumlah vote ganjil (misalnya 5 node).

Quorum dan HA

HA di Proxmox VE bergantung pada quorum. Agar HA dapat berjalan, cluster harus quorate/ mencapai quorum, memiliki anggota vote minimal 3 dan disarankan berjumlah ganjil.

Jumlah ganjil disarankan agar tidak ada risiko nilai vote yang imbang seperti kalau menggunakan cluster genap. Misalnya:

  • 3 votequorum = 2
  • 5 votequorum = 3

Dengan pola ini, selalu ada mayoritas yang jelas.

Apabila menggunakan 2 node, apakah bisa menggunakan HA? Jawabannya, bisa. Namun perlu tambahan vote (agar jumlah anggota vote menjadi 3) dengan sistem qdevice. qdevice adalah sistem untuk menambah satu vote ekstra dan hanya difungsikan sebagai penentu suara/tie-breaker agar cluster dapat mencapai quorum.

Karena, apabila tidak mencapai quorum, Proxmox tidak dapat memindahkan VM (HA) dan sistem lebih memilih “berhenti” daripada mengambil keputusan yang salah.

Penutup

Dalam cluster Proxmox VE, yang paling menentukan HA bukanlah jumlah node, melainkan jumlah vote dan tercapainya quorum. Tanpa quorum, cluster tidak dapat mengambil keputusan yang aman dan HA tidak dapat berjalan.

Maka dari itu, jumlah vote ganjil lebih disarankan, karena selalu menghasilkan mayoritas yang jelas. Penambahan node genap (misalnya 4 node) memang menambah kapasitas resource, tetapi tidak meningkatkan toleransi kegagalan HA dibanding 3 node.

Untuk tulisan kali ini sampai di sini dulu ya. Sampai jumpa. Bye.

By Zaidan

Leave a Reply

Your email address will not be published. Required fields are marked *