Hai semuanya, apa kabar? Ini adalah tulisan lanjutan, masih tentang Ceph juga. . Di tulisan sebelumnya, kita sudah belajar secara singkat bagaimana Ceph menyimpan datanya.
Apabila kita sudah setup Ceph, ada beberapa parameter seperti Size = 3 & Min Size = 2 Apa maksudnya? Contohnya adalah pada keterangan pool di bawah ini:

Strategi Replikasi, Mengapa Harus 3?
Secara default, Ceph mengelompokkan data dalam replika berjumlah 3. Artinya, tiap satu data, Ceph akan membuat salinan lagi hingga berjumlah 3 dan disebar ke OSD.
Dengan tiga buah replika, data bisa lebih aman. Misalnya ada salah satu server yang down atau rusak, data masih aman.
Min Size = Batas Toleransi Operasional
Bedanya, Min Size adalah jumlah minimum replika yang tersedia agar data dianggap layak digunakan atau usable.
Misalnya, satu disk mati, jumlah replika yang sehat tinggal 2 (misalnya sebelumnya adalah 3). Karena min size yang diset adalah 2, Ceph menyatakan bahwa data masih lengkap dan aman untuk dilakukan proses r/w.
Apabila nilai replika yang tersedia di bawah nilai min size, Ceph akan mengunci Placement Group (PG) dan statusnya berubah menjadi read-only.
Statusnya menjadi read-only karena alasan keamanan. Karena Ceph lebih memilih menghentikan proses r/w daripada tetap lanjut r/w pada jumlah replika di bawah min size karena apabila lanjut, lebih berisiko.
Misalnya, saat data masih ditulis ke disk yang masih aktif dan tiba-tiba disk tersebut corrupt, maka kita tidak punya salinan “sehat” sama sekali. Risiko split brain juga menjadi risiko lain apabila Ceph tetap memaksa proses r/w berjalan saat jumlah replika lebih rendah daripada min size.
Autonomous & Rebalancing
Ceph memiliki fitur self-healing yang memungkinkan untuk “pemulihan” apabila ada gangguan pada OSD. Misalnya ada OSD yang mati, Ceph akan mencari replika yang sehat di disk/OSD lain, lalu menyalinnya ke ruang yang tersedia untuk memenuhi kuota Size tadi.
Selain itu, Ceph juga mendukung mekanisme rebalancing. Misalnya salah satu disk sudah hampir penuh, namun disk lain masih kosong/lega. Ceph akan melakukan rebalancing dan load akan disebarkan di belakang layar agar distribusi penyimpanan lebih merata di seluruh cluster.
Penutup
Kesimpulannya, angka Size 3 dan Min Size 2 bukan cuma aturan teknis. Dengan konfigurasi ini, Ceph memberikan kita waktu untuk cek (dan memperbaiki disk yang rusak) tanpa harus panik kehilangan data. Di dunia storage, lebih baik sistem berhenti menulis sejenak (Read-Only) daripada menulis data yang tidak punya cadangan sama sekali.




