Troubleshoot Ceph Cluster: 1 hosts fail cephadm check - 13

 

Masih berkutat di ceph cluster, kali ini saya menemukan sebuah pesan error yang membuat kondisi ceph cluster saya berstatus HEALTH_WARN. Berdasarkan informasi yang tertampil disitu saya di mengetahui bahwa ada 1 host yang fail ketika saya cek lewat perintah:

hasilnya seperti ini:


jika melihat pada baris services yang menyala, disitu terdiri dari:

  • mon: ada 3 server yang menyala (1 active, 2 standby)
  • mgr: ada 3 server yang menyala (1 active, 2 standby)
  • mds: ada 2 server menyala (1 active, 1 standby)
  • osd: ada 3 server menyala (3 active)

menurut saya semua layanan menyala dengan baik, lalu saya coba check lewat cephadm shell yang saya install di server1, setelah berhasil masuk ke dalam cephadm shell kemudian saya menjalankan perintah:

hasilnya adalah sebagai berikut:


ternyata server1 statusnya offline, hal ini dikarenakan server1 sebelumnya sempat saya restart jadi oleh ceph cluster di set sebagai offline, untuk mengatasi hal tersebut saya cukup menjalankan perintah:


untuk memasukkan kembali server1 ke dalam ceph cluster, hasilnya adalah sebagai berikut:


kemudian setelah perintah itu berhasil saya jalankan, kembali saya jalankan perintah di bawah ini untuk mengecek list status seluruh host anggota cluster:


hasilnya adalah seperti ini:


status offline server1 sudah hilang dan saya coba lihat lagi status ceph cluster dengan perintah:


berikut ini  tampilan keluaran perintah di atas:


hasilnya ceph cluster sudah berstatus HEALTH_OK kembali. Sekian catatan troubleshooting ini, sampai jumpa lagi di catatan berikutnya. Jika ada pertanyaan silahkan tulis di kolom komentar.



Comments