Uptime 99.99% dan Sebuah Seni Kapan Harus Berhenti

Akhir pekan kemarin saya dan beberapa teman mendaki sebuah gunung di Jawa Tengah. Kami sudah merencanakan banyak hal, deep talk di bawah bintang, melihat milky way, lalu menutup malam dengan tidur nyaman sebelum muncak demi sunrise. Tapi alam berkata lain. Angin kencang, hujan deras, kabut tebal membasahi tubuh, tas, pakaian, bahkan tenda yang kami bawa untuk beristirahat. Akhirnya kami memutuskan berhenti di camp area, mengemas barang kembali karena hujan tak kunjung reda, lalu “tektok” turun sambil menanggung beban yang makin berat.

Waktu jalan turun, saya jadi berpikir kadang kita memang perlu tahu kapan harus berhenti. Rencana boleh setinggi langit, tapi alam lah yang menentukan. Sama seperti di dunia infrastruktur. Banyak yang bilang “pokoknya harus SLA 99.99%.” Tentu saja terdengar keren. Tapi angka itu artinya downtime maksimal cuma 4–5 menit sebulan.

Untuk konteks:

  • 99% uptime = ~7 jam 18 menit downtime per bulan.
  • 99.9% uptime = ~43 menit per bulan.
  • 99.99% uptime = ~4.5 menit per bulan.
  • 99.999% uptime = ~26 detik per bulan.

Semakin sempit target downtime, semakin mahal dan rumit jalur yang harus ditempuh. Multi-region failover, load balancing canggih, disaster recovery otomatis, semua itu bukan cuma soal teknis, tapi juga soal biaya, waktu, dan tim yang sanggup merawatnya. Sama seperti mendaki, untuk sampai puncak dengan aman perlu persiapan ekstra, logistik lebih berat, dan stamina yang kuat.

Jangan salah sangka, membeli layanan cloud tidak otomatis menjamin 99.99% uptime aplikasi kita. SLA yang mereka berikan biasanya hanya untuk VM atau storage, bukan end-to-end layanan kita. Jika proses deployment gagal, ada bug di aplikasi, atau database overload karena query yang di-set terlalu kompleks, layanan cloud tak akan bisa menolong. Oleh sebab itu, sebelum bilang “kita harus 99.99%” ada baiknya kita berhenti sejenak, narik nafas, dan bertanya, siapa pengguna kita? Seberapa kritis layanan kita buat mereka? Seberapa besar dampak downtime? Dan yang paling jujur, sanggup nggak kita menanggung harga yang harus dibayar?

Karena pada akhirnya, seni membangun sistem yang andal bukan hanya soal seberapa tinggi target yang kita tulis di proposal, tapi juga soal seberapa bijak kita memutuskan untuk berhenti, mundur selangkah, atau memilih jalur lain yang lebih aman dan realistis. Kadang, yang lebih penting bukan sampai puncak, tapi memastikan semua orang bisa pulang dengan selamat 🙂

Leave a comment