Apa yang tidak Mematikan Kita, akan Mendewasakan Kita
Beberapa hari yang lalu, salah satu staff engineer Excellent melakukan kesalahan yang cukup fatal. Ia melakukan modifikasi konfigurasi pada salah satu cluster cloud server yang digunakan oleh banyak klien Excellent.
Tujuannya baik, untuk meningkatkan kualitas dan performa sistem, namun lupa aspek prosedural yang seharusnya dijalani, antara lain :
- Untuk perubahan/modifikasi konfgurasi sistem production, harus ada approval terlebih dahulu
- Harus ada tahap simulasi/sandbox. Ujicoba terlebih dahulu di server simulasi dan ada stress testing sebelum live
Harus ada monitoring pasca perubahan sistem. Jadi tidak bisa dan tidak boleh berasumsi segalanya baik-baik saja - Karena mengabaikan aspek diatas, akibatnya timbul gangguan yang tidak perlu ke sisi klien. Mulanya satu dua klien yang menginformasikan adanya gangguan, namun beberapa menit kemudian muncul pesan dari klien lain terkait adanya gangguan sistem. Setelah saya check, ternyata ada perubahan konfigurasi sistem yang featurenya belum diaktifkan. Meski akhirnya bisa diatasi, namun hal ini membuktikan ada prosedur yang harus distandarisasikan di Excellent.
Disisi lain, staff engineer ini jadi merasa bersalah. Mungkin karena melihat pesan-pesan saya di telegram group internal Excellent dan juga kontak saya via telp yang sifatnya urgent dan mendesak, sepertinya jadi terlihat seperti kalap, hehehe.
Terus terang hal yang tidak perlu terjadi ini membuat saya kecewa, namun bukan berarti saya kecewa pada si staff melainkan kecewa karena tidak bisa 100% menjaga kualitas dan reputasi layanan Excellent.
Meski demikian, saya menulis singkat di Telegram group untuk jawaban permintaan maafnya : “Tidak masalah. Apa yang tidak mematikan kita akan mendewasakan kita”.
Caelah, sok puitis banget, hehehe…
Maksudnya adalah, tidak usah meratapi dan menyesali imbas yang sudah terjadi, asalkan kita bisa belajar dan memetik hikmah dari kejadian yang ada. Berbekal kesalahan tersebut, Excellent bisa memperbaiki prosedur dan bisa mengantisipasi kemungkinan terjadinya gangguan sejenis dimasa mendatang.
Was mich nicht umbringt, macht mich stärker. What does not kill me, makes me stronger. — Friedrich Nietzsche
berapa lama sampe normalnya pak? sudah ada backup config ?
saya juga kadang nekat2an gitu, karena PD nya,selain itu belum ada prosedur dan server simulasi.
@Nurhidayat,
Normal kembali beberapa jam, mestinya dalam hitungan menit. Baru terdeteksi setelah ada komplain dari user 🙁
Backup config selalu ada dan statusnya wajib, jadi secara prinsip tidak ada issue untuk mengembalikan perubahan yang sempat dilakukan
“Tidak masalah. Apa yang tidak mematikan kita akan mendewasakan kita”. kalimat yang sejuk menenangkan benar benar akan membuat kita dewasa
Terkadang kesalahan memang menjadi sesuatu yang berharga untuk bisa lebih baik ke depan..
kita belajar dari kesalahan mungkin kesalahan itu menjadi kita lebih baik
pengalaman guru terbaik
Terkadang hikmah itu ada dimana saja, dia baru kita ketahui setelah ada suatu kejadian yang kemudian menjadikan kita belajar darinya. Sebagai manusaia kita adalah makhluq pembelajar untuk kemudian bisa sukses menapaki kehidupan yang singkat ini…..salam sukses selalu,,,,
Sangat betul judulnya membuat kita sadar