Amazon Minta Maaf Soal Gangguan AWS, Jabarkan Penyebab dan Langkah Preventif
Amazon akhirnya buka suara soal gangguan besar yang melanda layanan AWS (Amazon Web Services) awal pekan lalu. Dalam laporan pasca-insiden di website resminya, Amazon mengungkap penyebab utama gangguan berasal dari kegagalan besar pada sistem DNS internal DynamoDB. Masalah ini membuat banyak situs dan aplikasi di seluruh dunia mulai dari Canva, Reddit, Roblox, Zoom dan lainnya tidak bisa diakses selama lebih dari 14 jam.
Amazon menjelaskan, masalah bermula dari “race condition” atau benturan proses pada sistem pengelolaan DNS DynamoDB. Bug ini membuat seluruh alamat IP untuk endpoint regional di kawasan US-EAST-1 (Virginia Utara) terhapus secara tidak sengaja. Akibatnya, semua layanan yang bergantung pada DynamoDB langsung gagal terhubung, termasuk aplikasi milik klien dan sistem internal AWS sendiri.
Gangguan ini kemudian memicu efek berantai di infrastruktur AWS, membuat sistem otomatis tidak mampu memperbaiki kesalahan secara mandiri. Amazon akhirnya harus turun tangan secara manual untuk menstabilkan jaringan dan memulihkan DNS yang rusak. Proses perbaikan dilakukan bertahap hingga semua layanan kembali normal keesokan harinya.
Amazon Minta Maaf dan Terapkan Langkah Preventif
Sebagai langkah pencegahan agar kasus yang sama tidak terulang, Amazon menyebut sudah menonaktifkan sistem otomatis DNS yang bermasalah di seluruh dunia. Mereka juga menambahkan mekanisme perlindungan baru, peningkatan sistem throttle, serta serangkaian tes tambahan untuk mencegah bug serupa muncul lagi.
Pada akhir rilis, Amazon-pun menyampaikan permintaan maaf atas gangguan yang terjadi pada AWS dan menyebabkan dampak besar bagi klien dan bisnis mereka. Perusahaan berjanji akan terus memperbaiki sistem demi menjaga keandalan layanan AWS ke depannya. Kalian sendiri sempat terdampak waktu AWS sempat down kemarin?















