Cara memverifikasi status AWS seperti pro: Kesehatan, ACM, dan EC2

Pembaharuan Terakhir: 10/21/2025
  • Gunakan AWS Health Dashboard dan EventBridge untuk kejadian yang mungkin terjadi dan dalam waktu nyata.
  • Kontrol RenewalStatus ACM dan pemberitahuan sebelumnya kepada karyawan.
  • Vigila memeriksa EC2 dan metrik CloudWatch untuk mengaktifkan alarm dan pemulihan.
  • Ini adalah tanda alami regional AWS dan memvalidasi wilayah pada diagnostik.

Estado y salud de AWS

Saat Anda membutuhkan verificar el estado de AWS, tidak ada yang bisa dilihat jika layanan “berfungsi atau tidak”. Clave adalah kombinasi dari panel salud, peringatan pada saat nyata dan bahaya khusus dari kejadian tersebut untuk memahami apa yang terjadi dan bagaimana dampaknya. Jika Anda bekerja dengan muatan yang kritis, antisipasilah insiden atau deteksi kerusakan pada limbah dapat terjadi lebih cepat dari yang lama.

Panduan ini menemukan semua yang diperlukan untuk mengontrol status AWS dengan cara yang efektif: dari AWS Health Dashboard dan integrasi dengan EventBridge, telah memasuki masa percobaan renovasi sertifikasi di ACM dan verifikasi pada contoh EC2 (termasuk metrik CloudWatch dan opsi pemulihan). Selain itu, ada baiknya jika konsol tidak memiliki muatan atau layanan yang terbatas di wilayah Anda.

AWS Health Dashboard: Anda memiliki bagian untuk status layanan

AWS Health Dashboard menyediakan informasi mengenai gangguan layanan, kejadian saat ini, dan pemeliharaan yang direncanakan. Ini adalah layanan terintegrasi dalam akun Anda, tidak perlu konfigurasi dan Anda dapat mengaksesnya jika sudah diautentikasi. Hasilnya akan sangat berguna jika tidak ada beberapa kali yang nyata (misalnya, contoh EC2 yang baru saja dipertahankan).

Memperhatikan detail penting: layanan AWS di wilayah regional. Jika berkonsultasi dengan panel salud, pilih wilayah yang benar dari pemilih yang sesuai; Sebaliknya, Anda tidak dapat melihat kejadian yang relevan untuk kejadian yang berulang ini.

Mulai bulan September 2023, ketika ada acara publik AWS Health, URL dari navegador akan diperbarui dengan sebuah tautan yang mendalam pada acara tersebut. Ketika bagian ini dimasukkan atau dibuka, itu adalah tampilan daftar acara dengan ventilasi yang muncul dari acara yang Anda bawa, yang memfasilitasi bagian berikutnya dan kolaborasi dengan peralatan Anda.

Jika suatu hari konsol tidak memuat atau mengembangkan kesalahan tipo 404, harap hubungi sebagiannya. Yang pertama adalah meninjau AWS Health Dashboard untuk memeriksa apakah ada aktivitas yang memengaruhi layanan yang ingin Anda gunakan. Setelah itu, Anda dapat mencoba menghapus cache dan cookie di browser, ubah ke browser lain dan konfirmasikan ke administrator Anda bahwa tidak ada blok yang memiliki domain Amazon (misalnya, aws.amazon.com).

Menerima acara yang disiarkan: EventBridge dari RSS

Meskipun ada feed RSS dengan acara salud, formatnya dapat diubah dengan waktu yang sama, karena itu mendasarkan proses pengambilan program pada hal yang paling mungkin dilakukan. Mengikis konsumsi langsung RSS dapat mematikan permainan jika Anda menyesuaikan konten atau kontennya.

Rekomendasinya jelas: mengintegrasikan AWS Health dengan Amazon EventBridge. Ini adalah cara untuk menerima peristiwa yang konsisten, dengan format yang stabil, dan daftar untuk memasuki tujuan seperti Lambda, cola, pemberitahuan, atau tabel internal. Ini berarti Anda mengizinkan respons otomatis, mencatat kejadian, dan menghasilkan alarm tanpa bergantung pada format yang rapuh.

Dengan kata lain, jika Anda ingin kuat dan tangguh, EventBridge adalah cara yang tepat untuk memantau peristiwa di AWS Health. Selain itu, Anda dapat memasukkan informasi, menghubungkan layanan, melengkapi SLA internal, dan menjalankan persyaratan kapan pun Anda mau.

ACM: bagaimana cara memeriksa status renovasi bersertifikat Anda

Dengan AWS Certificate Manager (ACM) Anda dapat mengetahui apakah sertifikat Anda telah diperbarui dengan benar. Sertifikasi ini memenuhi syarat untuk renovasi otomatis jika dikaitkan dengan layanan AWS lainnya (seperti Elastic Load Balancing atau CloudFront) atau jika diekspor dari emisi atau renovasi terakhir Anda. Persyaratan ini adalah dasar mengapa ACM akan melakukan renovasi tanpa perlu melakukan intervensi.

Saat Anda memulai proses renovasi, ACM akan memulai proses renovasi Status pembaruan dalam rincian sertifikasi. Anda dapat berkonsultasi dengan ini dari konsol, API, AWS CLI, atau bahkan melalui AWS Health Dashboard. Jika Anda menggunakan konsol, ada berbagai kemungkinan yang mungkin terjadi pada keadaan ini; bentuknya serupa jika dipantulkan di panel salud.

Dalam hasil otomatis, Anda dapat menggunakan API ACM. Tentang Tindakan Jelaskan Sertifikat yang diperoleh dari rincian sertifikasi, termasuk status renovasi Anda. Untuk Java (dalam bahasa lain) Anda dapat mendasarkan diri pada SDK AWS dan berkonsultasi secara berkala ini untuk mengantisipasi panggilan atau mendeteksi kunci validasi.

Jika Anda lebih suka jalur komando, la AWS CLI untuk mengembangkan tahap renovasiContoh sederhananya adalah:

aws acm describe-certificate --certificate-arn arn:aws:acm:REGION:ACCOUNT:certificate/CERTIFICATE_ID

Dalam jawaban JSON, matikan di tengah jalan Status Pembaruan. Jika tidak muncul, berarti ACM hari ini belum menjalankan proses renovasi yang sedang berlangsung untuk sertifikasi ini. Ini adalah detail yang tidak Anda sadari, tetapi Anda menunjukkan dengan jelas bahwa itu adalah sepeda.

ACM bermaksud memperbarui secara otomatis dengan sertifikasi 60 hari sebelum kadaluarsa. Jika motivasi tertentu tidak dapat dilakukan (misalnya, masalah dengan validasi domain), lihat pemberitahuan di AWS Health Dashboard dengan antelación: 45, 30, 15, 7, 3 y 1 hari sebelum caducidad. Acara ini tidak memerlukan konfigurasi tambahan ini tersedia untuk setiap pengguna yang diautentikasi dalam akun Anda, cara peralatan tersebut dapat bereaksi pada suatu waktu.

Ketika konsol tidak mengetahui atau melakukan kesalahan: cepat

Jika Anda topas dengan 404 atau la consola no carga, fokuskan pada AWS Health Dashboard dan wilayah tujuan Anda. Acara publik atau manajemen regional dapat dijelaskan karena tidak ada beberapa konsol atau layanan tertentu.

Si no hay eventos relevantes, bersihkan cache dan cookie browser Anda, menggunakan navegador lain dan, jika Anda berada di perusahaan merah, lihatlah peralatan Anda yang memverifikasi bahwa tidak ada blok dominasi Amazon dan subdominium kritis.

Anda juga harus memastikan bahwa masalah tersebut tidak ada lagi yang terjadi pada akun Anda. Sebagai contoh, suatu instans EC2 dapat terjadi untuk menjaga atau mempengaruhi suatu peristiwa; Panel salud menampilkan informasi tersebut dan mengarahkannya ke ventilasi dan dampak.

Verifikasi keadaan instan EC2: pemeriksaan dan metrik

Amazon EC2 ejecuta gangguan otomatis dalam setiap instans dan eksekusi untuk mendeteksi masalah perangkat keras dan kejadian perangkat lunak yang dapat menghambat aplikasi Anda berfungsi secara normal. Estos memeriksa se realisasi setiap menit dan dapatkan hasil yang menunjukkan bahwa semuanya baik-baik saja atau jika memburuk.

Ketika semua verifikasi dilakukan, status globalnya adalah seperti itu OK. Jika ada kesalahan yang berbeda, keadaannya pas a terganggu (deteriorado). Permasalahan ini terintegrasi dalam layanan, Anda tidak dapat menonaktifkan atau menghapusnya, dan berapa banyak waktu yang tersedia untuk masalah yang mengundang peserta.

Setiap jenis pengujian dikaitkan dengan metrik di Amazon CloudWatch. Jika gagal dicentang, metriknya akan bertambah. Hal ini memungkinkan untuk menimbulkan kekhawatiran yang akan menyebabkan kesalahan deteksi pada keadaan, ya dalam sekejap beton dan eskalasi permukaan air.

Más aún, puedes apoyarte en alarm dan tindakan CloudWatch untuk mengotomatiskan jawaban. Misalnya, konfigurasikan alarm yang akan memperingatkan Anda ketika cek jatuh pada waktu tertentu, atau biasakan pemulihan otomatis jika kondisinya memburuk jika terjadi masalah pada hostnya.

Jika diperlukan ketahanan yang tinggi, tidak ada batasan yang perlu diwaspadai. Menggabungkan metrik status dengan Auto Scaling untuk memperbaiki keadaan yang memburuk dan menjaga kemampuan Anda tetap dapat dicapai tanpa manual intervensi, terutama dalam jumlah lalu lintas atau beban kerja yang masuk akal dalam latensi.

Uji coba status sistem

Ini adalah verifikasi yang dipantau infrastruktur AWS di bawahnya sesuai dengan instan Anda. Jika terjadi kegagalan, Anda mungkin memerlukan intervensi AWS atau tindakan yang dapat dilakukan dengan host lain untuk mengatasi masalah tersebut.

Dalam kasus yang ditangani oleh EBS, ada obat yang efektif penahan dan mulai saat itu juga. Tindakan ini, dalam sebagian besar skenario, memulihkan instans ke dalam host baru dan dapat menyelesaikan kegagalan platform. Jika Anda bekerja dengan instans respaldadas pada almacén de instancias (solo Linux), Anda dapat mengakhiri dan menginstal ulang instans tersebut, maka Anda harus menyajikan hal yang sama volume penyimpanan instan yang hilang dan datanya se pierden al detener.

Ketika terjadi kesalahan pada sistem, menambah metrik StatusCheckFailed_System. Hal ini sangat ideal untuk mengaktifkan alarm, memulai prosedur darurat atau, jika demikian, jika terjadi masalah jika dampaknya terus berlanjut.

Ada yang mati dengan Bare Metal: jika dimulai kembali dari sistem pengoperasiannya, Percobaan status sistem dapat menyebabkan kesalahan sementara. Ketika Anda tiba-tiba mendapatkan harga yang terjangkau, keadaan tersebut mungkin akan berubah tanpa perlu mengeluarkan nada ekstra.

Percobaan keadaan saat itu juga

Estas verificaciones analizan koneksi merah dan perangkat lunak propia instan. EC2 merealisasikan validasi permintaan ARP melalui antarmuka merah (NIC) untuk mengonfirmasi bahwa responsnya seperti yang diharapkan.

Ketika Anda gagal dalam percobaan instan, Anda mungkin memerlukannya tu intervención directa: memulai kembali instans, merevisi konfigurasi merah (misalnya, mengatur iptables atau firewall yang lalu lintasnya), menganalisis log sistem atau memeriksa agen merah yang merespons.

Al producirse un fallo, Anda akan menambah metrik StatusCheckFailed_Instance. Metrik ini sempurna untuk berbagai alarm dan menjalankan runbook diagnostik: setelah menyalin log, Anda harus segera mengeluarkan kontrol baru jika layanan tersebut tidak terdeteksi.

Jika Anda memeriksa sistem, di Bare Metal, reinicio dari SO dapat dipicu keadaan kesalahan sementara dalam pengujian instan. Saat proses penyelesaian selesai, verifikasi harus berubah menjadi OK tanpa komplikasi yang besar.

Percobaan status EBS tambahan

Percobaan ini direvisi jika Anda kalah volume Amazon EBS tambahan pada instans yang dapat diakses dan melengkapi E/S. Indikator yang mencerminkan kesalahan tersebut StatusCheckFailed_AttachedEBS, jenis biner ini, yang menunjukkan dampak ketika berbagai volume tidak dapat merealisasikan pengoperasian E/S.

Un fallo aquí apunta a masalah pada sub-bagian komputasi atau pada infrastruktur EBS. Anda dapat memastikan bahwa AWS mengurangi kejadian atau melakukan tindakan: mengganti volume yang terpengaruh, mencegah dan memulai instans untuk memindahkan host baru, atau bahkan membalas balasan IOPS jika mendeteksi tombol bot yang berkepanjangan.

Untuk ketahanan beban kerja, metrik ini disetujui crear alarmas en CloudWatch. Jika arsitektur Anda, Anda dapat melakukan perubahan yang berbeda karena kesalahan pada saat kedua atau area perangkat lain yang mendeteksi dampak secara perlahan, sehingga mengurangi waktu pengoperasian layanan.

Jika beban kerja Anda tidak mencapai E/S dan tidak ada tambahan volume, namun pengujian menunjukkan kerusakan, mencegah dan memulai instan dapat menyelesaikan masalah host yang mempengaruhi aksesibilitas volume. Lengkapi dengan metrik EBS dan CloudWatch untuk mendeteksi volume yang diperlukan untuk melakukan pekerjaan dan mengulangi pencegahan yang ada.

Dalam sebagian besar administrasi Auto Scaling, konfigurasikan kebijakan untuk mendeteksi kesalahan dalam pemeriksaan EBS tambahan dan memperbaiki instans yang terkena dampak. Ini akan menjaga keselamatan grup tanpa intervensi manual dan menghindari kerusakan yang berkepanjangan.

Alarm dan otomatisasi dengan CloudWatch dan Auto Scaling

Dengan semua metrik sebelumnya, CloudWatch akan mengonversi sistem Anda dengan tenang. Tentukan payung, buat alarm dan perintahkan tindakan: pemberitahuan, eksekusi fungsi Lambda, atau pemulihan instan ketika Anda merencanakan kondisi tertentu.

Jika diperlukan kelanjutan bisnis, pertimbangkan jangka waktu tertentu automatización y reemplazo: Penskalaan Otomatis dapat menghentikan instans dengan pemeriksaan yang memburuk dan lambat, sementara alarm mengoordinasikan respons dan memperingatkan saluran yang sudah ada (seperti, Slack, PagerDuty, yang digunakan).

Kombinasi metrik status, log, data, dan peristiwa AWS Health melalui EventBridge adalah satu pandangan holistik. Anda dapat mengetahui apakah masalahnya ada di aplikasi Anda, di instans, di volume EBS, atau di platform di bawahnya, dan bertindak dengan presisi yang diperlukan.

Praktik yang baik untuk memverifikasi status AWS dengan kabel

Centraliza la observabilidad: menggunakan AWS Health Dashboard untuk konteks platform dan CloudWatch untuk metrik operasi. Ini adalah dua hal yang tidak dapat dijelaskan secara detail penting dalam setiap kapasitas.

Untuk sertifikasi, tidak ada yang bisa dilakukan. Mengotomatiskan revisi RenewalStatus di ACM, dan merespons pemberitahuan pada panel salud a 45, 30, 15, 7, 3 dan 1 hari kelahiran. Jika ada yang gagal, ada batasnya.

En EC2, activa alarmas sobre StatusCheckFailed_System, StatusCheckFailed_Instance y StatusCheckFailed_AttachedEBS. Tindakan terkait: pemulihan, pemulihan, perubahan karena kesalahan, atau penerapan ulang melalui Auto Scaling, sesuai dengan SLA.

Dan jika konsolnya se empeña en no cargar, recuerda la receta: verifikasi peristiwa di Dasbor Kesehatan di wilayah yang benar, hapus cache/cookie, ubah navegador dan konfirmasikan bahwa Anda tidak memblokir domain AWS.

Recursos dan informasi terkait

Untuk konfigurasi dan pengoperasian amplifier, lihat dokumentasi AWS Health dan EventBridge untuk mengatur acara. Dalam upaya sertifikasi, revisi panduan ACM dan contoh JelaskanSertifikat jika Anda melakukan verifikasi terintegrasi dalam jaringan pipa atau memantau internal.

  • Dasbor Kesehatan AWS: visibilitas acara dan acara publik, tanpa konfigurasi tambahan.
  • Jembatan Acara Amazon: menerima acara salud yang mungkin terjadi, dengan pengaturan dan tujuan yang fleksibel.
  • Manajer Sertifikat AWS (ACM): keadaan renovasi dan pemberitahuan sebelumnya kepada petugas.
  • Amazon EC2 + CloudWatch: memeriksa secara minuto, metrik status dan alarm sebagai tindakan.

Jika Anda sibuk mengakses informasi tersebut, ada artikel ayuda yang sangat berguna: bagaimana membuat dan mengaktifkan suatu hal baru, bagaimana memulai sesi di konsol atau bagaimana menggunakan dukungan. Ini akan dilakukan jika Anda mengelola berbagai lingkungan atau putaran kredensial secara berkala.

Verifikasikan status AWS Anda tidak akan melihat panel uniknya. Bagaimana cara menyatukan nomor AWS Health, acara EventBridge, status ACM, dan memeriksa EC2/komponen untuk komponen tersebut, dengan kekhawatiran bahwa Anda bertindak dalam waktu dan buku pedoman yang jelas. Dengan kombinasi diagnostik ini yang cenderung cepat, kurang cepat, dan pengoperasian yang lebih tenang, termasuk saat lalu lintas lancar dan hal-hal yang menarik.

comprobar si AWS está caído
Artikel terkait:
Bagaimana cara menyetujui AWS adalah hal yang sama: keadaan, sebab dan akibat yang nyata
Pos terkait: