CloudWatch Alarme über Slack empfangen

Ob CPU-Auslastung einer EC2-Instanzen, Fehler beim Ausführen einer Lambda-Funktion oder verfügbarer Speicherplatz einer RDS-Instanz mit Amazon CloudWatch lassen sich Ressourcen bei AWS überwachen. Dafür werden zwei Komponenten benötigt:

  • Metriken: Eine Metrik ist ein Sammeltopf für Messwerte, die von den AWS Services automatisch befüllt werden.
  • Alarme: Ein Alarm überprüft in regelmäßigen Abständen ob sich die Messwerte einer Metrik noch innerhalb von definierten Grenzen bewegt.

Eine Übersicht über alle verfügbaren Metriken findet sich unter Metriken und Dimensionen-Referenz von Amazon CloudWatch. Wann immer ein CloudWatch Alarm feststellt, dass sich eine Metrik außerhalb der definierten Grenzen bewegt, können automatisch folgende Aktionen ausgeführt werden:

Beispielsweise lässt sich ein CloudWatch Alarm so konfigurieren, dass bei einer CPU-Auslastung von über 80% über SNS eine E-Mail an den Verteiler des eigenen DevOps-Teams gesendet wird. Allerdings führen Benachrichtigungen von CloudWatch Alarmen per E-Mail schnell zu einem überquellenden Postfach. Außerdem entsteht mit jeder E-Mail an den Verteiler des eigenen DevOps-Teams auch Abstimmungsbedarf: “Wer kümmert sich um das Problem?”.

Bei tecRacer Consulting verwenden wir Slack um über Standorte (Hannover, Duisburg, Frankfurt und München) hinweg die Kommunikation zwischen allen Cloud Consultants sicherzustellen. Was liegt da näher als auch CloudWatch Alarme über Slack zu empfangen?

Im Jahr 2016 haben Michael und ich an der Serverless Chatbot Competition teilgenommen und in diesem Rahmen einen Chatbot entwickelt. Mit marbot lassen sich CloudWatch Alarme über Slack empfangen. Dabei versucht der Chatbot das DevOps-Team möglichst wenig zu stören. Eingehende Alarme werden über eine Eskalationsstrategie erst einem einzelnen Teammitglied, bei Bedarf einem weiteren Teammitglied und schließlich erst dem ganzen Team zugestellt.

Neben CloudWatch Alarmen integriert sich marbot mit einer Vielzahl von anderen Quellen, über die AWS-Ressourcen überwacht werden können.

Zusätzlich können per HTTP/HTTPS oder E-Mail beliebige Alarme an marbot gesendet werden. Unser Chatbot kann damit als unkompliziertes und agiles Incident Management Tool verwendet werden. Fügen Sie marbot zu Ihrem Slack Workspace hinzu um die 14-tägige und kostenlose Probezeit zu starten.

Similar Posts You Might Enjoy

Erste Einblicke in CloudWatch Logs Insights

Mal unter uns - in der Analyse der Logdateien hat CloudWatch logs bisher nicht gerade geglänzt. Das Feld wurde eher anderen Kandidaten überlassen. Jetzt hat man die Analysefähigkeit aufpoliert. Daher ist es Zeit sich das genauer anzuschauen. _TL;DR : Nicht schlecht gemacht, einen Blick wert! _ Verschiedene Auswertungen von vordefinierten und eigenen Feldern, kombiniert mit einer einfache Visualisierung können schon viele Anwendungsfälle erschlagen. - by Gernot Glawe

Link Local-Addressen bei AWS

Im sogenannten APIPA/Link Local-Bereich (siehe RFC 3927) sind auf AWS EC2-Instanzen mehrere Dienste erreichbar, von denen der Metadata Service mit Abstand der Bekannteste und Wichtigste ist. Allerdings gibt es dort auch andere Services (siehe Post “Default DNS-Server in AWS VPCs”), die in der Dokumentation teils recht versteckt sind. - by Thomas Heinen

SQLServer Optimierung auf AWS

Im Dezember haben wir im Rahmen eines Consulting-Einsatzes verschiedene SQLServer EBS-Laufwerks-Kombinationen bei einem Kunden ausprobiert, um eine optimale Performance zu erreichen. Zusammenfassung: r4.4xlarge bringt fast doppelte Performance gegen über r4.2xlarge, obwohl CPU und RAM bei beiden Instanzen nicht viel Auslastung haben … Das war eine Überraschung! Striping generell bringt fast doppelte Performance gegenüber kein Striping EBS Typ io1 mit 5000 IOPS bringen gegenüber EBS Typ GP2 bei der einen Abfrage doppelte Performance, bei den anderen 4 Abfragen teilweise fast gleiche oder nur 30 % mehr Performance bei erheblich mehr Kosten Die neuen R4 Instanzen haben übrigens DDR4 RAM, bis zu 10 Gbit Network und bis zu 12 Gbit EBS-Network Anbindung. - by tecRacer