Höhere Effizienz und Zuverlässigkeit mit EC2-Monitoring-Lösungen

Stellen Sie mithilfe einer umfassenden Monitoring-Lösung die optimale Performance und den reibungslosen Betrieb Ihrer EC2-Instanzen sicher. Überwachen Sie die Ressourcenauslastung, verfolgen Sie Leistungsmetriken und erkennen Sie Probleme proaktiv, um die Effizienz und Zuverlässigkeit Ihrer AWS-Infrastruktur zu verbessern.

AWS EC2 monitoring

Was ist AWS-EC2-Monitoring?

AWS EC2 (Elastic Compute Cloud) ist ein Amazon-Service, der hoch skalierbare, virtuelle Server in der Cloud anbietet. AWS-EC2-Monitoring ist ein Bestandteil eines umfangreichen AWS-Cloud-Monitorings und befasst sich mit der Überwachung von EC2-Instanzen. Durch die Überwachung verschiedener Metriken gewinnen Sie nicht nur Einblicke in die Performance dieser Instanzen und erkennen potenzielle Probleme, sondern stellen zudem sicher, dass Ihre Cloud-Infrastruktur verfügbar, gesund und frei von Anomalien und Engpässen ist.

Das EC2-Monitoring umfasst das Monitoring sämtlicher Arten von AWS-Instanzen und der verschiedenen Anwendungsfälle. Wir setzen uns daher im Laufe dieses Artikels mit den verschiedenen Typen auseinander und schauen uns sowohl die Gemeinsamkeiten als auch die Unterschiede ihrer Überwachung an.

Warum ist AWS-EC2-Monitoring wichtig?

Amazon bietet mit CloudWatch eine eigene Software für das AWS-EC2-Monitoring an. Es überwacht EC2-Instanzen im Detail und bietet in vielen Fällen eine Reihe von Dashboards, mit denen Sie Probleme und Optimierungspotenziale zügig erkennen. Und gerade diese Aspekte machen die EC2-Überwachung aus. Unabhängig davon, wie umfassend und genau die AWS-eigene Verwaltung der Ressourcen ist, ist eine zweite Ebene mit einem guten CloudWatch-Setup oder einer Amazon-EC2-Monitoring-Lösung eines Drittanbieters unabdingbar. Nur so vermeiden Sie mögliche Störungen, Ausfälle, Engpässe, Fehlkonfigurationen und allgemeine Probleme.

Die Verwendung von CloudWatch ist das absolute Minimum, um sicherzustellen, dass Ihre Cloud-Infrastruktur gesund ist und so funktioniert, wie sie sollte. Dennoch reichen die Funktionen in CloudWatch nicht aus, um Ihnen ein wirklich umfassendes EC2-Monitoring zu ermöglichen.

CloudWatch kann zum Beispiel nicht die nötige Granularität aufweisen, die Sie möglicherweise für Ihren speziellen Anwendungsfall benötigen. Die Überwachung von EC2-Instanzen mit einer maßgeschneiderten Lösung wie Checkmk erfüllt Ihre Anforderungen und macht das Amazon-EC2-Monitoring tiefgreifender. Dies ist besonders wichtig, wenn Sie mehr Anpassungsfähigkeit und Flexibilität bei der Überwachung benötigen. 

Die Festlegung eigener Schwellwerte unabhängig von den Schwellwerten in CloudWatch oder die Einrichtung spezifischer Überwachungskonfigurationen sind alles Aspekte, die ein separates Überwachungstool bieten kann.

Darüber hinaus bieten Cloud-Monitoring-Lösungen von Drittanbietern erweiterte Funktionen wie Anomalieerkennung, Trendanalyse, prädiktive Analyse, benutzerdefinierte Alerts und automatische Maßnahmen zu Problembehebung. Diese sind zwar nicht immer notwendig, bieten aber gegenüber den Funktionseinschränkungen von CloudWatch einen deutlichen Mehrwert.

Unabhängig von der gewählten Software ist die Überwachung von EC2-Instanzen ein wichtiger Schritt für eine zuverlässige, gesunde und leistungsstarke cloudbasierte Infrastruktur. Ohne diese Einblicke in die Funktionsweise und Leistung sind Sie blind für mögliche Probleme und Unterbrechungen. 

AWS EC2 Checkmk dashboard

Welche Arten von AWS-EC2-Instanzen gibt es?

Für ein detailliertes EC2-Monitoring ist es wichtig, die verschiedenen Arten von Instanzen zu kennen. Da AWS viele Instanz-Arten für verschiedene Anwendungen hat, ist es von Vorteil, die einzelnen Typen zu kennen und zu wissen, auf welche Aspekte sich eine Instanz konzentriert, beispielsweise Speichereffizienz oder Datenspeicherung, und welche Metriken jeweils relevant sind.

Werfen wir einen Blick auf die bestehenden AWS-Instanz-Typen und ihre Spezialisierung.

Instanzen für allgemeine Zwecke

Wie der Name schon sagt, sind Instanzen für allgemeine Zwecke ausgewogene virtuelle Server, die Sie für eine Vielzahl von Aufgaben einsetzen können. Diese AWS-Instanz-Typen sind auf Verwendungszwecke ausgerichtet, die keinen Fokus auf eine bestimmte Ressource wie Rechenleistung, effizienten Speicher, hohen Netzwerkdurchsatz oder schnelle Lese-/Schreibvorgänge erfordern. Stattdessen bieten sie eine ausgewogene Plattform, die für die meisten Workloads ausreicht.

Die Hauptunterschiede zwischen diesen Instanz-Typen liegen im CPU-Modell, in der Software-Umgebung (Mac ist für macOS-Workloads) und in der Art und Weise, wie ihre Kosten berechnet werden.

Für Datenverarbeitung optimierte Instanzen

Für Datenverarbeitung optimierte Instanzen sind AWS-Instanz-Typen für CPU-intensive Anwendungen wie Stapelverarbeitungsaufgaben, Medientranskodierung, Hochleistungsrechnen, wissenschaftliche Modellierung, dedizierte Gaming-Server, maschinelles Lernen und mehr. Jede Art von CPU-intensiver Anwendung kann von der Wahl dieser Instanzen gegenüber der oben erwähnten Instanzen für allgemeine Zwecke profitieren.

Für Arbeitsspeicher optimierte Instanzen

Wenn die Anforderungen Ihres Unternehmens Anwendungen mit hohem RAM-Bedarf umfassen, sollten Sie für Arbeitsspeicher optimierte Instanzen in Betracht ziehen. Diese sind speziell für speicherintensive Workloads konzipiert, etwa für In-Memory-Datenbanken, elektronische Designautomatisierung, Finanzmathematik und verschiedene, umfangreiche Datenanalysen.

Die meisten Unterschiede zwischen für Arbeitsspeicher optimierte Instanzen liegen in der Art und Menge des verfügbaren Speichers. Einige erreichen bis zu 24 TByte Speicher und verfügen über eine Netzwerkbandbreite von mehreren GBit/s, um einen schnellen Datenaustausch zum und vom Speicher zu gewährleisten.

Instanzen für beschleunigtes Computing

AWS-Instanzen für beschleunigtes Computing sind für Workloads gedacht, die eine hohe GPU-Leistung (Graphics Processing Unit) erfordern. Die wichtigsten Anwendungsfälle für diese EC2-Instanzen sind Tensor-Core-GPUs für maschinelles Lernen und HPC (High Performance Computing). Sie eignen sich jedoch auch hervorragend für Bild- und Videoanalysen, Prognosen, erweiterte Text- und Dokumentenanalysen, Sprachübersetzung und -transkription, Natural-Language-Processing (NLP) und Deep-Learning-Training.

AWS bietet einige dieser Instanz-Typen an, je nach Art der GPU und Menge der Gesamtressourcen.

Für Storage optimierte Instanzen

Für Anwendungen, die einen hohen sequentiellen Lese- und Schreibzugriff auf sehr große Datensätze erfordern, bietet AWS eine Reihe von für Storage optimierte Instanzen. Diese sind ideal für relationale und nicht-relationale Datenbanken sowie für alle Workloads, die einen sehr schnellen Zugriff auf mittelgroße Datensätze erfordern, wie beispielsweise Suchmaschinen und Datenanalysen. Diese Instanzen bieten sowohl schnellen NVMe-SSD-Storage als auch günstigere und langsamere Instanzen mit einfachem HDD-Storage.

Der Hauptunterschied zwischen Instanzen dieser Art liegt in den maximal verarbeiteten Transaktionen pro Sekunde (TPS) und den Kosten pro TByte Datenspeicher. Natürlich steigen mit zunehmender Geschwindigkeit auch die Kosten für eine Instanz.

Für HPC optimierte Instanzen

HPC-Workloads (High-Performance Computing) können Sie gut auf Computing-optimierten Instanzen ausführen. Amazon bietet zwei spezielle Instanz-Typen für hochleistungsfähige Processing-Workloads. Diese HPC-optimierten EC2-Instanzen bieten ein besseres Preis-Leistungs-Verhältnis bei großen, komplexen Simulationen, Deep-Learning-Aufgaben und allgemein sehr rechenintensiver Arbeitslasten. Diese Instanzen sind auch für Workloads konzipiert, die von einem verbesserten Netzwerkdurchsatz und einer höheren Paketrate abhängen.

Welche Metriken sollten Sie überwachen?

Das EC2-Monitoring erfolgt entweder mithilfe von CloudWatch und seinen Dashboards, AWS-APIs oder einer speziellen AWS-EC2-Monitoring-Software. AWS exportiert eine große Menge an Metriken, auf denen Ihre Überwachung basieren kann –  es sind jedoch nicht alle davon für alle AWS-Instanz-Typen verfügbar. Allen gemeinsam sind grundlegende Metriken wie CPU-Auslastung, Festplatten-Schreibvorgänge, Lesevorgänge pro Sekunde und empfangene oder gesendete Netzwerkbytes oder -pakete. Diese Metriken sollten Sie in jedem Fall in Ihr Monitoring einbeziehen.

Instanzen wie T4g, T3, T3a und T2 messen auch Metriken wie CPU-Guthaben und die Gesamtnutzung, den Saldo und eventuelle Überschüsse. Diese Instanzen verwenden Guthaben, um die Nutzung und die relativen Kosten der Cloud-Ressourcen zu berechnen, weshalb Sie diese Metriken ebenfalls überwachen sollten, um die Nutzung und die Kosten im Auge zu behalten.

Um über die Grundlagen hinauszugehen oder ein fortschrittliches Monitoring durchzuführen, benötigen Sie entweder den CloudWatch-Agenten oder die Lösung eines Drittanbieters. CloudWatch-Dashboards exportieren nur einen Teil der möglichen Metriken. Wenn Sie beispielsweise einen AWS-EC2-Arbeitsspeicher überwachen möchten, müssen Sie einen Agenten installieren, der Metriken des aktiven, gebufferten, zwischengespeicherten, freien, inaktiven und verwendeten Speicher sowie die Gesamtzahl des verfügbaren Speichers für die jeweilige EC2-Instanz erfasst. Je nachdem, welches Betriebssystem Sie verwenden, ob Linux, Windows oder macOS, gibt es auch da leichte Unterschiede. Um sich die Installation eines zusätzlichen Agenten zum AWS-EC2-Arbeitsspeicher-Monitoring zu ersparen, können Sie eine AWS-EC2-Monitoring-Lösung verwenden, da die meisten Lösungen bereits einen solchen Agenten enthalten.

Eine wichtige Metrik, die bisher noch nicht genannt wurde, ist die Festplattennutzung. Um einen AWS-EC2-Festplattenspeicher zu überwachen, benötigen Sie EBS-Volumes, die mit den genutzten EC2-Instanzen verbunden sind. Bei Elastic Block Storage handelt es sich um virtuelle Laufwerke für die Instanzen, die Festplattenplatzmetriken auf ihrer Ebene erfassen. Ähnlich wie bei den Hauptmetriken für EC2-Instanzen können Sie CloudWatch, die APIs oder einen Ad-hoc-Agenten verwenden, um die Auslastung und Kapazität der Festplattenspeicher für alle Ihre AWS-Instanz-Typen zu beobachten.

Damit haben Sie die grundlegenden Metriken für das EC2-Performance-Monitoring erfasst. In Fällen des EC2-Security-Monitorings oder der allgemeinen Compliance kann es wichtig sein, die Integrität der AWS-EC2-Dateien zu überwachen. In diesem Fall ist eine Software eines Drittanbieters erforderlich, da CloudWatch das Monitoring der Dateiintegrität auf Ihren EC2-Instanzen nicht unterstützt.

Bewährte Praktiken beim EC2-Instanz-Monitoring

Unabhängig davon, welche Metriken Sie erfassen wollen und welche Instanzen Sie verwenden, sollte das EC2-Monitoring Priorität haben. Es ist ein wichtiges Element Ihrer Infrastruktur, das zu keinem Zeitpunkt ausfallen darf. Die Überwachung von EC2-Instanzen sollte zumindest die Erfassung von Metriken, vorzugsweise aber auch die Log-Analyse umfassen. Der Idealfall ist es, diese Funktionen in einer einzigen AWS-EC2-Monitoring-Software zu implementieren und nach Ihren Bedürfnissen zu automatisieren.

Die Überwachung von Metriken und die Analyse von Logs führen Sie mit CloudWatch oder einer umfangreichen Monitoring-Lösung wie Checkmk durch. Wichtig ist, dass Ihr System alle möglichen und erforderlichen Metriken erfasst, Sie bei Problemen alarmiert, sich mit nur wenigen Konfigurationsschritten einrichten lässt und Ihre gesamte Infrastruktur unterstützt, ob hybrid oder vollständig cloudbasiert. 

Checkmk ist in diesem Fall eine sehr gute Wahl. Als umfangreiche Monitoring-Software für EC2 und AWS übernimmt Checkmk die meisten Aufgaben, die sonst CloudWatch oder benutzerdefinierte Agenten erledigen würden, und vereint dabei alles in einer einzigen Lösung.