Beim IT-Monitoring dreht sich in erster Linie alles um das zuverlässige Erkennen von kritischen Zuständen von IT-Systemen. Allerdings ist dies nur ein erster Schritt, danach muss ein Unternehmen den Vorfall an die richtigen Stellen kommunizieren und dafür sorgen, dass das entsprechende Fachpersonal das Problem löst. Um möglichst hohe Verfügbarkeitszeiten sicherzustellen, muss ein Unternehmen neben einer zügigen und präzisen Erkennung von Problemen auch gewährleisten, dass der richtige Mitarbeiter alle nötigen Informationen möglichst schnell erhält und sich an die Beseitigung des Zustandes machen kann.
Checkmk meistert das Erkennen von Zuständen und liefert zuverlässige und präzise Alarmmeldungen. Dafür haben die meisten Checkmk-Nutzer ihr Monitoring angepasst und lassen sich per E-Mail, SMS oder mit einer anderen Benachrichtigungsmethode über kritische Zustände alarmieren. Checkmk versendet Alarmmeldungen, bis das Problem gelöst wurde oder ein verantwortlicher Mitarbeiter den Alarm aktiv in Checkmk quittiert.
Allerdings nutzen die meisten Unternehmen neben Checkmk mehr als ein Tool, das Alarme generiert, die an die richtigen Personen versendet werden müssen. Oder sie möchten die Verwaltung ihrer IT-Service-Workflows nicht komplett in Checkmk abbilden. Deshalb möchte ich Ihnen in diesem Blog zeigen, wie Sie mit iLert Ihre Alarmierungsprozesse optimieren. Die Kombination aus Checkmk und iLert ermöglicht es Ihnen, die Verfügbarkeitszeiten Ihrer IT-Systeme zu verbessern. iLert ist eine SaaS-Lösung zum Management von Alarmen und der Rufbereitschaft. Es verbessert die Zusammenarbeit von On-Call-Teams und anderen Parteien und verringert somit die Zeit zwischen Meldung und Beseitigung eines Problems, die sogenannte Mean-Time-To-Recover (MTTR).
So funktioniert iLert
iLert sammelt Alarme aus verschiedenen Quellen und optimiert die Handhabung von aufgetretenen Vorfällen. Checkmk ist für iLert eine von vielen möglichen Alarmquellen. Die Steuerung für alle Alarme findet zentral in der iLert-Web-Oberfläche statt.
Checkmk kann zum Beispiel Alarme an die jeweils verantwortlichen Mitarbeiter versenden und auch Workflows zur Incident-Bearbeitung abbilden. Allerdings ist die Verwaltung der Workflows über iLert einfacher und Sie können diese wesentlich leichter anpassen, zum Beispiel, wenn Mitarbeiter kurzfristig Schichten tauschen müssen. Mit iLert gewährleisten Sie, dass immer der richtige Mitarbeiter genau instruiert wird und sich sofort an die Arbeit machen kann.
Genau wie Checkmk gibt es für iLert Integrationen in Outbound-Tools wie Slack, ServiceNow oder Jira, darüber hinaus können Sie Workflows für Alarme in iLert selbst abbilden. Antwortet beispielsweise ein Mitarbeiter in Bereitschaft nicht innerhalb von 30 Minuten, kann iLert ein anderes Team oder einen anderen Mitarbeiter automatisch involvieren. Außerdem kann iLert Anrufe auf Ihrer Kunden-Hotline verwalten und auf Basis von vorhandenen Bereitschaftsplänen und Eskalationsketten eingehende Anrufe an den richtigen Kontakt weiterleiten.
Da die Anforderungen an Verfügbarkeitszeiten und Incident-Verarbeitung ständig weiterwachsen, ersetzt iLert oft selbstgebaute Lösungen. iLert entlastet Monitoring-Verantwortliche, da es als Software-as-a-Service einfach in der Handhabung ist. Zudem kommt iLert mit wichtigen Features für Großunternehmen wie Hochverfügbarkeit, umfangreicher Skalierbarkeit über verteilte Umgebungen hinweg und vielem mehr.
Sie können iLert kostenlos und unverbindlich testen. Dank der nativen Integration ist die Kombination von Checkmk und iLert in wenigen Minuten aufgesetzt. Im nächsten Blogpost zeige ich Ihnen, wie einfach die Einrichtung von Checkmk als Alarmquelle in iLert ist und gebe ein paar Beispiele, wie Sie mit iLert Ihre Uptime in der Praxis verbessern.