Wie IONOS das Netzwerk-Monitoring für 29 globale Rechenzentren mit Checkmk automatisiert
Herausforderung
- Heterogene Infrastruktur der 29 globalen Rechenzentren erschwerte das Netzwerk Monitoring
- Starre Monitoring-Lösung führte zu hohem Zeit- und Personalaufwand
- Eingeschränkte Sichtbarkeit verhinderte schnelle Root-Cause-Analyse
Warum Checkmk?
- Einfach skalierbar und leicht anpassbar für wachsende Anforderungen
- Out-of-the-Box-Abdeckung zahlreicher Hersteller durch über 2.000 Plugins
- Automatisierte Funktionen für Konfiguration, Betrieb und Wartung
Ergebnisse
- Reduzierte Komplexität und erhöhte Agilität für effiziente Marktexpansion
- Entlastung des Network-Operations-Teams und verringerter operativer Aufwand
- Gesteigerte Verfügbarkeit durch beschleunigte Fehlerdetektion und Mean time to Resolution (MTTR)
Aufwand reduzieren, Agilität steigern

Die IONOS Group ist mit über 6,30 Millionen Kunden Europas führender Digitalisierungspartner und zuverlässiger Cloud Enabler für den Mittelstand. Das Geschäftsvolumen wächst jährlich um mehr als 10 % und basiert auf einer flexiblen, skalierbaren Infrastruktur, die sich über 29 georedundante Rechenzentren erstreckt.
Um das starke Wachstum und die hohen Ansprüche an garantierte Verfügbarkeiten stemmen zu können, betreibt IONOS ein nach ITIL ausgerichtetes IT-Service-Management und einen übergreifenden 24/7-Service-Desk für das Event-Handling und das Incident-Management. Vor allem aber benötigt IONOS ein leistungsfähiges Monitoring, damit der Bereich Netzwerke die rund 10.000 Netzwerk-Komponenten unterschiedlicher Hersteller und die ca. 2.000 Server in den 29 Rechenzentren weltweit in Echtzeit überwachen kann. IONOS verwendete dazu bislang eine Eigenentwicklung, die jedoch nicht mit dem Wachstum Schritt halten konnte.
Da die Java-basierte Lösung weder flexibel erweiterbar noch einfach zu warten war, verursachte sie einen hohen Zeit- und Personalaufwand. So mussten etwa Änderungen per Software-Entwicklung umgesetzt werden. Zudem beschränkte sich die Lösung darauf, Soll-Zustände abzugleichen und bei Abweichungen zu alarmieren, ohne jedoch eine direkte Ursachenanalyse oder Fehlerbehebung zu ermöglichen. Angesichts dieser Einschränkungen nutzte IONOS für einzelne Anwendungsfälle zusätzliche Monitoring-Systeme. Das reduzierte zwar den Leidensdruck, doch im Gegenzug stieg die Komplexität. Daher stand fest: Eine neue Netzwerk-Monitoring-Lösung musste her!

Monitoring weltweit konsolidieren und automatisieren

Nach einer intensiven Marktsondierung und einem umfangreichen Proof of Concept entschied sich IONOS für Checkmk Enterprise. Ausschlaggebend war, dass Checkmk zentrale Anforderungen wie eine hohe Automation durch Features wie API-Funktionalität und Auto-Discovery abdeckt sowie einfach skalierbar und hochverfügbar ist. Darüber hinaus unterstützt Checkmk eine Multi-Vendor-Umgebung, SNMP-Traps und sorgt durch ein individuell anpassbares Frontend mit Dashboard-Funktionen für eine hohe Usability. Des Weiteren setzte IONOS bereits Checkmk Raw zum Überwachen der Netzwerk-Management-Server und einzelner Produktplattformen ein und hatte somit bereits positive Erfahrungen im Tagesgeschäft gesammelt. Zusätzlich überzeugte Checkmk auch unter wirtschaftlichen Gesichtspunkten.
Innerhalb von sechs Monaten baute IONOS mit Checkmk zwei europaweite Hochverfügbarkeits-Cluster zum Überwachen der Live- und der Pre- Live-Umgebung auf. Zwölf Remote-Instanzen an unterschiedlichen Unternehmensstandorten reduzieren zudem den Netzwerk-Traffic und erhöhen die Skalierbarkeit und Ausfallsicherheit. Das Einrichten des Monitorings verlief problemlos, da Checkmk Enterprise die meisten Komponenten der unterschiedlichen Hersteller out-of-the-box überwacht. IONOS musste nur wenige Checks neu implementieren. Für den schnellen Wissensaufbau und die optimale Implementierung nutzte IONOS nach Bedarf die Trainingsangebote, Best Practices und die Unterstützung des Consulting-Teams von Checkmk.
Weniger Aufwand und verbesserte Verfügbarkeit
Mit Checkmk als globaler Monitoring-Plattform überwacht IONOS rund 12.000 Hosts und mehr als 670.000 Services lückenlos über alle 29 Rechenzentren hinweg. Außerdem hat IONOS die Konfiguration und den Betrieb des Monitorings mithilfe der Checkmk REST-API weitestgehend automatisiert. Alle Aufgaben des Host-Life-Cycle-Managements wie das On- oder Offboarding eines Hosts erledigt Checkmk eigenständig. Die Lösung erkennt per Auto-Discovery die relevanten Komponenten und prüft das Netzwerk kontinuierlich, um Geräte und Dienste zeitnah ins Monitoring zu integrieren. Schwellwerte für Benachrichtigungen und relevante Monitoring-Metriken für neu hinzugekommene Geräte liefert Checkmk automatisch, was das Netzwerk-Team erheblich entlastet. Die rund 2.000 von Checkmk bereitgestellten Plugins decken hierbei nahezu sämtliche Netzwerkkomponenten in den einzelnen Rechenzentren ab.
In puncto künftiges Wachstum profitiert IONOS zudem von der beinahe unbegrenzten Skalierbarkeit und flexiblen Erweiterbarkeit von Checkmk. Mithilfe der regelbasierten Konfiguration lassen sich neu hinzugekommene Komponenten als Hosts mit wenigen Klicks einrichten. IONOS kann neue Anforderungen schnell in das Monitoring integrieren. Die Abhängigkeit von Software- Entwicklungsressourcen entfällt. Das spart gerade in großen und komplexen Umgebungen wie der von IONOS viel Zeit und Aufwand ein.
Mit Checkmk verfügen wir über eine hochautomatisierte, flexibel erweiter und skalierbare Monitoring-Lösung, die mit unseren steigenden Anforderungen mitwächst. Damit sind wir für die weitere Marktexpansion gut aufgestellt.
Alle Abteilungen der Business-Unit Netzwerk haben Zugriff auf Checkmk. Über individuell anpassbare Dashboards haben sie „ihre“ Metriken und somit den Gesundheitszustand des Netzwerks immer im Blick. Die Metriken werden hierzu in den IONOS Metric Store exportiert und mittels Grafana visualisiert. Dank der flexiblen Visualisierung und granular konfigurierbaren Benachrichtigungen erkennt IONOS Störungen schneller.
Die erweiterte Sichtbarkeit des Netzwerks beschleunigt die Root-Cause-Analyse und verkürzt die Problemlösungszeiten (Mean Time to Resolution, MTTR) erheblich. Dadurch kann IONOS die Hochverfügbarkeit und SLAs effizienter sicherstellen. Für die weitere Marktexpansion ist das Netzwerk von IONOS mit Checkmk bestens gerüstet. Die Monitoring-Plattform sorgt durch die hohe Automation, Flexibilität und Skalierbarkeit für Entlastung und schafft neuen Spielraum ‒ und unterstützt so beim Erreichen der Wachstumsziele.
Über den Kunden
Die IONOS Group mit Sitz in Montabaur/Deutschland ist mit 22 Millionen Domains und über 6,30 Millionen Kunden Europas größter Webhosting-Anbieter und in 18 Märkten in Europa und Nordamerika vertreten. Das Unternehmen versteht sich als Cloud Enabler für den Mittelstand und erzielte 2023 mit rund 4.300 Beschäftigten einen Umsatz in Höhe von 1,423 Milliarden Euro.