Checkmk im Einzelhandel bei Edeka Minden-Hannover
Wer ist Edeka Minden-Hannover?
Edeka Minden-Hannover ist mit 32.000 Mitarbeitern und etwa 1.600 Einzelhandelsstandorten die größte der bundesweit sieben Edeka-Regionalgesellschaften. Das Geschäftsgebiet erstreckt sich von der holländischen bis an die polnische Grenze. Es umfasst einen Teil von Ostwestfalen, fast ganz Niedersachsen sowie die Bundesländer Bremen, Sachsen-Anhalt, Berlin und Brandenburg. In 2020 betrug der Umsatz von Edeka Minden-Hannover 10,6 Milliarden Euro.
Die Geschwindigkeit der Zielerreichung von der Planung bis zur Umsetzung hat uns selbst überrascht. Die Zusammenarbeit mit Checkmk war von Anfang an professionell und zielstrebig.
Edeka Minden-Hannover setzt seit 2012 auf Checkmk. Die zuvor eingesetzte Monitoring-Lösung Nagios war nicht ausreichend skalierbar und wurde den Anforderungen nicht mehr gerecht.
Checkmk war ursprünglich als Front-End zur Verwaltung der Nagios-Umgebung gedacht, das IT-Team entschied sich aber nach kurzer Zeit, Nagios komplett durch Checkmk abzulösen. Die Migration der 1.200 Nagios-Server lief reibungslos.
Bei diesem Projekt war die Herausforderung nicht nur der große Umfang, sondern auch die speziellen Anforderungen, die sich aus dem Umfeld des Einzelhandels ergeben.
Monitoring am Netzwerkrand im Einzelhandel
Edeka Minden-Hannover suchte nach einer kostengünstigen, flexiblen und zeitgemäßen Lösung für das Monitoring der Märkte und einiger zentraler Systeme. Das Unternehmen entschied sich zunächst für die Open-Source-Software Nagios. Diese setzte man - wie in vielen anderen Unternehmen auch - erst einmal per Hand auf und ergänzte nach und nach verschiedene Add-ons wie NSCA und NagVis. Bereits nach kurzer Zeit im operativen Betrieb wurde jedoch klar, dass ein klassisch aufgesetztes Nagios schnell an seine Grenzen stößt. Ein problematischer Punkt war die starke Netzwerklast durch die vielen Details, die das Monitoring überwachen muss.
Außerdem stieß das IT-Team selbst mit grafischen Konfigurationstools wie NConf an die Grenzen des verkraftbaren Verwaltungsaufwandes. Mit der Zeit machten sich auch Performance-Engpässe auf dem zentralen Nagios-Server bemerkbar. Deshalb suchte das IT-Team von Edeka Minden-Hannover nach einer Nagios-Alternative. Mit Checkmk fand Edeka Minden-Hannover eine Möglichkeit, seine umfangreiche Nagios-Umgebung einfach abzulösen. Das IT-Team konnte bestehende Nagios-Erweiterungen mit minimalem Aufwand in Checkmk übernehmen. Somit konnten diese einfach weiter genutzt werden. Genauso konnte Edeka Minden-Hannover Checkmk in der bestehenden SUSE-Linux-Server-Infrastruktur problemlos installieren, da Checkmk unter anderem auf allen gängigen Linux-Distributionen läuft.
Die Anforderungen von Edeka Minden-Hannover an das Monitoring sind hoch: Das IT-Team möchte, dass die überwachten Daten an einer zentralen Stelle zusammenlaufen. Ziel ist eine Übersicht über alle IT-Umgebungen. Das Monitoring soll dazu einen zentralen Statusmonitor auf Basis von GPS-Koordinaten automatisch in Form einer Karte generieren. In kritischen Fällen ist zudem das automatische Versenden von Benachrichtigungen wichtig, beispielsweise, wenn in einem Markt weniger als ein festgelegter Prozentsatz an Kassen arbeitsfähig wäre.
Die Herausforderung
Die Ablösung von über 1.200 eigenständigen Nagios-Servern ist sicher nicht alltäglich. Solche Umgebungen zu verwalten ist in der Regel mehr als ein Fulltime-Job. Auch die weiteren Zahlen der Umgebung sind beeindruckend: Jeder der 1.200 Monitoring-Server überwacht durchschnittlich 25 Hosts und 250 Services. Das summiert sich auf 300.000 Services, die Checkmk jeweils einmal pro Minute abfragt.
In den meisten Märkten steht kein IT-Fachpersonal zur Verfügung, deshalb ist eine weitere Anforderung, dass auch Mitarbeiter ohne IT-Erfahrung das Monitoring vor Ort verstehen und nutzen können. Gleichzeitig soll das Monitoring neue Systeme automatisch in die Überwachung aufnehmen. Zusätzlich muss das Monitoring in den Märkten auch funktionieren, wenn ein Markt vom restlichen Netz getrennt oder die Verbindung instabil ist. Die einzige Möglichkeit dies zu gewährleisten ist die Überwachung von lokalen Systemen durch eine lokale Monitoring-Instanz. Gleichzeitig möchte Edeka Minden-Hannover, dass das Monitoring die Daten zentral aggregiert
Checkmk verwendet zur Abfrage der Daten einen eigenen Agenten, der nicht konfiguriert werden muss. So ist der Rollout auf die große Menge der zu überwachenden Systeme problemlos möglich. Dank seiner Inventur-Funktion erkennt Checkmk automatisch, welche Aspekte eines Systems überwachbar sind. Checkmk scannt regelmäßig das lokale Netzwerk des jeweiligen Marktes nach neuen Komponenten. Dabei setzt das IT-Team auf das Standardwerkzeug nmap. Sobald dies ein neues System findet, ermittelt Checkmk mit Hilfe der automatischen Inventur-Funktion die zu überwachenden Services der Systeme.
Die Schwellwerte konfiguriert das IT-Team über flexible Regeln auf der zentralen Monitoring-Instanz und wendet diese dann global auf alle Märkte an. Checkmk minimiert so den Aufwand für die Verwaltung des Monitorings. Das Regelwerk besteht aus 26 verschiedenen Regeln. Auf dieser Basis kann die zentrale Checkmk Instanz den Gesamtzustand jedes Marktes abfragen und zeigt in einer zusammengefassten Übersicht den Zustand jedes Marktes an. Diese Aggregation wird mit Hilfe der Checkmk Business Intelligence (BI) realisiert. Checkmk verwendet für die Realisierierung seinen JSON-basierten Webservice. So ist sichergestellt, dass die Informationen in der Zentrale den aktuellen Zustand der IT in den Märkten widerspiegeln. Ein Dashboard auf Basis der Daten aus der zentralen Instanz zeigt den Gesamtzustand auf zwei 55-Zoll-Monitoren an. Auf diesem Dashboard finden sich einzelne Ansichten (Dashlets), die unter anderem die Märkte mit Verbindungsproblemen und Host- oder Service-Probleme in eigenen Listen anzeigen. Im Rahmen des Projektes erweiterte man NagVis um die Geomap-Funktionalität. Dabei erstellt NagVis anhand der GPS-Koordinaten aller Standorte und frei verfügbarem Kartenmaterial von OpenStreetMap eine Landkarte und positioniert die Standorte auf dieser Karte.
Die Lösung
Edeka Minden-Hannover hat Nagios seit 2012 erfolgreich durch Checkmk abgelöst. Das Monitoring erfasst für unterschiedlichste Systeme in allen Märkten detaillierte Informationen. Diese fasst die zentrale Checkmk Instanz zusammen, ehe es sie visualisiert und auswertet.
Gemeinsame Umsetzung des Rollouts erfolgreich
Im Rahmen der ersten Installation von Checkmk entwickelte das Checkmk Team auch einige neue Checkmk Checks (wie zum Beispiel das Monitoring von Bintec-Routern), welche in die offizielle Version von Checkmk eingeflossen sind. Nach einigen Wochen Konzeption zogen Edeka Minden-Hannover und Checkmk den Rollout auf alle Märkte in einem viertägigen Vor-Ort-Termin durch.
Innerhalb von sechs Stunden setzte Edeka Minden-Hannover insgesamt 1.200 Monitoring-Systeme auf. Das sind drei neue Installationen pro Minute. Nach der Installation band Edeka Minden-Hannover alle Systeme in den Märkten in die zentrale Instanz ein. Im gleichen Zug nahm das IT-Team die Geomap mit den Informationen aus den Märkten in Betrieb.
Mit geringem Aufwand entwickelten Edeka Minden-Hannover und Checkmk in partnerschaftlicher Zusammenarbeit eine passende Monitoring-Lösung und haben diese erfolgreich implementiert. Das gesamte Projekt wurde auf Basis von lizenzkostenfreier Software entwickelt. Gleichzeitig vermittelte Checkmk Fachwissen und baute das Monitoring-Know-How des Kunden weiter aus.
Die Vorteile
Mit Checkmk hat Edeka Minden-Hannover ein sehr gut skalierbares und präzises Monitoring im Einsatz. Das Unternehmen ist somit optimal auf aktuelle und kommene Monitoring-Herausforderungen aufgestellt. Der Wechsel von Nagios zu Checkmk hat sich für das Unternehmen bereits nach kurzer Zeit bezahlt gemacht, da es den Aufwand für das IT-Team deutlich reduziert hat.