Als es 1999 noch unter dem Namen NetSaint auf den Markt kam, vereinheitlichte es als erstes Open-Source-Tool eine breite Palette an essenziellen Mechanismen, um komplexe IT-Infrastrukturen effizient überwachen zu können. Nagios setze auf Hosts und Services, Monitoring-Plugins und eine enge Zusammenarbeit mit der Open-Source-Community. Seitdem hat sich viel in der IT und Monitoring-Welt geändert. Es wird deutlich, dass der Einsatz von Nagios nicht mehr zeitgemäß für die Überwachung von modernen IT-Innovationen ist. In diesem Block-Post möchte ich erläutern, warum Unternehmen aktiv Nagios aus ihren Netzen verbannen und so schnell wie möglich durch moderne Monitoring-Ansätze ersetzen sollten.
In vielen Bereichen haben Open-Source-Technologien die IT-Welt verändert. Das sieht man zum Beispiel am Erfolg des Betriebssystems Android von Google, dass seit seiner Vorstellung im Jahre 2007 unsere Idee von modernen Smartphones nachhaltig bestimmt. Natürlich ist der Einfluss von Nagios im Bereich IT-Monitoring ebenfalls spannend. Es gibt viele Gründe die gegen die weitere Verwendung sprechen, entscheidend Punkt ist aber, dass der Aufwand für einen Wechsel viel geringer ist als die Nachteile, die durch den weiteren Einsatz entstehen. Viele Nutzer von Nagios wissen aber nicht, dass Sie relativ leicht auf ein besseres Tool umsteigen können.
Nagios bindet zu viele Hardware-Ressourcen, belastet IT-Teams mit aufwändiger Konfiguration und führt zwangsläufig zu Lücken im Monitoring. IT-Teams setzen heute bei Bedarf ihr Monitoring in der Cloud und als Docker-Container auf, während Entwickler gerne eigene Monitoring-Tools wie Prometheus nutzen, die gezielt Metriken über Query-Languages abrufen können. Viele Innovationen wie Container und deren Verwaltung über Kubernetes haben die Welt der IT-Überwachung um neue Wege erweitert, aber keiner davon führt mehr zu Nagios.
Wer benutzt heute noch Nagios?
Nagios ist nicht geeignet, um komplexe Netzwerke und Systeme in modernen Unternehmen mit akzeptablem Aufwand zu überwachen. Die Arbeit mit Nagios-Config-Files war schon immer unbequem, fällt aber heute zu sehr aus dem Rahmen. Andere Tools setzen auf Automatisierung und Konfiguration, mit denen sich auch eine große Menge von Hosts einfach verwalten lassen. Sie entlasten die Nutzer zudem durch ansprechende, grafische Oberflächen, während bei Nagios sich das Arbeiten auf der Linux-Konsole oftmals nicht vermeiden lässt. Auch der Umgang mit Plugins und Add-ons in Nagios entspricht nicht modernen Standards: Updates, Dokumentation und Anpassung von Nagios benötigen zu viel manuelle Feinarbeit.
Da Netzwerke immer größer und komplexer werden und IT-Teams mehr Systeme überwachen müssen, setzt der Einsatz von Nagios Monitoring-Verantwortliche unter immensen Zeitdruck. Dies ist ein Risiko für Unternehmen und IT-Fachkräfte. Es drohen das Übersehen von IT-Problemen, fehlende Informationsgrundlagen für Entscheidungen und eine kostspielige Bindung von Personalressourcen.
Einige Unternehmen hofften durch das Investment in kommerzielle Nagios-Versionen die Performance ihrer IT-Teams und des Monitorings zu verbessern. Aber auch dann schlagen die Nachteile der veralteten Code-Basis durch: Der Arbeitsaufwand ist vergleichsweise hoch, die grafische Oberfläche ist veraltet, und die Skalierbarkeit wird durch die verfügbare Server-Performance limitiert. Da Nagios vor allem auf aktive Checks setzt, ist umfassendes, aber leicht zu implementierendes Monitoring mit Nagios praktisch nicht möglich.
Als Nagios erschien, war es noch relativ normal, dass sich IT-Administratoren auf wenige Applikationen spezialisieren konnten. In den letzten 20 Jahren ist die Komplexität in der IT in Unternehmen aber ständig gewachsen, während das Personal in den IT-Abteilungen nicht im gleichen Maße aufgestockt wurde. Die Anforderungen an IT-Fachkräfte sind gestiegen. Der nötige Zeitaufwand für die Einarbeitung und den Betrieb von Nagios ist nicht mehr zu leisten. Andere Tools gehen besser auf die Bedürfnisse der Anwender ein, beispielsweise sind sie einfacher in der Handhabung und entlasten die Nutzer durch gezielte Automatisierung.
Was kostet Nagios wirklich?
In vielen Unternehmen finden sich mittlerweile eine große Anzahl an verschiedenen Monitoring-Tools. Dies ist oft historisch gewachsen, beispielsweise durch ehemalige Mitarbeiter, die eigene Tools implementierten und dann das Unternehmen verlassen haben. Zudem wächst die Zahl der Monitoring-Lösungen auch durch Aktionismus bei der Implementierung von neueren Tools. Oft sieht man in Unternehmen dann noch eine oder mehrere Nagios Core-Instanzen im Einsatz, da sich die Open-Source-Version ja umsonst betreiben lässt, zum Beispiel um kostenpflichtige Tools eines anderen Herstellers zu unterstützen.
Hier liegt ein Trugschluss vor, denn eine Gleichung, in der Nagios vorkommt, geht meist nicht mehr auf. Für den Betrieb benötigt Nagios Core Hardware-Ressourcen und Nutzer mit sehr tiefen Nagios-Kenntnissen. Durch die hohen Nutzeranforderungen ist es fast unmöglich, Erkenntnisse aus den Monitoring-Daten für andere Teams effizient zur Verfügung zu stellen. In der Folge drohen Informationssilos, da nur wenige Nutzer das Monitoring richtig verstehen können. Moderne Tools sind wesentlich stärker auf Kooperation und Offenheit auslegt. Sie eröffnen bessere Aufarbeitung und Zugang zu Monitoring-Insights.
Neue Ansätze können zudem mehr Assets mit weniger Aufwand überwachen. Wenn Unternehmen stattdessen immer wieder den Ressourcen-Hunger von Nagios stillen, indem sie ihre Hardware-Ressourcen erweitern, vergeben sie eine große Chance, das Budget sinnvoller einzusetzen. Das Argument, Nagios wäre kostenlos, lässt sich also nicht aufrechterhalten, wenn man hierfür neben dem Personalaufwand auch den Ausbau seiner Hardware investieren muss – vor allem, wenn es leistungsstärkere Nagios-Alternativen gibt, die ebenfalls kostenlos sind.
Umgang mit Nagios-Plugins
Unabhängig, welche Nagios-Version Sie im Einsatz haben: Zunächst erscheint der Aufwand für einen Wechsel weg von Nagios wahrscheinlich wie ein Wendemanöver mit einem fahrenden Zug. Viele Unternehmen haben ihr Nagios-Monitoring über Jahre aufgebaut und können sich eine einfache Ablösung daher nicht vorstellen.
Der Wechsel weg von Nagios ist relativ einfach, wenn das neue Monitoring-Tool eine gute Auto-Discovery-Funktion und ausreichend Monitoring-Plugins mitbringt. Außerdem sollte es Nagios-Erweiterungen übernehmen können, falls Sie spezielle Hosts im Netz haben oder jemand besonders viele Plugins selber geschrieben hat.
Wählen Unternehmen die richtige Überwachungslösung als Nachfolger, schlagen Sie hier mehrere Fliegen mit einer Klappe:
- Sie können veraltete Nagios-Plugins durch bessere Erweiterungen des neuen Tools ersetzen und verbessern die Qualität der Überwachungsdaten. Gleichzeitig senken Sie den Ressourcenverbrauch des Monitorings, da die neuen Plugins effizienter arbeiten.
- Sie können auf mehr offizielle Plugins des neuen Tools zugreifen, die vom Hersteller gewartet und erweitert werden. Dadurch reduziert sich der Aufwand für die Pflege der Monitoring-Integrationen durch die eigenen Mitarbeiter.
- Durch sein hohes Alter gibt es bestimmte Assets, die sich mit Nagios nicht gut überwachen lassen, beispielsweise dynamische Docker-Container. Moderne Tools bieten auch hier Integrationen und beseitigen so blinde Flecken im Monitoring.
- Vor allem Open-Source-basierte Monitoring-Tools unterstützen in der Regel weiterhin Nagios-Erweiterungen, sodass Sie auch selbstgeschriebene Nagios-Plugins weiterverwenden können.
Hört sich alles zu gut an, um wahr zu sein? Das hängt natürlich wirklich von der Monitoring-Lösung ab. Sie haben Zweifel, dass ein Wechsel auf ein alternatives Tool wirklich möglich ist? Wir zeigen Ihnen mit Checkmk eine praktische Lösung für die Ablösung Ihres Nagios-Monitorings.
Im nächsten Blog-Post migrieren wir ein Monitoring von Nagios auf Checkmk, innerhalb von wenigen Minuten.