Am ersten Tag der Checkmk Conference #7 drehte sich auch in diesem Jahr traditionell alles um die aktuelle Checkmk-Version. Das im März dieses Jahres gelaunchte Checkmk 2.0 stellt für uns nicht nur das größte Produkt-Release unserer Geschichte dar, sondern bringt mit einer komplett überarbeiteten Oberfläche und Navigation für die Checkmk-User eine komplett neue Nutzererfahrung mit sich.

Ein wichtiger Bestandteil der neuen Version war unter anderem die Verbesserung des Dashboardings. Mit Checkmk 2.0 haben wir nicht nur das Look and Feel der Dashboards überarbeitet, sondern auch deren Handhabung vereinfacht. So widmete sich die erste Tech-Session der Konferenz dem Thema, wie sich mit der neuen Checkmk-Version hochwertige Dashboards erstellen lassen. tribe29-Gründer Mathias Kettner und Checkmk-Consultant Marcel Arentz zeigten am Beispiel eines Linux-Servers, wie sich dank der neuen Dashboarding-Funktionen mit wenigen Handgriffen beeindruckende Dashboards erstellen lassen. So kann man beispielsweise vordefinierte Zeitreihen-Graphen eines Services über das Aktionsmenü einem speziellen Dashboard zuweisen. Prinzipiell ist die Erstellung von Dashboards durch die neue Navigation deutlich einfacher als in den Vorgängerversionen.

Mathias Kettner (links) und Marcel Arentz zeigten das neue Dashboarding von Checkmk 2.0
Mathias (links) und Marcel zeigten, wie sich mit Checkmk 2.0 hochwertige Dashboards erstellen lassen

Neben der einfacheren Handhabung bei der Erstellung und Konfiguration von neuen Dashboards haben Mathias und Marcel auch die vier neuen Dashlet-Elemente vorgestellt. Diese geben Checkmk 2.0 neben den bereits verfügbaren Views wie der tabellarischen Auflistung von Items und den Zeitreihen-Graphen noch mehr Möglichkeiten für die Visualisierung von Monitoring-Daten.

So eignet sich das neue Tacho-Element beispielsweise dafür, einzelne Metriken anzuzeigen, die über eine Ober- oder Untergrenze verfügen, etwa die aktuelle Auslastung des Arbeitsspeichers. Dies ist auch der Unterschied zur Single-Metrik, die für Metriken konzipiert ist, die keine solche Begrenzung haben, etwa die Up-Time eines Systems. Beide Dashlet-Elemente lassen sich optional mit historischen Daten anreichern. Beim Tacho-Element ist dies ein Histogramm, das die Durchschnittswerte über eine bestimmte Zeitperiode anzeigt. Bei der Single-Metrik wird der historische Verlauf angezeigt. Darüber hinaus zeigen beide Elemente optional auch den Status des dazugehörigen Services an.

Mit dem Balkendiagramm bietet Checkmk ab der Version 2.0 zudem eine komplett neue Möglichkeit, Daten von verschiedenen Hosts zu visualisieren. So lässt sich beispielsweise mit dem Dashlet-Element der verfügbare Festplattenspeicher von verschiedenen Hosts in einem Balkendiagramm zusammenfassen.

Aber auch das Scatterplot-Diagramm sammelt Daten von verschiedenen Hosts, inkludiert dabei aber auch die historischen Daten. Mit dem Scatterplot visualisiert Checkmk Metriken wie beispielsweise die CPU-Last von mehreren Hosts über einen gewissen Zeitraum, wobei ein Host eine Linie darstellt. Auf diese Weise lassen sich sofort Ausreißer erkennen. Darüber hinaus zeigen zwei Graphen den Median der oberen und unteren Werte an.

Im Zusammenspiel mit den Zeitreihen-Graphen und Tabellenansichten bietet Checkmk auf diese Weise die Möglichkeit, mit ausdrucksvollen Dashboards seine Monitoring-Daten visuell zu organisieren. In diesem Blogartikel finden Sie weitere Informationen zur überarbeiteten GUI und den neuen Dashlet-Elementen.

Keynote: IT-Monitoring von hybriden Infrastrukturen

Den offiziellen Startschuss für die Checkmk Conference #7 gab tribe29-CEO Jan Justus in seiner Keynote auf der Main Stage. Darin ging er nicht nur auf das Programm der beiden Konferenztage ein, sondern sprach auch über die aktuellen Herausforderungen des IT-Monitorings. So sei es mittlerweile der Status quo in Unternehmen, dass diese neben den traditionellen IT-Stacks auch immer mehr auf moderne, Cloud-native IT-Stacks setzen. Diese hybride und heterogene Welt aus On-Premises, Cloud, Container, Kubernetes etc. gelte es auch im IT-Monitoring abzubilden und zu überwachen – idealerweise mit Checkmk.

CEO Jan Justus während seiner Keynote
tribe29-CEO Jan Justus eröffnete die Checkmk Conference #7 mit seiner Keynote

tribe29 hat viel Aufwand betrieben, die tägliche Arbeit mit Checkmk durch die neue Nutzeroberfläche deutlich zu verbessern. Ein bestmögliches Hybrid-IT-Monitoring leistet Checkmk durch die Integration von Observability-Tools und Enterprise-IT, also dem Einbinden der verschiedenen IT-Systeme und -Lösungen, die Unternehmen für ihren Geschäftsbetrieb benötigen. APIs und Integrationen erlauben Unternehmen dabei mit dem Best-of-Breed-Ansatz ein umfassendes, flexibles Monitoring.

Um die Integration der Enterprise-IT in das IT-Monitoring zu ermöglichen, setzt tribe29 auf Open-Source. Dies bietet unserer Meinung nach die nötige Flexibilität und Anpassbarkeit, um die hybride IT-Infrastruktur in Unternehmen auch im Monitoring abbilden zu können. Dieser Ansatz spiegelt sich nicht nur in der Enterprise Edition wieder, sondern zeigt sich auch darin, dass wir die Open-Source-basierte Checkmk Raw Edition stetig verbessern. Diese hat mit dem neuen Produktrelease neue Funktionen erhalten und wird auch in Zukunft von zahlreichen Verbesserungen profitieren.

Der Open-Source-Ansatz erlaubt es auch unserer Community eigene Erweiterungen für das IT-Monitoring zu entwickeln. Mit der neuen Check-Plugin-API wird es zum Beispiel für Nutzer einfacher, ihre eigenen Konnektoren in Checkmk zu integrieren. Darüber hinaus arbeiten wir gemeinsam mit unserer Community daran, Checkmk in mehr Sprachen verfügbar zu machen.

In seiner Keynote hat Jan auch einen Blick auf die zukünftige Entwicklung von Checkmk und somit auf die Inhalte des zweiten Konferenztages geworfen: Derzeit arbeitet tribe29 daran, das Cloud-Monitoring zu vereinfachen sowie das Kubernetes-Monitoring mit Checkmk zu verbessern. Neben einem einfacheren Deployment in der Cloud durch die Bereitstellung von Checkmk über den Azure- und AWS-Marketplace soll es künftig möglich sein, auch On-Premises-Assets aus der Cloud heraus zu überwachen. Dafür ist es nötig, dass die Agenten die Daten „in die andere Richtung“ übertragen, also dass sie die Monitoring-Daten in die Cloud pushen. Ein Baustein für ein verbessertes Kubernetes-Monitoring sind beispielsweise vordefinierte Konfigurationen, die die Installation von Checkmk für Kubernetes deutlich vereinfachen.

Zudem stehen mit der Überarbeitung der bestehenden Integrationen von Grafana und InfluxDB sowie einer neuen DataDog-Schnittstelle drei weitere Punkte auf der Checkmk-Roadmap.

The State of Checkmk

Einen ausführlichen Überblick über den aktuellen Status von Checkmk hat Lars Michelsen, Head of Development bei tribe29, in seinem Vortrag gegeben. Mit der neuen UX, der neuen Check-Plugin-API sowie der neuen Rest-API hat es drei große Veränderungen in Checkmk 2.0 gegeben. Ferner hat Checkmk durch die Integration von ntops Network-Flow-Monitoring einen weißen Fleck im Netzwerkbereich geschlossen. Dank der Integration ist es nun möglich, tiefere Einblicke in den Netzwerkverkehr zu bekommen. Die Integration von Prometheus-Connectoren erlaubt Unternehmen, die Prometheus für ihr Kubernetes-Monitoring nutzen, das Einbinden von Monitoring-Daten in Checkmk.

Auch Lars ging noch einmal auf die Vorzüge des komplett überarbeiteten Nutzeroberfläche und der neu konzipierten Navigation ein. So soll das neu gestaltete Main Dashboard in Checkmk den Nutzer dabei unterstützen, Trends sofort zu identifizieren, indem es eine breite Übersicht über die überwachten Services bereitstellt und neben dem Status des Monitorings auch den Zustand der IT-Infrastruktur abbildet. Checkmk stellt hierfür mit der Main Overview, dem Problem Dasboard und dem Checkmk Dashboard drei Dashboards zur Verfügung. Der Wechsel lässt sich einfach über drei Icons in der Top Bar durchführen. Ferner ist es möglich, ein benutzerdefiniertes Dashboard nach dem Einloggen in die Weboberfläche anzeigen zu lassen.

Als Head of Development bei tribe29 spricht Lars Michelsen
Als Head of Development bei tribe29 gab Lars Michelsen einen ausführen Überblick über den aktuellen Stand von Checkmk 2.0

Mit der neuen REST-API bietet Checkmk 2.0 darüber hinaus auch mehr Optionen für die Automatisierung des Monitorings. Mit der neuen Schnittstelle ist es im Vergleich zur vorherigen Web-API nicht nur möglich, beispielsweise Host-Konfigurationen zu automatisieren, sondern auch Status-Informationen aus dem Monitoring zu erhalten oder Operationen wie die Erstellung von Downtimes auszuführen.

Durch die ebenfalls neu eingeführten Check-Plugin-API hat tribe29 außerdem den Support der mittlerweile fast 2.000 offiziellen Check-Plugins zukunftssicher gemacht. Die neue API folgt Best Practices beim Check-Design und führt zudem Standards ein, die die Verwaltung und Sicherheit der Plugins gewährleisten. Zudem gibt es auch zusätzliches Material, das Checkmk-Nutzer bei der Entwicklung eigener Plugins unterstützen soll. Erfahren Sie alle wichtigen Informationen zur neuen REST-API und der Check-Plugin-API.

Auf der Perfomance-Seite hat sich mit Checkmk 2.0 ebenfalls einiges getan. So ist die Architektur des in der Enterprise Edition implementierten Checkmk Micro Cores (CMC) grundsätzlich überarbeitet worden. Dadurch benötigt das Monitoring mit Checkmk nun deutlich weniger Ressourcen. Lesen Sie, wie die neue Architektur des CMCs konzipiert ist.

Auch das Kapazitäts-Management mit Checkmk wird mit Version 2.0 einfacher: Die Forecasting-Graphen wurden zwar bereits mit Checkmk 1.6 eingeführt – die Funktion musste aber zusätzlich installiert und aufwendig konfiguriert werden. Mit Checkmk 2.0 hat tribe29 die Engine durch eine eigene, schlankere Lösung ersetzt. Außerdem gehört die Prognosemöglichkeit nun standardmäßig zum Funktionsumfang von Checkmk.

Zum Abschluss seines Vortrags ging Lars auch auf die Migration von Checkmk auf Python 3 ein. Insgesamt mussten über 700.000 Zeilen Code von Python zwei auf Python 3 migriert werden. Dies habe zwar an einigen Stellen zu einigen Probleme geführt, jedoch unterm Strich seien dies weniger Probleme als erwartet gewesen.

Fireside Chat: Plauderei aus dem Nähkästchen

Der letzte Programmpunkt am ersten Tag war der sogenannte Fireside Chat. In lockerer Atmosphäre und mit einem frisch gezapften Bier ließen Jan, Mathias und Lars den ersten Tag im TV-Studio ausklingen. Dabei sprachen sie nicht nur über die Entwicklung der aktuellen Checkmk-Version, sondern plauderten auch über die Anfangszeiten von Checkmk: Nämlich wie Lars der erste Mitarbeiter von Mathias wurde und wie sich die Zusammenarbeit während der Anfangszeit gestaltete. Dabei erfuhren die Zuschauer unter anderem, dass Lars ein „schlechter“ Consultant ist, weil er ein auf fünf Tage angelegtes Projekt innerhalb von zwei Tagen abgeschlossen hat. Mathias und Lars erzählten aber auch über den ersten Meilenstein ihrer Zusammenarbeit: Den selbst entwickelten Checkmk Micro Core. Dieser ermöglichte es ihnen neben der Open-Source-Version, die auf dem Nagios-Core basiert, nun auch eine deutlich schnellere und effizientere Enterprise Edition anzubieten – die Grundlage für den Erfolg von Checkmk.

Nach dem kleinen Ausflug in die Historie wurden via Zoom noch weitere Gäste zugeschaltet. So berichtete Community-Managerin Faye Tandog unter anderem über das Language-Programm. Derzeit seien bereits neun (maschinenübersetzte) Language-Pakete verfügbar. Jeder aus der Community kann mithelfen, die Übersetzungen zu optimieren und so Checkmk in seiner Muttersprache verfügbar zu machen. Sie können unter translate.checkmk.com am Projekt mitarbeiten. Die Language-Pakete stehen als MKP-Paket in unserem Exchange zum Download bereit.

Mit Andreas Döhler und Robert Sander waren zudem zwei aktive Mitglieder aus der Checkmk-Community in das Studio zugeschaltet. Sie erzählten, warum ihnen die Arbeit mit Checkmk Spaß macht und warum sie ihr Checkmk-Wissen gerne auch im Forum mit den anderen Nutzern weitergeben, wenn es ihre Zeit zulässt.

Letzter Gast des Abends war Checkmk-Entwickler Moritz Kiemer. Er berichtete über die Entwicklung der neuen Check-API und welche Hindernisse und Diskussionen auf dem Weg vom Konzept bis zur funktionierenden API bewältigt werden mussten. Gleichzeitig gab Moritz aber auch einen Ausblick auf die weiteren Pläne bezüglich der API, etwa von vorkonfigurierten Cluster-Setups für Services.

Mit dem Fireside Chat war dann auch der erste Konferenztag zu Ende. Am zweiten Tag der Konferenz stand dann die zukünftige Entwicklung von Checkmk im Fokus.