Ep. 12: Probleme Quittieren in Checkmk

Hinweis: Alle Videos sind im deutschen Originalton und verfügen über englische Untertitel. Zudem stellen wir für alle Inhalte die Transkripte auf Englisch zur Verfügung.

[0:00:00] Willkommen zurück im Checkmk-Channel.Heute schauen wir uns das Quittieren von Problemen an.
[0:00:16] Quittieren von Problemen, um was geht es hier eigentlich? Ja, was ist eigentlich ein Problem? Na, ein Problem ist, wenn ein Host oder ein Service nicht okay ist.
[0:00:22] Also, zum Beispiel ein Host der DOWN ist, oder ein Service, der WARN, CRIT oder UNKNOWN ist, das nennt man Problem. So, jetzt unterscheidet Checkmk zwischen zwei Arten von Problemen. Nämlich solchen, die unbehandelt sind, und solche, die behandelt sind.
[0:00:35] Also, behandelt heißt im Prinzip so viel wie das Problem ist bekannt, da kümmert sich schon jemand drum. Und Quittieren von Problemen sorgt einfach dafür, dass ein Problem danach als behandelt gilt.
[0:00:45] Das hat dann drei Auswirkungen: Das Erste ist, dass man in der Oberfläche ein Icon sieht dabei. Das Zweite ist, dass eventuell weitere Alarmierungen dann ausbleiben zu dem Problem, und das Dritte ist, dass es in manchen Ansichten halt verschwindet, zum Beispiel in der "Tactical Overview" taucht es dann eben nicht mehr unter "Problems" auf - unter "Unhandled", sondern nur noch in den "Handled Problems". Und es gibt auch andere Problemansichten, wo diese Sachen dann rausfliegen, sodass man immer im Operating den Überblick hat über die neuen, momentan noch nicht bekannten oder nicht behandelten Probleme.
[0:01:17] Und wie das jetzt genau geht, dass zeige ich euch jetzt. Das Quittieren von Problemen funktioniert über Kommandos. Um ein Kommando für einen Host oder Service auszuführen, muss ich den erstmal auswählen. Ich gehe zum Beispiel den Weg über die "Tactical Overview" und über das Feld "Problems" und sehe hier meine aktuellen 6 Probleme.
[0:01:37] Da wähle ich mal das Erste jetzt aus, das "Filesystem root" vom "mycmkserver" und jetzt gehe ich oben auf diesen kleinen Hammer, und bekomme dann alle möglichen Kommandos angezeigt. Und das was ich brauche, ist auch gleich das Erste.
[0:01:51] Ich gebe in das Kommentarfeld einen Text ein: "Disk is ordered" zum Beispiel und drücke jetzt einfach hier auf "Acknowledge" und bestätige das Ganze, und jetzt seht ihr erstens, dieses Icon neu, das heißt nämlich, dass das Problem erkannt wurde, und das zweite Icon gleich daneben ist der Kommentar, den ich eingegeben habe.
[0:02:16] Wenn man jetzt die Sidebar neu lädt oder einfach ein bisschen wartet, dann sieht man , dass die Anzahl der "Unhandled Problems" jetzt um 1 weniger geworden ist, weil dieses Problem jetzt als handeled gilt, und somit aus der Liste herausfliegt. Ihr könnt auch mehrere Probleme auf einmal quittieren.
[0:02:33] Und, das ist auch sehr einfach, zum Beispiel könnte ich einfach sagen, diese 5 unhandled Probleme, die ihr hier habt, die quittiere ich alle gemeinsam, die gehören hier auch alle zusammen, handelt sich bei allen um die CPU-Load, wenn ich jetzt hier also in der Liste auf den Hammer gehe und ein Kommando ausführe, dann gilt es automatisch für alle Sachen in der Liste.
[0:02:55] Ihr seht auch hier "Do you really want to acknowledge the problems on the following 5 services?" Es geht also um diese 5 Services. Wenn ich jetzt hier bestätige, habe ich die alle 5 quittiert und, wie man sieht, sind die jetzt aus den "Unhandled Problems" wieder raus, es gibt also keine "Unhandled Problems", ich habe jetzt nur noch - natürlich nach wie vor habe ich von meine 6 Probleme, aber die sind jetzt alle quittiert.
[0:03:18] Was man macht, muss man auch immer rückgängig machen können, in dem Fall möchte ich möglicherweise auch mal eine Quittierung wieder entfernen.
[0:03:25] Das geht eigentlich auf dem gleichen Weg: Ich wähle mir die Objekte aus, die ich entfernen will, zum Beispiel von allen, gehe wieder auf den Hammer und jetzt findet ihr eben diesen Knopf auf der rechten Seite, "Remove Acknowledgement", da braucht man auch keinen Kommentar eingeben, einfach auf "Remove" drücken, auf "Yes" klicken, zurück zur Ansicht und ihr seht die ganzen Acknowledgement-Symbole sind verschwunden.
[0:03:48] Jetzt natürlich die nächste Frage noch: Vielleicht möchte ich auch nicht diese ganze Liste hier auf einmal bearbeiten, sondern nur einige daraus.
[0:03:56] Da gibt es prinzipiell zwei Möglichkeiten: Das eine ist, dass ihr über Filter, die ihr hier oben findet, die Auswahl einschränkt, ihr könnt aber auch die Checkboxen einschalten, das ist dieser kleine Knopf hier, dann bekommt jede Zeile eine Checkbox, und jetzt kann ich hier einfach auswählen, welche Services ich mit dem Kommando beglücken will, zum Beispiel diese 3, gehe dann wieder auf meinen Hammer, wähle aus "Acknowledge", ich gebe hier einfach mal "Test" ein, und ihr seht jetzt geht es nur um die 3 Services, die hier angezeigt werden.
[0:04:28] Drücke auf "Yes" und gehe zurück zur Ansicht. Hier gibt es übrigens zwei Links. Ich kann zurück zur Ansicht gehen, mit den Checkboxen wieder gelöscht, oder ich kann zurückgehen, sodass die Checkboxen erhalten bleiben, weil ich vielleicht noch ein weiteres Kommando auf diesen Objekten machen möchte.
[0:04:47] Wie euch vielleicht aufgefallen ist, gibt es in dem Kasten für das Kommando zum Acknowledgement noch ein paar interessante Optionen, die ich noch nicht erklärt habe. Das möchte ich jetzt nachholen, weil da doch ein paar sehr interessante Features sind.
[0:04:58] Ich gehe also nochmal auf den Hammer, und wir schauen uns nochmal diesen Kasten an. Dazu klappe ich jetzt mal die Seitenleiste ein, dass wir es besser sehen.
[0:05:06] Also, es gibt hier drei Checkboxen und dann gibt es hier noch eine Zeitangabe. Fangen wir vielleicht mit der an. Ihr könnt hier sagen "Expire Acknowledgement after" und dann Tage, Stunden, Minuten angeben. Das bedeutet, dass jetzt so eine Quittierung eine Ablaufzeit hat.
[0:05:20] Ihr könnt zum Beispiel sagen, normalerweise müsste das Problem in einem Tag behoben sein. Dann setzt ihr diese Quittierung auf einen Tag Ablaufzeit und dann wäre es so, dass, wenn das Problem nach einem Tag immer noch besteht, die Quittierung verschwindet, und das Problem wieder als unhandled auftaucht, weil sich vielleicht doch niemand gekümmert hat. Das ist allerdings ein Feature, das es nur in der Enterprise Edition gibt.
[0:05:43] Dann gibt es hier noch die die Checkbox "sticky", dies jetzt ein bisschen subtiler. Es könnte ja sein, dass ein Problem zum Beispiel im Zustand WARN ist und dann später erst auf den Zustand CRIT geht.
[0:05:56] Die Frage ist jetzt, was passiert mit einer Quittierung. Zum Beispiel ein Problem, dass ein Filesystem im WARN-Zustand ist, weil es 80 Prozent voll ist, und jetzt ist die Frage: Möchtet ihr, das wenn es danach auf CRIT geht, das es dann wieder als an unhandled gilt, als neues Problem, dann dürfte dieses Sticky-Checkbox nicht setzen.
[0:06:17] Wenn die gesetzt ist, würde es bedeuten, dass das so lange quittiert bleibt, bis es wieder auf OK geht. "send notification" ist per Default eingeschaltet, und bedeutet einfach, dass eine Alarmierung ausgelöst wird.
[0:06:29] Zum Thema Alarmierung werden wir noch ein separates Video machen, aber bei der normalen Einstellung würde das heißen, dass die zuständigen Leute einfach eine E-Mail bekommen, dass dieses Problem quittiert wurde.
[0:06:39] Und, das "persistant comment", wenn ich das ankreuze, dann wird der Kommentar, der an den Service gehängt wird, auch dann bestehen bleiben, wenn die Quittierung wieder verschwindet.
[0:06:50] Normalerweise sind die so verbunden, dass wenn er zum Beispiel wieder auf OK geht, der Service, dass auch der Kommentar wieder verschwindet.
[0:06:56] So könnt ihr aber den Kommentar quasi fest-heften, dran kleben und müsste ihn dann später manuell wieder entfernen, wenn ihr ihn nicht mehr braucht.
[0:07:04] So, das war schon alles zum Thema Quittierungen, ich hoffe, es hat euch gefallen und wir sehen uns wieder bei der nächsten Episode über das Thema "Downtimes".

Wollen Sie mehr über Checkmk erfahren? Dann nehmen Sie an unserem Webinar "Einführung in Checkmk" teil!

Jetzt anmelden

Mehr Checkmk-Videos