Checkmk 2.0 ist hier! Alle Neuigkeiten erfahren.

Ep. 13: Arbeiten mit Wartungszeiten

Hinweis: Alle Videos sind im deutschen Originalton und verfügen über englische Untertitel. Zudem stellen wir für alle Inhalte die Transkripte auf Englisch zur Verfügung.

[0:00:00] Herzlich Willkommen zurück zur 13. Folge der Tutorial-Serie.
[0:00:03] Heute geht es um das Thema Wartungszeiten, oder auf Englisch Scheduled Downtimes.
[0:00:18] Wartungszeiten, um was gehts hier? Nun, unser Monitoring ist ja dafür da, dass es Probleme erkennt, also Ausfälle von Hard- oder Software oder sagen wir mal von Hosts oder Services.
[0:00:30] Jetzt gibt es aber manche Ausfälle, die nicht einfach so passieren, sondern die man vorher schon weiß, nämlich bei Wartungen. Wenn ihr zum Beispiel ein Firmware-Upgrade macht bei einem Switch, dann wird diese einfach eine kurze Zeit lang nicht verfügbar sein.
[0:00:41] Jetzt konnt ihr im Monitoring diese geplanten Wartungen vorher eintragen, und dann passieren bestimmte Dinge: Nämlich zum einen werden diese Probleme mit einem Icon gekennzeichnet im Monitoring, sie verschwinden dann aus der Liste in der Problemansicht oder auch bei der Tactical Overview, es gibt keine Alarmierungen während der Wartungszeit, und wenn ihr später mal eine Verfügbarkeitsanalyse macht, dann werden diese geplanten Wartungszeiten, wenn ihr das wollt, anders eingerechnet als ungeplante Ausfälle.
[0:01:13] Was es allerdings noch gibt als Alarmierung, ist das zu Beginn und zum Ende einer Wartungszeit eine spezielle Alarmierung rausgeschickt wird, an die betroffenen Personen, sodass die informiert sind darüber. Ja, und wie das jetzt geht, Einrichten von Wartungszeiten, schauen wir uns an.
[0:01:28] Das ist im Prinzip sehr ähnlich zu den Acknowledgements, also wenn ihr die vorhergehende Folge auch schon gesehen habt, dann werdet ihr das schon kennen, und jetzt heißt das Kommando eben nicht Acknowledgements, sondern Scheduled Downtime.
[0:01:41] Um eine Wartungszeit zu setzen, sucht ihr jetzt euch erstmal den Host oder Service raus, um den es geht. Dabei ist es ganz einfach zu wissen, wenn ein Host in Wartungszeit gesetzt wird, gelten alle seine Services automatisch auch als in Wartung.
[0:01:54] Ich wähle mir jetzt zum Beispiel aus den Hosts einen aus, nehmen wir mal zum Beispiel den "dbserver01" So, jetzt gehe ich auf den drauf, jetzt muss aufpassen, ich komme jetzt zu der Liste der Services, und ich möchte nicht auf die Services eine Wartungszeit setzen, sondern auf dem Server selber.
[0:02:08] Also gehe ich jetzt hier auf den Host-Namen, bin bei den Details von diesem Host, und gehe jetzt wieder auf meinen Hammer, um ein Kommando auszuführen.
[0:02:18] Den ersten Kasten mit "Acknowledge" klappe ich jetzt zu, ich mach mal die Seitenleiste weg, damit man mehr Platz hat, und dann seht ihr im zweiten Kasten "Schedule Downtimes".
[0:02:28] Das Wichtigste, was jetzt angeben müsst, ist wieder mal ein Kommentar, zum Beispiel "Need firmware upgrade", und dann ist die zweitwichtigste Angabe, wann diese Wartungszeit laufen soll. Ihr können zum Beispiel sagen ab jetzt, für 60 Minuten, 2 Stunden oder den ganzen heutigen Tag, die heutige Woche, diesen Monat, sogar dieses Jahr, oder ihr könnt auch sagen einen Zeitbereich in der Zukunft.
[0:02:55] Also, wenn ihr zum Beispiel sagt, es ist gar nicht jetzt, sondern erst in einer Stunde oder sagen wir mal von 14:00 bis 16:00 Uhr, könnt ihr das natürlich auch entsprechend hier eintragen. Nehmen wir jetzt mal den einfachen Fall, dass wir die Wartungszeit von jetzt anmachen für die nächsten 2 Stunden, dann muss ich nur auf diesen Knopf hier drücken, dann kriege ich nochmal die Bestätigung, sage "yes", zurück zu dieser Ansicht und jetzt seht ihr eben hier ein kleines Symbol, dieser Host befindet sich in einer geplanten Wartung, die hat er jetzt gerade angefangen.
[0:03:32] Und damit sind wie gesagt die Alarmierungen ausgeschaltet, und wenn dieser Host jetzt DOWN wäre, was ja nicht im übrigen der Fall sein muss, dann würde er auch nicht bei den "Problems" hier angezeigt werden. Wenn ihr näheres zu der Downtime oder zu der Wartungszeit erfahren wollt, dann klickt ihr einfach auf dieses Icon drauf, und dann kriegt ihr die Liste der Downtimes oder Scheduled Downtimes genauer gesagt von dem Host dbserver01, meistens ist es sowieso nur eine, und die wird mir jetzt hier angezeigt.
[0:04:01] Ich sehe also dem Kommentar, den ich eingegeben habe, und ich sehe auch, wann sie angelegt wurde, und wann sie angefangen hat. Vor 162 Sekunden, sie endet 117 Minuten.
[0:04:11] Übrigens könnt ihr wie immer mit diesem Icon hier das Datumsformat umstellen, wenn euch dieser relative Zeitstempel irgendwie unübersichtlich ist, könnt ihr sagen ich will absolute Zeitstempel haben, und dann kriegt ihr das so angezeigt in dieser Darstellung hier.
[0:04:27] So, wenn ihr die Liste der Downtimes habt, von einem Host oder von Services, gibt es auch hier wieder Kommandos dafür. Und dann könnt ihr 2 interessante Dinge machen: Ihr könnt zum einen die Downtime hier entfernen mit dem "Remove"-Knopf.
[0:04:43] Ihr könnt aber auch die Downtime anpassen und eine sehr beliebte Option ist zum Beispiel die zu verlängern, wenn ihr zum Beispiel sagt: die Wartungszeit genügt mir nicht, ich brauche es noch länger, könnt ihr sagen okay, gibt mir noch eine Stunde mehr.
[0:04:56] Und dann wird die Wartungszeit einfach um diese eine Stunde nach hinten raus verlängert. Gehen wir nochmal zurück zu der Maske, wo man die Eigenschaften der Downtime einstellt. Da gab es noch ein paar interessante Optionen, die ich euch auch noch zeigen müsste. Also, ich gehe es einfach nochmal zurück zudem Host, und geht noch mal hier auf das Kommando, und, ich klappe nochmal die Seitenleiste ein.
[0:05:23] Also, wir hatten gesehen, es gibt einen Kommentar, da gibt es diese Zeitbereiche, es gibt hier noch ein paar andere sehr interessante Optionen.
[0:05:31] Die Option "flexibel with max. duration", das ist eine ganz interessante Sache, und zwar, wenn ihr sagt, ihr wisst noch gar nicht genau, wann ihr die Wartungszeit braucht, dann könnt ihr sagen binnen der nächsten zwei Stunden wird dieses Gerät in seine Wartungszeit gehen, und die Wartungszeit beginnt genau dann, wenn das Gerät auf DOWN gehen würde. Das verbirgt sich jetzt hinter dem, das heißt, wenn ich das jetzt ankreuze, dann wird die Wartungszeit nicht sofort beginnen, sondern erst dann, wenn das Ding tatsächlich auf kritisch geht, oder auch auf WARNING, und das muss aber innerhalb der nächsten zwei Stunden passieren, damit die Wartungszeit eintritt.
[0:06:18] Hier gibt es noch eine Option, die interessant ist, wenn man mit Router oder Switchen arbeitet. Das heißt, wenn ihr zum Beispiel ein Router wartet, und hinter dem Router sind ganz viele andere Hosts, die nur über den erreichbar sind fürs Monitoring. Dann würden natürlich hier auch Alarme passieren, oder die würden als DOWN gemeldet werden, und durch das Ankreuzen diese Option könnt ihr sagen: Die Wartungszeit gilt automatisch für den kompletten Netzwerkbereich der über diesen Host erreichbar ist.
[0:06:48] Und das kann man dann noch rekursiv machen, dann geht es also über alle Ebenen hinweg, dass ich wirklich alle Hosts erwische, die über den Router erreichbar sind, indirekt oder direkt. Die dritte Option ist nochmal eine ganz eigene Sache, zwar kann man Wartungszeiten auch so einstellen, dass sie sich regelmäßig wiederholen, dazu gibt es 2 Methoden, und zwar das eine ist über Regeln, dass andere ist hier direkt.
[0:07:15] Ich zeige einfach mal nur diese direkte Methode, und zwar werdet ihr dann sagen: diese Wartungszeit soll automatisch wiederholt werden, zum Beispiel jede Woche oder jeden Tag. Das heißt, die Zeiten, die hier oben einstellt, werden dann einfach auf jeden Tag oder beziehungsweise jede Woche wieder weiter übernommen und ihr könnt eine regelmäßige Wartungszeit einrichten, zum Beispiel sehr interessant, wenn ihr sagt alle eure Windows-Server würden einmal pro Woche neu gebootet werden, um eine bestimmte Uhrzeit, könnt ihr das als Wartungszeit eintragen.
[0:07:45] Das geht allerdings nur mit der Enterprise Edition und deswegen steht hier "This only orks when using CMC", das ist ja der Monitoringkern von der Enterprise Edition. Wenn ihr jetzt sehr viele Host habt, die nach dem gleichen Prinzip eine regelmäßige Wartungszeit brauchen, dann wäre es natürlich sehr umständlich, die alle per Kommando auszuwählen und dann diese Downtimes zu setzen.
[0:08:06] Vor allem deswegen, weil, wenn neue Hosts hinzukommen würden, würde das ja für die nicht gelten. Deswegen gibt es noch eine zweite Methode das zu machen, und das ist über Regeln. Dazu braucht ihr nur den richtigen Regelsatz, den findet ihr wie immer unter "Host & Service Parameters".
[0:08:21] Jetzt suche ich einfach mal hier nach dem Wort "downtime" und finde jetzt hier "Recurring downtimes for hosts" beziehungsweise "for services", und da kann ich jetzt eine Regel anlegen, die nachdem Grundprinzip funktioniert, wie alle Regeln.
[0:08:36] Dazu haben wir schon ein paar Videos gedreht, zum Thema Regeln. Und könnt jetzt hier einfach wieder eintragen, wann die Downtime jeweils starten und enden soll, und nach welchem Rhythmus die sich wiederholen soll. Und dann habt ihr den Vorteil, dass das eben nicht nur für die Objekte gilt, die bereits da waren, sondern, wenn jetzt einer neuer Host aufgenommen wird, für den die Regel greift, kriegt er automatisch auch diese regelmäßige Wartungszeit eingetragen, und damit seid ihr dann immer auf der sicheren Seite.
[0:09:04] Als letztes möchte ich noch zeigen, wie ihr einen Einblick bekommt in die Historie der Wartungszeiten, also wann haben Wartungszeiten begonnen und man haben sie geendet. Und dazu gibt es hier eine eigene Ansicht, die ihr findet unter "Views" "Other" und dort findet ihr "History of scheduled downtimes", und seht ihr zum Beispiel hier, das für unseren Host "dbserver01" eben vor 12 Minuten eine Wartungszeit gestartet ist, mehr haben wir jetzt in diesem Test-system nicht gemacht, aber natürlich wird diese Liste da mit der Zeit immer länger und da könnt ihr ganz genau alles nachvollziehen, wann Wartungszeiten angefangen und geendet haben.
[0:09:46] So, und das war es für heute schon wieder, Danke fürs Zuschauen und wir sehen uns das nächste mal zum Thema verteiltes Monitoring.

Wollen Sie mehr über Checkmk erfahren? Dann nehmen Sie an unserem Webinar "Einführung in Checkmk" teil!

Jetzt anmelden

Mehr Checkmk-Videos