Ep. 13: Pianificazione dei tempi di inattività in Checkmk
[0:00:00] | Bentornati al canale di Checkmk e in questo episodio ci occuperemo dei tempi di inattività programmati. |
[0:00:15] | I tempi di manutenzione cosa sono e come li gestisce Checkmk? Il sistema di monitoraggio deve rilevare i problemi e avvisare in caso di guasti hardware o software. Tuttavia, possono verificarsi interruzioni pianificate, spesso legate alla manutenzione. Ad esempio, quando si desidera aggiornare il firmware di uno switch. Allora si sa che il dispositivo non sarà disponibile per un certo periodo di tempo. |
[0:00:38] | È possibile programmare questi tempi di manutenzione in Checkmk. Quando si esegue questa operazione, si verificheranno alcune cose, come ad esempio la comparsa di un'icona sull'host o sul servizio, l'assenza di problemi nelle visualizzazioni dei problemi o nelle dashboard, la mancata ricezione di notifiche durante il periodo di inattività e, inoltre, l'esecuzione di un'analisi della availability in un secondo momento, se si sceglie di gestire queste interruzioni pianificate in modo diverso rispetto a quelle non pianificate. |
[00:01:09] | Inoltre, all'inizio e alla fine di un'interruzione, tutte le persone interessate riceveranno una notifica che le informerà di ciò che sta accadendo. Il modo in cui si imposta questo aspetto in Checkmk è quello che vi mostrerò ora. |
[00:01:21] | Se avete visto il nostro episodio sul riconoscimento dei problemi, allora alcuni di questi passaggi vi sembreranno già familiari. Per programmare un downtime bisogna innanzitutto scegliere l'host o il servizio che sarà interessato. Per ora scegliamo il DB_server 1. È importante sapere che quando si applica un downtime a un host, questo verrà applicato anche a tutti i suoi servizi. |
[00:01:45] | Ma se lo applicassi qui, verrebbe applicato solo a tutti i servizi ma non all'host stesso. Facciamo quindi clic sul nome dell'host. Abbiamo due opzioni: possiamo fare clic su questo pulsante 'Pianifica i tempi di inattività' oppure possiamo andare nel menu dei comandi e fare clic su Pianifica i tempi di inattività. |
[0:02:05] | Questo è tutto ciò che è possibile configurare per quanto riguarda i tempi di inattività. Il comando è necessario e può essere utilizzato per informare il collega del motivo del fermo macchina, quindi sceglierò 'Necessita di aggiornamento del firmware', e poi si può configurare il tempo necessario e quando deve iniziare. |
[0:02:26] | Si può dire da ora per 60 minuti o qualsiasi cosa si digiti, oppure si può dire da ora per 2 ore o oggi, il resto della settimana, questo mese, il resto dell'anno o si può impostare un intervallo di tempo personalizzato. Ad esempio, se sapete che il tempo di inattività sarà domani per due ore dalle 14:00 alle 16:00, potete configurarlo qui. |
[0:02:54] | Ma per ora impostiamolo da ora per 2 ore e premiamo 'Conferma' e torniamo ai dettagli dell'host. L'icona che vedete qui indica che questo host è ora inattivo e ogni volta che c'è un problema con questo host non verrà visualizzato qui nella panoramica in una barra laterale. |
[0:03:17] | Ma per fare una prova, assicuriamoci che questo host vada giù, in modo da poterlo vedere in azione. Ora possiamo vedere chiaramente che questo host è inattivo, ma non compare nella panoramica tra i problemi non gestiti. |
[0:03:29] | Se volete saperne di più sui tempi di inattività o volete modificarli, potete cliccare su questa icona e vi verrà mostrato un elenco di tutti i tempi di inattività attuali e futuri. |
[0:03:45] | Potete vedere quando inizia, quando finisce e potete vedere anche il commento. Poiché non sempre tutto va secondo i piani, spesso capita di voler prolungare il tempo di inattività. |
[0:04:03] | Per farlo è possibile modificarlo, ma se ci sono più tempi di inattività qui, qualsiasi cosa si faccia con la rimozione o la modifica dei tempi di inattività si applicherà a tutti i tempi di inattività dell'elenco. |
[0:04:15] | Quindi, in questo caso, dovrete usare le caselle di controllo e selezionare il tempo di inattività programmato che volete modificare o rimuovere. Quindi ora modifichiamolo. Ora è possibile estendere facilmente la manutenzione programmata o il tempo di inattività di 30 minuti, un'ora o un periodo di tempo personalizzato. Quindi, se abbiamo bisogno di un'ora in più, possiamo semplicemente aggiungerla in questo modo, premendo ancora una volta "Conferma". |
[0:04:50] | E torniamo all'elenco. Ok e ora si vede che la fine sarà tra 176 minuti invece di 116 minuti. E come avrete visto prima, c'erano alcune altre opzioni che potevamo configurare durante la creazione del tempo di inattività. C'erano altre opzioni interessanti quando si configurava un tempo di inattività, quindi torniamo al nostro host. |
[0:05:26] | E configuriamo un nuovo downtime. Abbiamo già trattato la sezione dei commenti e il periodo di tempo, ora parliamo di queste tre caselle di controllo. La prima consente di configurare una finestra temporale flessibile in cui il downtime deve iniziare. Quindi, se sapete che il tempo di inattività durerà un'ora, ma non sapete esattamente quando inizierà, potete configurare una finestra temporale e ogni volta che l'host si spegnerà, inizierà il tempo di inattività programmato per un'ora. |
[0:05:57] | C'è poi la seconda opzione, che consiste nell'impostare il tempo di inattività anche su tutti gli host figli e questo è particolarmente utile quando si esegue la manutenzione di un router o di uno switch a cui sono collegati altri host. Infatti, dal punto di vista del sistema di monitoraggio, se il router o lo switch dovessero andare in tilt, anche tutti gli host collegati andrebbero in tilt e questo potrebbe causare una serie di problemi e notifiche che non si vorrebbero. |
[0:06:28] | È anche possibile farlo in modo ricorsivo se si hanno più livelli di host connessi. La terza opzione consente di rendere il tempo di inattività un evento ricorrente, per cui, ad esempio, se sapete che un certo server deve essere riavviato ogni settimana a una certa ora, potete programmare il tempo di inattività in modo che corrisponda al riavvio e non dobbiate riconfigurarlo ogni settimana. Tuttavia, questa opzione è disponibile solo nell'edizione enterprise e nella versione gratuita dell'edizione enterprise, ecco perché si dice che funziona solo con il microcodice. |
[0:07:11] | Quando si dispone di un gran numero di host con un programma di manutenzione ricorrente che segue lo stesso principio, può essere piuttosto complicato configurare i tempi di inattività per ogni singolo host. |
[0:07:22] | Soprattutto quando si aggiunge un host e si deve configurare nuovamente il tempo di inattività. Ecco perché è possibile pianificare la manutenzione ricorrente utilizzando le regole. Quindi, se aprite il menu di configurazione e cercate 'downtime'. |
[0:07:38] | Si possono vedere queste due opzioni: una per impostare i tempi di inattività ricorrenti per i servizi e una per gli host. Qui potete creare una regola come fareste con qualsiasi altra regola, come abbiamo già fatto in un episodio precedente. |
[0:07:53] | Ora per la configurazione, dobbiamo impostare il commento come sempre, quindi il riavvio dei server di database. Poi dobbiamo impostare il primo o il corrente del tempo di inattività, quindi impostiamolo su oggi alle 17:00. |
[0:08:12] | Si può anche impostare l'ultima occorrenza, quindi se si sa che questo sarà solo per un anno, si può dire: "Ok, lo impostiamo per il 2022, sarà l'ultima volta che si verificherà questo downtime". Ma non facciamolo per ora. |
[0:08:28] | Poi dobbiamo impostare l'intervallo, che può essere ogni ora, ogni giorno, ogni due settimane. Ma atteniamoci a ogni settimana e poi alla durata del tempo di inattività. Per un riavvio non dovrebbero essere necessari più di 10 minuti e possiamo anche configurare un orario di inizio flessibile. |
[0:08:49] | Forse non tutti i server si riavvieranno nello stesso momento, quindi impostiamo 30 minuti. E poi dobbiamo impostare la condizione, in modo da sapere a quale host si applicherà. Possiamo usare un tag host per questo, abbiamo già aggiunto i tag host in un episodio precedente. |
[0:09:14] | Ad esempio, l'abbiamo impostato su tutti i nostri server di database. Ora questa regola deve essere applicata a tutti i server o a tutti gli host con il tag host application database. L'ultima cosa che vorrei mostrarvi è la panoramica storica di tutti i tempi di inattività. |
[0:09:36] | Se andate nel menu di monitoraggio potete cercare i tempi di inattività e vedrete la cronologia dei tempi di inattività. Questa è una panoramica di tutti i tempi di inattività di tutti i vostri server. Si tratta di un elenco piuttosto breve, ma naturalmente destinato a crescere nel tempo. |
[0:09:54] | Questo è tutto per questo episodio. Grazie per averci seguito. Se vi è stato utile, iscrivetevi al canale e mettete "mi piace" al video. Spero di vedervi nel prossimo episodio. |
Vuoi saperne di più su Checkmk? Partecipa al nostro webinar "Introduzione a Checkmk".