Ep. 12: Riconoscimento dei problemi in Checkmk

Per caricare questo video di YouTube è necessario accettare i cookie pubblicitari.

[0:00:00] Bentornati al canale Checkmk e in questo episodio daremo un'occhiata al riconoscimento dei problemi in Checkmk.
[0:00:16] Cos'è un problema? Semplicemente ogni volta che un host o un servizio non ha lo stato OK. Quindi, quando un host ha lo stato down o un servizio ha lo stato CRIT, WARN o Unknown. Checkmk distingue tra problemi gestiti e non gestiti; quando un problema è gestito significa che l'utente ne è a conoscenza e che qualcuno se ne è occupato; contrassegnare questi problemi come gestiti è ciò che chiamiamo riconoscimento del problema.
[0:00:45] Ogni volta che si riconosce un problema, si avranno tre effetti: si vedrà un'icona accanto al nome del servizio che indica che il problema è stato riconosciuto, si smetterà di ricevere notifiche e il problema verrà rimosso da alcune visualizzazioni. Ad esempio, scomparirà dalla sezione dei problemi non gestiti nella barra laterale.
[0:01:03] Vediamo ora come funziona tutto questo. Il riconoscimento dei problemi funziona tramite comandi. Per eseguire un comando è necessario innanzitutto scegliere il servizio sul quale si desidera eseguire il comando. Passiamo quindi alla visualizzazione dei problemi del servizio e possiamo arrivarci utilizzando la barra laterale e facendo clic su problemi non gestiti.

[0:01:26]

Qui vengono visualizzati tutti i problemi non gestiti di questo sistema. Scegliamo ad esempio il file system principale del nostro server Checkmk. Ora, per riconoscere un problema possiamo semplicemente fare clic sul pulsante Riconosci problemi o andare al menu dei comandi e fare clic su Riconosci problemi.
[0:01:48] Vedete che c'è un campo obbligatorio chiamato Commento, che potete usare ad esempio per far sapere ai vostri colleghi come intendete risolvere il problema. Digitiamo ad esempio: ordinato nuovo disco e confermiamo. Sì, conferma.
[0:02:10] Torniamo alla vista e notiamo che ci sono due nuove icone: questa (conferma) indica che il problema è stato riconosciuto e c'è la bolla vocale e se ci passate sopra vedrete il messaggio che abbiamo appena digitato, "ordinato un nuovo disco".
[0:02:30] Ora, se aggiorniamo la pagina o aspettiamo un po', vedremo anche che i problemi non gestiti sono uno in meno di quelli che abbiamo appena avuto. Ora sono quattro invece di cinque. Quindi torniamo di nuovo alla vista.
[0:02:47] Ora si vede che ci sono solo quattro problemi non gestiti. È anche possibile riconoscere più problemi contemporaneamente, facendo semplicemente clic su Riconosci i problemi in questa vista.
[0:03:02] In questo modo si riconosce il problema per tutti i servizi in questa vista. Possiamo quindi digitare, ad esempio, 'Il carico è OK' e poi fare clic su Riconosci e ora vediamo il messaggio 'Vogliamo davvero riconoscere i problemi per i 4 servizi seguenti?
[0:03:30] Ora torniamo alla vista e vediamo che tutti i problemi sono scomparsi. E ancora una volta nella barra laterale non ci sono più problemi non gestiti. Potreste trovarvi in una situazione in cui volete rimuovere un riconoscimento. Per farlo, andiamo su Monitor e poi su 'Problemi di servizio'.
[0:03:54] In questa vista vengono visualizzati tutti i problemi gestiti e non gestiti o non riconosciuti. Anche in questo caso è possibile rimuovere il riconoscimento per un singolo problema o per tutti insieme. Per rimuoverlo per tutti in una volta, basta fare clic su Riconosci i problemi e fare clic sul pulsante 'Rimuovi riconoscimento'.
[0:04:17] Ancora una volta appare il messaggio (se) "Vuoi davvero rimuovere il riconoscimento per tutti e 5 i servizi?" Sì, vogliamo farlo, quindi premiamo "Conferma". Torniamo alla vista dei problemi di servizio e noteremo che le due icone sono scomparse. Ora abbiamo di nuovo cinque problemi non gestiti. Come ho detto, è possibile eseguire questa operazione per un servizio alla volta o per tutti in una volta, ma è anche possibile effettuare una sotto-selezione ed eseguire il comando su alcuni problemi alla volta.
[0:04:48] A tale scopo si può utilizzare un filtro per filtrare alcuni problemi e poi applicare il riconoscimento su quella vista filtrata oppure si possono utilizzare le caselle di controllo come questa. Ad esempio, potete scegliere queste tre, premere "Riconosci i problemi", digitare il vostro commento e premere Conferma.
[0:05:23] Ora avete due link invece di uno. Se volete tornare alla vista precedente con le caselle di selezione ancora selezionate, potete premere 'Torna alla vista', mentre se volete resettare le caselle di selezione premete il secondo link. Quindi, se si vuole eseguire un altro comando sugli stessi servizi, si può tornare alla vista con le caselle ancora selezionate.
[0:05:52] Avrete notato che ci sono alcune opzioni aggiuntive per il riconoscimento dei problemi, che non ho ancora spiegato. Vediamo ora queste opzioni, che possono essere molto utili. Torniamo quindi ai problemi non gestiti.
[0:06:07] Clicchiamo su Riconosci i problemi e vediamo che ci sono tre caselle di controllo e la possibilità di aggiungere una data in giorni, ore e minuti. Cominciamo con questo. Impostando una data, si imposta una data di scadenza per il riconoscimento.
[0:06:27] Ad esempio, se vi aspettate che un problema venga risolto entro un giorno, potete configurarlo qui. Poi, dopo quel giorno, se il problema esiste ancora, riapparirà tra i problemi non gestiti.
[0:06:38] E si ricomincerà a ricevere le notifiche. Tuttavia, questa funzione è disponibile solo nell'edizione enterprise e nella versione gratuita dell'edizione enterprise.
[0:06:48] C'è anche una casella di controllo chiamata 'sticky', un po' più sottile. Può succedere che un servizio passi prima in stato WARN e poi in stato CRIT, la domanda è: cosa succede con la conferma? Per esempio, diciamo che il server del file system dovrebbe passare in stato di warning quando è pieno all'80%, ma poi passa allo stato di CRIT.

[0:07:13]

Dovrebbe essere un nuovo problema non gestito o dovrebbe essere riconosciuto? Se volete che appaia come un nuovo problema, dovete assicurarvi che la casella di controllo non sia selezionata.
[0:07:26] Se è selezionata, il problema verrà riconosciuto fino a quando il servizio non tornerà ad essere OK. La casella di controllo Invia notifiche significa semplicemente che verrà inviata una notifica (alle persone che rispondono) alle persone responsabili per informarle che il problema è stato riconosciuto.
[0:07:46] In futuro faremo un video separato sulle notifiche. Infine, abbiamo la funzione di commento persistente. Se questa funzione è selezionata, significa che il commento non scomparirà quando verrà riconosciuto.
[0:08:03] Normalmente sono collegati in modo tale che quando un servizio torna a OK sia la conferma che il commento scompaiono, ma con questa funzione è possibile fissare il commento al servizio. Questo significa anche che dovrete rimuoverlo manualmente quando non ne avrete più bisogno.
[0:08:24] Questo è quanto per il riconoscimento dei problemi in Checkmk. Spero che questo episodio vi sia stato utile. In caso affermativo, vi prego di iscrivervi al canale e di mettere "Mi piace" al video. Ci vediamo nel prossimo episodio.

Vuoi saperne di più su Checkmk? Partecipa al nostro webinar "Introduzione a Checkmk".

Registrati adesso

Altri Video di Checkmk