Checkmk monitora gli ambienti retail di Edeka
Chi è Edeka Minden-Hannover?
Con un fatturato di 10,6 miliardi di euro nel 2020, 32.000 dipendenti e circa 1.600 negozi, Edeka Minden-Hannover è la più grande delle sette cooperative regionali Edeka in Germania. Il suo territorio si estende in tutta la Germania settentrionale, dal confine olandese a quello polacco. Copre una parte della Vestfalia orientale, la maggior parte della Bassa Sassonia e gli Stati federali di Brema, Sassonia-Anhalt, Berlino e Brandeburgo.

La velocità e il raggiungimento degli obiettivi, dalla pianificazione all'implementazione, ci hanno sorpreso. La collaborazione con Checkmk è stata professionale e pragmatica fin dall'inizio.
Edeka Minden-Hannover utilizza Checkmk dal 2012. Prima di Checkmk, il team IT utilizzava Nagios come soluzione di monitoraggio, che non era più sufficientemente scalabile e non era più in grado di soddisfare le esigenze di Edeka.
Inizialmente Checkmk doveva essere utilizzato come front-end per la gestione dell'ambiente Nagios, ma dopo poco tempo il team IT ha deciso di sostituire completamente Nagios con Checkmk. La migrazione dei 1.200 server Nagios è avvenuta senza problemi.
Le sfide non erano solo le grandi dimensioni del monitoraggio Nagios esistente, ma anche i requisiti speciali del settore della vendita al dettaglio.
Monitoraggio edge nei contesti retail
Edeka Minden-Hannover era alla ricerca di una soluzione economica, flessibile e moderna per monitorare i suoi negozi e i sistemi IT centrali. Inizialmente l'organizzazione ha scelto il software open source Nagios. Il team IT ha installato Nagios manualmente e lo ha ampliato poco a poco con componenti aggiuntivi come NSCA o NagVis. Tuttavia, le prestazioni di Nagios hanno presto raggiunto i propri limiti.

Un primo problema è stato il pesante carico di rete dovuto ai numerosi dettagli che il monitoraggio deve coprire. Inoltre, anche con strumenti di configurazione grafica come NConf, il carico di lavoro del team IT per la sola gestione dell'ambiente di monitoraggio era diventato insostenibile. Col tempo, anche il server Nagios si è rivelato un collo di bottiglia per le prestazioni. Pertanto, il team IT ha dovuto iniziare a cercare un'alternativa a Nagios. Edeka Minden-Hannover ha scoperto Checkmk e con esso è riuscita a sostituire facilmente l'ambiente Nagios. Grazie a Checkmk, il team IT può continuare a utilizzare i plug-in Nagios esistenti, dopo aver apportato alcune piccole modifiche. Poiché Checkmk funziona su tutte le principali distribuzioni Linux, Edeka Minden-Hannover ha potuto installare Checkmk anche sull'infrastruttura di server SUSE Linux Enterprise esistente.
I requisiti di monitoraggio di Edeka Minden-Hannover sono esigenti: Il team IT vuole raccogliere i dati di monitoraggio in una istanza centrale per poter avere una panoramica di tutti gli ambienti IT. Il monitoraggio deve generare automaticamente una mappa, basata sulle coordinate GPS, per monitorare lo stato centrale. In situazioni critiche, è importante anche inviare notifiche automatiche, ad esempio se in un negozio è pronta a funzionare una percentuale inferiore a quella specificata di registratori di cassa.
La sfida
La sostituzione di oltre 1.200 server Nagios indipendenti non è certo un problema da poco. In genere, la gestione di tali ambienti è più di un lavoro a tempo pieno. Ma questo non è l'unico numero impressionante di questa configurazione: Ad oggi, ognuno di questi 1.200 server monitora una media di 25 host e 250 servizi. Il tutto per un totale di 300.000 servizi, che Checkmk controlla una volta al minuto. Tutte queste informazioni vengono poi aggregate in una istanza centrale.
Nella maggior parte dei mercati non sono disponibili specialisti IT, quindi un altro requisito è che anche i dipendenti senza esperienza IT siano in grado di comprendere e utilizzare il monitoraggio. Allo stesso tempo, il monitoraggio deve aggiungere automaticamente nuovi sistemi al monitoraggio stesso. Inoltre, il monitoraggio nei negozi deve continuare a funzionare anche se un negozio è disconnesso dal resto della rete o la connessione è instabile. L'unico modo per garantire ciò è monitorare i sistemi locali attraverso una istanza di monitoraggio locale.
Allo stesso tempo, Edeka Minden-Hannover vuole che il monitoraggio aggreghi i dati a livello centrale. Checkmk fornisce i propri agenti, che non devono essere configurati sui sistemi monitorati. Questo ha reso l'implementazione molto semplice, anche con un numero elevato di sistemi. Grazie alla sua funzione di inventario, Checkmk rileva automaticamente quali aspetti di un sistema possono essere monitorati. Checkmk scansiona regolarmente la rete locale del rispettivo negozio alla ricerca di nuovi componenti. A tal fine, il team IT si affida allo strumento standard nmap. Non appena nmap trova un nuovo sistema, Checkmk utilizza la funzione di inventario automatico per determinare quali servizi del sistema debbano essere monitorati.
Il team IT configura i valori di soglia tramite regole flessibili sull'istanza centrale di monitoraggio e applica le regole di monitoraggio a livello globale in tutti i negozi. Checkmk riduce così al minimo lo sforzo necessario per gestire il monitoraggio nei negozi. Il set di regole è composto da 26 regole diverse. Lo stato complessivo aggregato di ogni mercato può essere valutato nell'istanza centrale di Checkmk. Questa aggregazione è realizzata con l'aiuto della Business Intelligence (BI) di Checkmk.
Per l'implementazione Checkmk utilizza il suo servizio web basato su JSON. Questo garantisce che le informazioni del sito centrale siano aggiornate e riflettano lo stato attuale dell'IT del negozio. Una dashboard basata sui dati dell'istanza centrale permette di visualizzare lo stato generale su due monitor da 55 pollici. Su questa dashboard sono presenti viste individuali (dashlet) che mostrano, tra l'altro, i negozi con problemi di connessione e problemi di host o di servizio nei propri elenchi. Nell'ambito del progetto, NagVis è stato ampliato per includere la funzionalità di geo-mappa. NagVis crea una mappa utilizzando le coordinate GPS di tutte le sedi e il materiale cartografico liberamente disponibile di OpenStreetMap e posiziona le sedi su questa mappa.

La soluzione
Nel 2012 Edeka Minden-Hannover ha sostituito con successo Nagios con Checkmk. Il sistema di monitoraggio raccoglie informazioni dettagliate per un'ampia gamma di sistemi da tutti i suoi punti vendita. L'istanza centrale di Checkmk riassume queste informazioni prima di permetterne la visualizzazione e la valutazione.
Un rollout di successo insieme a Checkmk
Durante l'installazione iniziale di Checkmk, il team di Checkmk ha anche sviluppato alcuni nuovi check (come il monitoraggio dei router Bintec), che sono stati successivamente incorporati nella versione ufficiale di Checkmk. Dopo alcune settimane di pianificazione, Edeka Minden-Hannover e Checkmk hanno effettuato questo importante rollout in tutti i negozi, in quattro giorni.
In sei ore, Edeka Minden-Hannover ha installato un totale di 1.200 sistemi di monitoraggio. Ciò significa tre nuovi sistemi al minuto! Dopo l'installazione, Edeka Minden-Hannover ha collegato tutti i sistemi dei negozi all'istanza centrale. Allo stesso tempo, il team IT ha messo in funzione la geo-mappa con le informazioni provenienti dai negozi.
Con poco sforzo e in collaborazione, Edeka Minden-Hannover e Checkmk hanno sviluppato e implementato con successo una soluzione di monitoraggio adeguata. L'intero progetto è stato sviluppato sulla base di un software privo di licenza. Allo stesso tempo, Checkmk ha fornito le proprie competenze e ha ampliato ulteriormente il know-how del cliente in materia di monitoraggio.
I vantaggi
Con Checkmk, Edeka Minden-Hannover dispone ora di un sistema di monitoraggio molto scalabile e preciso. L'azienda è quindi posizionata in modo ottimale per affrontare le sfide di monitoraggio attuali e future. Il passaggio da Nagios a Checkmk ha dato i suoi frutti all'azienda già dopo un breve periodo di tempo, poiché il nuovo sistema ha ridotto in modo significativo il carico di lavoro del team IT.