Nell'intricato mondo dei data center e della gestione dei server, la scheda di gestione (alias Baseboard Management Controller) garantisce il funzionamento regolare e l'affidabilità delle infrastrutture critiche. La scheda di gestione è un controller specializzato incorporato nelle schede madri dei server che svolge un ruolo fondamentale nella gestione e nel monitoraggio a distanza. In sostanza, la scheda di gestione funge da guardiano del server, consentendo agli amministratori di controllare e supervisionare vari aspetti dell'hardware, anche quando il sistema operativo installato è offline. A seconda del produttore, la scheda di gestione può essere chiamata BMC, ILO, IMM, iDRAC.
La scheda di gestione può fornire informazioni sull'hardware essenziale e sulla periferia di un server bare-metal, tra cui
- CPU
- moduli di memoria
- Porte di rete
- Bus PCI
- Ventole
- Alimentatori, consumo di energia e regolatori di tensione
- Controller Raid
- Unità/dischi
- Sensori di temperatura
Queste informazioni sono fondamentali per il monitoraggio olistico di un server per rilevare guasti hardware e altro ancora.
Come monitorare le schede di gestione
In genere, una scheda di gestione può fornire dati tramite l'Intelligent Platform Management Interface (IPMI) o tramite il Simple Network Management Protocol (SNMP) - entrambi sono supportati direttamente da Checkmk.
Si consiglia di monitorare una scheda di gestione come un host dedicato
1. Configurare la sezione SNMP delle proprietà dell'host.
2. Configurare i IPMI Sensors via Freeipmi or IPMItool e assegnarli all'host.
Combinare il monitoraggio delle schede di gestione e del sistema operativo
Anche se attualmente è tecnicamente possibile collegare una scheda di gestione direttamente a un host, questa operazione sarà presto deprecata. In questo modo, sia la scheda di gestione che le informazioni sul sistema operativo sono visibili nello stesso host. Ciò comporta tuttavia diversi svantaggi:
-
La scheda di gestione è logicamente completamente indipendente dal sistema operativo installato. Ciò significa che è possibile riavviare il sistema operativo senza la scheda di gestione e viceversa. O in termini di monitoraggio: Una delle due può essere DOWN, mentre l'altra è UP.
-
La regolazione fine di un host dedicato è più semplice e più potente rispetto alla sezione integrata della scheda di gestione. Ad esempio, se la scheda di gestione viene monitorata tramite SNMP e lo stack SNMP del dispositivo non funziona bene, potrebbe essere necessario un intervallo di controllo più elevato. Si è costretti ad aumentare l'intervallo anche per l'host basato su agente, anche se questo potrebbe non richiederlo.
Comprendiamo la necessità di combinare le informazioni relative all'interno di Checkmk. Già oggi è possibile integrare due host dedicati (uno per la scheda di gestione e uno per il sistema operativo) tramite potenti dashboard e le opzioni di visualizzazione di Checkmk. In futuro prevediamo di fornire una modalità agevole e automatizzata per combinare entrambe le fonti di dati nell'interfaccia utente.