Nell'intricato mondo dei data center e della gestione dei server, la scheda di gestione (alias Baseboard Management Controller) garantisce il funzionamento regolare e l'affidabilità delle infrastrutture critiche. La scheda di gestione è un controller specializzato incorporato nelle schede madri dei server che svolge un ruolo fondamentale nella gestione e nel monitoraggio a distanza. In sostanza, la scheda di gestione funge da guardiano del server, consentendo agli amministratori di controllare e supervisionare vari aspetti dell'hardware, anche quando il sistema operativo installato è offline. A seconda del produttore, la scheda di gestione può essere chiamata BMC, ILO, IMM, iDRAC.

La scheda di gestione può fornire informazioni sull'hardware essenziale e sulla periferia di un server bare-metal, tra cui

  • CPU
  • moduli di memoria
  • Porte di rete
  • Bus PCI
  • Ventole
  • Alimentatori, consumo di energia e regolatori di tensione
  • Controller Raid
  • Unità/dischi
  • Sensori di temperatura
Schermata che mostra i servizi dei sensori IPMI

Queste informazioni sono fondamentali per il monitoraggio olistico di un server per rilevare guasti hardware e altro ancora.

Come monitorare le schede di gestione

In genere, una scheda di gestione può fornire dati tramite l'Intelligent Platform Management Interface (IPMI) o tramite il Simple Network Management Protocol (SNMP) - entrambi sono supportati direttamente da Checkmk.

Si consiglia di monitorare una scheda di gestione come un host dedicato

1. Configurare la sezione SNMP delle proprietà dell'host.

configurazione dell'agente di monitoraggio per SNMP

2. Configurare i IPMI Sensors via Freeipmi or IPMItool e assegnarli all'host.

Configurazione dei sensori IPMI della regola tramite Freeipmi o IPMItool

Combinare il monitoraggio delle schede di gestione e del sistema operativo

Anche se attualmente è tecnicamente possibile collegare una scheda di gestione direttamente a un host, questa operazione sarà presto deprecata. In questo modo, sia la scheda di gestione che le informazioni sul sistema operativo sono visibili nello stesso host. Ciò comporta tuttavia diversi svantaggi:

  • La scheda di gestione è logicamente completamente indipendente dal sistema operativo installato. Ciò significa che è possibile riavviare il sistema operativo senza la scheda di gestione e viceversa. O in termini di monitoraggio: Una delle due può essere DOWN, mentre l'altra è UP.

  • La regolazione fine di un host dedicato è più semplice e più potente rispetto alla sezione integrata della scheda di gestione. Ad esempio, se la scheda di gestione viene monitorata tramite SNMP e lo stack SNMP del dispositivo non funziona bene, potrebbe essere necessario un intervallo di controllo più elevato. Si è costretti ad aumentare l'intervallo anche per l'host basato su agente, anche se questo potrebbe non richiederlo.

Comprendiamo la necessità di combinare le informazioni relative all'interno di Checkmk. Già oggi è possibile integrare due host dedicati (uno per la scheda di gestione e uno per il sistema operativo) tramite  potenti dashboard e le opzioni di visualizzazione di Checkmk. In futuro prevediamo di fornire una modalità agevole e automatizzata per combinare entrambe le fonti di dati nell'interfaccia utente.