Nell'intricato mondo dei data center e della gestione dei server, la scheda di gestione (alias Baseboard Management Controller) garantisce il funzionamento regolare e l'affidabilità delle infrastrutture critiche. La scheda di gestione è un controller specializzato incorporato nelle schede madre dei server che svolge un ruolo fondamentale nella gestione e nel monitoraggio a distanza. In sostanza, la scheda di gestione funge da guardiano del server, consentendo agli amministratori di controllare e supervisionare vari aspetti dell'hardware, anche quando il sistema operativo installato è offline. A seconda del produttore, la scheda di gestione può essere chiamata BMC, ILO, IMM, iDRAC.
La scheda di gestione può fornire informazioni sull'hardware essenziale e sulla periferia di un server bare-metal, tra cui:
- CPU
- moduli di memoria
- porte di rete
- Bus PCI
- ventole
- alimentatori, consumo di energia e regolatori di tensione
- Controller Raid
- unità/dischi
- sensori di temperatura
Queste informazioni sono fondamentali per il monitoraggio olistico di un server e per rilevare guasti hardware e molto altro.
Come monitorare le schede di gestione
In genere, una scheda di gestione può fornire dati tramite l'Intelligent Platform Management Interface (IPMI) o tramite il Simple Network Management Protocol (SNMP) - entrambi supportati direttamente da Checkmk.
Si consiglia di monitorare una scheda di gestione come un host dedicato
1. Configura la sezione SNMP delle proprietà dell'host.
2. Configura i IPMI Sensors via Freeipmi or IPMItool e assegnali all'host.
Combinare il monitoraggio delle schede di gestione e del sistema operativo
Anche se attualmente è tecnicamente possibile collegare una scheda di gestione direttamente a un host, questa operazione sarà presto deprecata. Questo comporta che sia il controller di gestione che le informazioni del sistema operativo siano visibili nello stesso host. Tuttavia, comporta diversi svantaggi:
-
La scheda di gestione è logicamente completamente indipendente dal sistema operativo installato. Ciò significa che è possibile riavviare il sistema operativo senza la scheda di gestione e viceversa. In termini di monitoraggio: uno dei due può essere DOWN, mentre l'altro è UP.
-
L'ottimizzazione di un host dedicato è più semplice ed efficace rispetto alla sezione integrata della scheda di gestione. Ad esempio, se la scheda di gestione viene monitorata tramite SNMP e lo stack SNMP del dispositivo non offre buone prestazioni, potrebbe essere necessario impostare un intervallo di controllo maggiore. In tal caso, si è costretti ad aumentare l'intervallo anche per l'host monitorato tramite agente, anche se questo potrebbe non richiederlo.
Comprendiamo la necessità di combinare le informazioni relative all'interno di Checkmk. Già oggi è possibile integrare due host dedicati (uno per la scheda di gestione e uno per il sistema operativo) tramite potenti dashboard e le opzioni di visualizzazione di Checkmk. In futuro prevediamo di fornire una modalità agevole e automatizzata per combinare entrambe le fonti di dati nell'interfaccia utente.