Nell'intricato mondo dei data center e della gestione dei server, la scheda di gestione (alias Baseboard Management Controller) garantisce il funzionamento regolare e l'affidabilità delle infrastrutture critiche. La scheda di gestione è un controller specializzato incorporato nelle schede madre dei server che svolge un ruolo fondamentale nella gestione e nel monitoraggio a distanza. In sostanza, la scheda di gestione funge da guardiano del server, consentendo agli amministratori di controllare e supervisionare vari aspetti dell'hardware, anche quando il sistema operativo installato è offline. A seconda del produttore, la scheda di gestione può essere chiamata BMC, ILO, IMM, iDRAC.

La scheda di gestione può fornire informazioni sull'hardware essenziale e sulla periferia di un server bare-metal, tra cui:

  • CPU
  • moduli di memoria
  • porte di rete
  • Bus PCI
  • ventole
  • alimentatori, consumo di energia e regolatori di tensione
  • Controller Raid
  • unità/dischi
  • sensori di temperatura
Schermata che mostra i servizi dei sensori IPMI

Queste informazioni sono fondamentali per il monitoraggio olistico di un server e per rilevare guasti hardware e molto altro.

Come monitorare le schede di gestione

In genere, una scheda di gestione può fornire dati tramite l'Intelligent Platform Management Interface (IPMI) o tramite il Simple Network Management Protocol (SNMP) - entrambi supportati direttamente da Checkmk.

Si consiglia di monitorare una scheda di gestione come un host dedicato

1. Configura la sezione SNMP delle proprietà dell'host.

configurazione dell'agente di monitoraggio per SNMP

2. Configura i IPMI Sensors via Freeipmi or IPMItool e assegnali all'host.

Configurazione dei sensori IPMI della regola tramite Freeipmi o IPMItool

Combinare il monitoraggio delle schede di gestione e del sistema operativo

Anche se attualmente è tecnicamente possibile collegare una scheda di gestione direttamente a un host, questa operazione sarà presto deprecata. Questo comporta che sia il controller di gestione che le informazioni del sistema operativo siano visibili nello stesso host. Tuttavia, comporta diversi svantaggi:

  • La scheda di gestione è logicamente completamente indipendente dal sistema operativo installato. Ciò significa che è possibile riavviare il sistema operativo senza la scheda di gestione e viceversa. In termini di monitoraggio: uno dei due può essere DOWN, mentre l'altro è UP.

  • L'ottimizzazione di un host dedicato è più semplice ed efficace rispetto alla sezione integrata della scheda di gestione. Ad esempio, se la scheda di gestione viene monitorata tramite SNMP e lo stack SNMP del dispositivo non offre buone prestazioni, potrebbe essere necessario impostare un intervallo di controllo maggiore. In tal caso, si è costretti ad aumentare l'intervallo anche per l'host monitorato tramite agente, anche se questo potrebbe non richiederlo.

Comprendiamo la necessità di combinare le informazioni relative all'interno di Checkmk. Già oggi è possibile integrare due host dedicati (uno per la scheda di gestione e uno per il sistema operativo) tramite  potenti dashboard e le opzioni di visualizzazione di Checkmk. In futuro prevediamo di fornire una modalità agevole e automatizzata per combinare entrambe le fonti di dati nell'interfaccia utente.