21. 05. 2014 Patrick Zambelli NetEye

Nuova procedura di ShutDown Management in NetEye

Nella nuova versione 3.5 di NetEye, che verrà rilasciata a breve, è stato implementato il modulo “Shut Down Management” per gestire la configurazione delle procedure di spegnimento automatico in un data center.

Cercherò di fornirvi un semplice esempio per farvi capire le potenzialità e la necessità di questa funzionalità. Per esempio, se ci sono problemi con la fornitura dell’energia elettrica in un data center, l’UPS solitamente parte con un’autonomia di circa mezz’ora. È quindi necessario riuscire a spegnere tutti i server prima che l’energia elettrica venga definitivamente interrotta. In questo caso un “Business Process” viene configurato in NetEye per eseguire la logica desiderata di controllo (ad esempio controllerà che l’UPS è stata avviata). Nel modulo di “Shut Down Management” l’utente può configurare che in caso il controllo fallisce ed è trascorso un certo tempo di tolleranza (30 minuti), lo spegnimento automatico può iniziare per fermare in tempo tutti i server con un certo ordine e logica. Il tempo di tolleranza deve essere calcolato come la differenza tra l’autonomia dell’UPS e il tempo totale per completare l’intera procedura di spegnimento di tutti gli hosts.

Vediamo ora come configurare la procedura di shut down.

Creare una nuova procedura di shut down

 
Quando si configura una nuova procedura di shut down è possibile scegliere le seguenti principali impostazioni:

  • Require Explicit User Confirmation: lo spegnimento automatico può richiedere la conferma manuale da parte dell’utente prima di dar inizio alla procedura di shut down
  • Tolerance Period before shut down: è il periodo temporale che deve trascorrere dal controllo fallito prima di poter iniziare la procedura di spegnimento

Configurare il controllo in Nagios check per la procedura di shut down

Infine anche il Business Process deve essere selezionato per determinare lo status e la condizione per cui invocare o meno la procedura di shut down:

Aggiungere o rimuovere gli hosts da includere o escludere dalla procedura di spegnimento

A questo punto si deve fornire una lista di hosts con una sequenza ben definita che andranno inclusi nella procedura di spegnimento, per evitare che certi dati vengano corrotti o diventino inconsistenti. Sono stati creati dei comandi di spegnimento preimpostati che possono essere facilmente attribuiti ai vari hosts. Questi comandi possono interagire direttamente con il sistema o invocare il processo di spegnimento attraverso un agent remoto di NetEye.

Inizio della procedura di shut down

Una volta che lo status di monitoraggio in Nagio diventa Critical con un HARD status (confirmed Critical), lo shut down management controlla lo status e si assicura che:

  • il tempo di tolleranza per il Business Service è trascorso senza alcuna recovery positiva da parte di Nagios
  • il controllo in Nagios check è ancora valido
  • l’utente confermi l’avvio della procedura di spegnimento, se richiesto dalle impostazioni

I logs di tutte le attività svolte nel modulo per la gestione degli spegnimenti automatici e anche tutte le attività di shutdown vengono archiviate e registrate nel modulo, per eventuali controlli.

Patrick Zambelli

Patrick Zambelli

Project Manager at Würth Phoenix
After my graduation in Applied Computer Science at the Free University of Bolzano I decided to start my professional career outside the province. With a bit of good timing and good luck I went into the booming IT-Dept. of Geox in the shoe district of Montebelluna, where I realized how a big IT infrastructure has to grow and adapt to quickly changing requirements. During this experience I had also the nice possibility to travel the world, while setting up the various production and retail areas of this company. Arrived at Würth Phoenix I started developing on our monitoring solution NetEye. Today, in my position as Consulting an Project Manager I am continuously heading to implement our solutions to meet the expectation of your enterprise customers.

Author

Patrick Zambelli

After my graduation in Applied Computer Science at the Free University of Bolzano I decided to start my professional career outside the province. With a bit of good timing and good luck I went into the booming IT-Dept. of Geox in the shoe district of Montebelluna, where I realized how a big IT infrastructure has to grow and adapt to quickly changing requirements. During this experience I had also the nice possibility to travel the world, while setting up the various production and retail areas of this company. Arrived at Würth Phoenix I started developing on our monitoring solution NetEye. Today, in my position as Consulting an Project Manager I am continuously heading to implement our solutions to meet the expectation of your enterprise customers.

Leave a Reply

Your email address will not be published. Required fields are marked *

Archive