Supervision d’un NAS NetApp avec Nagios ou Shinken

Date: 11/09/2013 | Catégories: Hardware,Nagios,Open-source,Planet-libre | Tags: ,

Dans la jungle très lucrative des "NAS appliance", c'est à dire des serveurs NAS intégré dans un hardware et un système spécifique, NetApp fait office de leader pour la qualité prix de ses produits. Nous allons voir ensemble dans ce billet comment superviser une machine NetApp FAS2200 à partir de Nagios ou de Shinken.

nas01

Note: ce billet doit également être valable pour l'ensemble des produits NetApp.

Récupération du plugin chek-netapp-ng

En cherchant un peu sur le Web, j'ai trouvé un plugin Nagios permettant de superviser finement ses machines NetApp. Bien que datant un peu, ce plugin est parfaitement fonctionnel.

Une fois connecté en SSH (en root) sur son serveur Nagios / Shinken (la procédure est la même), on commence donc par récupérer le plugin:

Installation du plugin chek-netapp-ng

L'installation différe ici si vous utilisez Nagios ou Shinken.

Pour installer le plugin sur Nagios, il faut saisir:

Pour Shinken:

Configuration du plugin chek-netapp-ng

Il faut ensuite éditer le fichier (par exemple /usr/local/shinken/libexec/check-netapp-ng.pl) pour y éditer la ligne numéro 15 avec le chemin vers les librairies:

 Note: Respectivement /usr/local/nagios/libexec pour Nagios.

On doit ensuite faire connaître le plugin à Shinken (ou Nagios) en ajoutant les lignes suivantes dans votre fichier commands.cfg (sous /usr/local/shinken/etc):

Déclaration de votre serveur NAS

Il ne reste plus qu'à définir votre serveur NAS dans la configuration de Shinken (ou de Nagios). Par exemple, j'ai un fichier nas01.cfg qui contient:

Une fois Shinken (ou Nagios) redémarré et après les premiers checks, vous devriez voir la page de supervision apparaître dans l'interface Web (comme au début de ce billet).

On peut donc superviser les choses suivantes:

  • La charge CPU (ce qui peut être utile si votre serveur NAS est trop chargé, par exemple trop d'accès simultanés)
  • La taille utilisé par partitions
  • L'état des ventilateuts
  • L'état des disques (supervision du RAID)
  • Le status global

Voilà une bonne chose de faite: la supervision du serveur le plus sensible (il y a toutes vos données dessus normalement) de votre infrastructure.

  • Do

    Merci Beaucoup pour le tuto
    mais malheureusement en suivant a la lettre on obtient ceci:
    (Return code of 127 is out of bounds – plugin may be missing)