Le difficile choix des outils de supervision des réseaux

Date: 28/11/2012 | Catégories: Open-source,Planet-libre,Reseau | Tags: ,

Je viens de lire le mail d'un lecteur concernant ses interrogations sur le choix des logiciels permettant de surveiller son réseau. Comme c'est une question récurrente dans ma boîte mail et que je pense que ses questions et nos réponses peuvent intéresser d'autres personnes, j'ai décidé de lui répondre directement sur le blog.

On commence par le mail en question:

---

Bonjour Nicolas,

Je me permet de te contacter car je recherche à faire de la supervision sur mon réseau mais je ne sais pas vers quel outils me tourner.

Sachant que mon réseau est relativement petit, quelques switchs, firewalls, routeurs, serveurs, j'aimerais trouver un outils pour surveiller le traffic entrant sortant (réseau LAN connecté à Internet), pinger, savoir la consommation CPU et RAM des serveurs, etc...

J'ai pu voir sur internet et sur ton blog que tu conseillais nagios/centreon/cacti.
Mais j'ai aussi vu une autre solution se commant "The Dude" qui est une appli tournant sur Windows.

Je voulais savoir si avec nagios n'était pas trop lourd pour cela ? Nagios ne nous permet pas de sortir des statistiques sur les performances ? Nous sommes obligé de le couplé à cacti pour que ce soit plus "lisible" ? A ce que j'ai compris Centreon permet de rendre Nagios plus "user frendly", mais qu'apporte-t-il de plus ?

En abstraction de cela, existe-t-il une solution plus simple, plus légère ou plus adapté à ma petite infra au lieu de Nagios ?

Désolé, je sais que vous ne répondez normalement pas aux questions par mail mais je tente quand même ma chance en espérant que vous lisez ce mail un bon jour. 🙂

Kévin

 ---

Comme la grande majorité des professionnels de l'informatique, ce lecteur est un peu perdu dans la nébuleuse des solutions de supervision. Ainsi, il mélange la supervision pure (Nagios), la métrologie (Cacti) et les outils de diagnostics élémentaires (ping, iftop...).  A sa décharge, il est vrai qu'il n'y a aucun cours digne de ce nom dans les écoles d'ingénieurs, les DUT ou les cursus universitaires en informatique.

Pour répondre à la question de Kévin, il faut, je pense, commencer par revenir à son besoin.

Il parle de la supervision d'un réseau avec des machines diverses et variées (firewall, routeur, switch, serveurs). On est donc en présence d'un petit réseau (moins de 100 noeuds) avec comme besoin principal un suivi de la consommation des ressources: bande passante de la liaison Internet, CPU et mémoire pour les serveurs. Kévin parle également de 'ping', c'est à dire d'un moyen simple de vérifier qu'une machine est bien opérationnelle. D'un autre coté, il n'aborde pas la problématique de la gestion des alertes, c'est à dire des solutions dynamiques pour prévenir une ou plusieurs personnes en cas d'incident.

Dans ce cas précis, je conseillerai donc à Kévin de s'orienter vers la mise en place d'un serveur Munin (lire mon billet sur le sujet), ce qui lui permettra assez facilement de surveiller les serveurs GNU/Linux ou Windows et même les routeurs et switchs Cisco (voir les scripts suivants). Le principal avantage de cette solution est la facilité de mise en place et la légéreté de l'infrastructure. On peut sans problème héberger le serveur Munin sur une machine GNU/Linux existante.

Comme vous pouvez le noter, je ne propose pas de solution pour le 'ping' des noeuds. En effet, sans une gestion des alertes, c'est clairement le genre d'outil qui ne sert absolument à rien à moins que Kévin veuille passer ses journée à regarder une page remontant les éventuelles erreurs rencontrées.

Par contre, si son besoin évolue et qu'il est prêt à gérer un véritable serveur de supervision, avec toutes les contraintes de temps et de compétence que cela demande, alors je l'orienterai vers Shinken. Pourquoi Shinken et pas Nagios ? Tout d'abord pour la simplicité de mise en oeuvre (voir mon billet sur l'installation et la configuration initiale de Shinken) mais également pour son module de découverte automatique des noeuds qui est un véritable plus, même pour un petit réseau.

Les informations que je viens de donner ne sont que des pistes et d'autres solutions sont possibles. Je pense notamment à l'utilisation de distributions orientées supervision comme Eyes Of Network ou Fully Automated Nagios (à quand une version Shinken ?).

Qu'en pensez-vous ? Quelles autres pistes pouvez-vous proposer à Kévin ?

Partager ce billet