Personne ne doute aujourd'hui que l'un des plus important et nécessaire dans le travail des services est celui des systèmes de surveillance des deux machines et services.

Aujourd'hui, il est à la mode Nagios n'est pas la première offre d'emploi que je vois où ils cherchent des développeurs plugins Nagios . Avant il était Big Brother , un classique de la surveillance. Les deux sont très semblables et ses fonctionnalités sont similaires, la différence est que Nagios est open source et de Big Brother est commerciale. En général, son utilité est de vérifier la disponibilité des services sur des serveurs (http, pop, smtp ...). Si, dans un laps de temps donné, sans accès à un service particulier (par exemple, a essayé plusieurs fois sans succès), lance une alerte car il est supposé qu'il pourrait y avoir chuté. Les alertes sont entièrement personnalisables, vous pouvez créer des groupes d'utilisateurs qui recevront et peuvent être de différents types (e-mail, pager, SMS ...). En tant qu'outil de la liste d'alerte est parfait, cependant, comme un outil de surveillance est limitée à un entrepôt de feux de circulation, alors que tout le monde est vert, pas de problème, quand on passe au rouge, le saut en alarme. C'est aussi simple que. Pourtant, vous ne répondez pas à certaines des questions les plus intéressantes:

  • Pourquoi le service est tombé?
  • "Qu'est-ce qui se passe sur la machine quand il est tombé?
  • Quels autres services sur cette machine pourrait influer sur le problème?

Il rend compte de la disponibilité, mais pas les causes possibles.

Cacti répondre à ces questions dans une façon très efficace. Cacti est un autre concept de la surveillance. Si vous connaissez MRTG , vous savez quoi nous parlons. Cacti également fondée sur rrdtool de générer des graphiques de l'activité régulière. Le jour où je me sens comme nous allons jouer avec rrdtool que c'est une expérience intéressante, mais maintenant trois ou quatre ans qui ne jouent pas.

Voici un exemple pour commencer à comprendre ses avantages. Voici un graphique de l'utilisation du processeur dans certains détails.

Gráfico de actividad con 1 CPU

Certains diront, bien, bien, mais avec mrtg j'aime. Bon, voyons le deuxième exemple, a maintenant deux CPU graphiques, et combinés indépendants.

2cpu Monitorizando servidores con Cacti

Vale homme, mais tu m'as appris quelque chose de nouveau, vous pouvez faire quelque chose de similaire avec d'autres outils. Bien sûr, mais pas avec la facilité de Cacti . Mais regardez ce que je vais vous montrer maintenant:

Monitorización de servicios con Cacti

Ne partez pas encore, il ya plus ...

Monitorización de servicios con Cacti 2

Si maintenant vous êtes surpris que je ne pense pas que vous devriez continuer à lire :P .

Comme vous pouvez le voir, nous pouvons avoir beaucoup d'informations provenant de chacun des services que nous avons en cours d'exécution sur le serveur, pas seulement le trafic réseau ou l'activité du processeur. Maintenant, nous pouvons répondre à de nombreuses questions plus en cas d'erreur:

  • Apache Quelle activité là-bas?
  • Qu'est-ce à propos de MySQL?
  • Comment pourrions-nous mail de la circulation?
  • Qu'est-ce DNS à propos? Pour voir si nous allons avoir un DoS via DNS ...

En outre ...

  • Sera-ce une défaillance matérielle par la température ou les ventilateurs de la machine?
  • Yat-il un manque d'espace disque?
  • Avons-nous assez de mémoire?
  • Par curiosité ... comment le UPS de notre machine?

Avec juste un regard sur la réponse à toutes les questions graphique à la fois.

Quel service est à l'origine l'augmentation de la CPU? Vous n'avez qu'à revoir les tableaux de l'activité des principaux services et de voir qui a une activité supérieure à la normale.

J'ai rencontré Cacti faire environ quatre ans et depuis lors je ne peux pas vivre sans elle. Mais Cacti est beaucoup plus que cela. À ce stade, vous pensez:

Si nous avons des contrôles réguliers des services, pourquoi ne pas offrir une fonctionnalité similaire à Nagios quant à la disponibilité?

Voila, il semble que quelqu'un a déjà pensé auparavant et nous avons un plugin pour Cacti qui offre le feu fameux vert / rouge.

Semáforos en Cacti

Bon d'accord, mais ce alertes?. Simple, nous avons un autre plugin pour envoyer des alertes au style de Nagios.

D'après mon expérience, l'association Cactus / fermer Nagios à la perfection et se complètent mutuellement.

Il ya des centaines de plugins pour vérifier et enregistrer les services de cactus , pratiquement tous les services connus dispose d'un plugin, et si pas trouvé ce que vous avez besoin, vous pouvez toujours faire un vous-même. Vous pouvez même créer un petit script sur votre serveur qui génère les données dont vous avez besoin et un piège SNMP de les lire et de les retourner à un appel à distance, intègre ainsi de façon transparente avec vos dossiers personnalisés en tant que norme SNMP avec laquelle Cacti communique parfaitement.

Si vous n'avez pas de surveiller vos serveurs ... tôt ou tard, va à la douleur :) .

Si vous avez révélées utiles cet article ... Partagez!