Outils pour utilisateurs

Outils du site


sisr3:centreon_04

Activité : Supervision en temps réel de Centreon

La supervision des équipements

Chaque équipement supervisé par Centreon possède un état (ou statut) qui traduit une disponibilité pour les hôtes et une performance pour les services.

Les hôtes sont des entités IP aussi appelé nœud ou ressource, comme un serveur physique ou virtuel, un switch, un routeur, une imprimante réseau ou encore une caméra IP.

Quand Centreon contrôle la disponibilité d’un hôte, l’état peut avoir les valeurs suivantes :

  • UP : l’hôte est disponible.
  • DOWN : l’hôte est indisponible.
  • UNREACHABLE : l’hôte est injoignable, due à l’indisponibilité d’un hôte dont il dépend (souvent un switch ou un routeur).
  • UNKNOWN : l’état de l’hôte est inconnu, il n’a pas pu être vérifié à cause d’un incident exté-rieur (erreur dans la sonde, agent SNMP désactivé ou mal configuré, etc.).

La vérification de la disponibilité d’un hôte se fera souvent via un simple ping mais vous pouvez définir toute autre commande. Par en testant l’accès à une page web pour superviser la disponibilité d’un serveur web.

Si une sonde retourne un code d’état inconnu pour un hôte, Centreon conserve le dernier état connu.

Centreon permet de regrouper les hôtes dans un ou plusieurs groupes d’hôtes selon des critères technique (Serveurs, switchs, etc.), géographique ou encore applicative ou métier.

Ces groupes peuvent être utilisés dans la gestion des droits, des escalades de notifications ou simplement en tant que filtre dans les différents écrans de supervision.

Pour visualiser la liste des hôtes supervisés :

Pour visualiser l’état temps réel des hôtes supervisés sous forme de liste :

  • A partir du menu Supervision – Hôtes, choisissez dans le sélecteur de vue les hôtes ou les groupes d’hôtes à superviser :

Pour l’instant il n’y a que le serveur Centreon.

  • L’icône signifie que les notifications sont désactivées pour cet hôte.
  • L’icône signifie que des graphiques de performance sont disponibles pour cet hôte. Un clic sur l’icône permet d’accéder directement aux graphiques.

  • La lettre entre parenthèses S ou H de la colonne Tentative correspond au type d’état SOFT ou HARD.

En cliquant sur le nom d’un hôte, affiche ses informations très détaillées en temps réel :

De nombreuses informations sont disponibles ainsi que des options d’administration pour modifier à chaud certains paramètres pour l’hôte concerné comme par exemple désactiver la supervision active et passive, les notifications, etc.

IcôneRaccourciMenu
Configuration de l’hôteConfiguration - Hôtes
Journaux d’événements de l’hôteSupervision - Journaux d’événements
Rapports de l’hôteRapports - Tableau de bord
Graphiques de performanceVues - Graphiques

Ces actions de diagnostic avancé sont ponctuelles et les modifications effectuées ne sont pas conservées en base de données mais écrasées lors du redémarrage de l’ordonnanceur concerné.

Lorsque l’hôte est en erreur, ce groupe d’actions contient l’action Acquitter pour permettre d’indiquer que l’alerte est prise en compte.

Le cadre Outils propose deux outils de diagnostic pour tester la connectivité vers l’hôte : ping et tracert. Ces outils s’exécutent toujours depuis le serveur central.

Un clic sur l’un des outils exécute la commande correspondante vers l’hôte concerné depuis le serveur central et affiche le résultat dans une fenêtre popup.

La supervision des services

Un service est un point de contrôle rattaché à un hôte. Un service est aussi souvent appelé mesure ou indicateur. Un service peut se situer sur les couches matérielle, système, logiciel, applicative ou encore métier ou processus.

Exemple : latence d’un ping, espace disque utilisé, niveau d’utilisation d’un toner d’imprimante laser, etc.

Pour contrôler la performance d’un service, Centreon se base sur deux seuils (WARNING et CRITICAL) qui lui permettent de qualifier la performance du service. Les états possibles d’un service sont :

  • OK : le service fonctionne de manière nominale.
  • WARNING : le service est dégradé, il est au-dessus du seuil WARNING mais en dessous du seuil CRITICAL.
  • CRITICAL : le service est dans un état critique qui nécessite une intervention immédiate, la valeur de performance calculée dépasse le seuil CRITICAL.
  • UNKNOWN : l’état du service est inconnu, il n’a pas pu être vérifié.

Tout comme les groupes d’hôtes, il est possible de regrouper plusieurs services en groupe de service. Par exemple, un groupe de service Supervision de la base de données SQL Server contenant les services clés de la supervision de l’infrastructure Microsotf.

Les groupes de services sont aussi utilisables pour configurer des droits d’accès et la configu-ration des escalades de notification et pour afficher les graphiques de plusieurs services dans les écrans d’analyse ou encore des statistiques agrégées dans les écrans de rapports.

Les métaservices résultent par l’agrégation des données de performance d’autres services à l’aide d’opérations mathématiques : somme, moyenne, minimum ou maximum. Ils sont soumis au mécanisme des notifications et possèdent un graphique de performance. Ce concept de métaservice est introduit par Centreon car il n’existe pas dans Nagios.

Pour visualiser l’état des services supervisés :

  • A partir du menu Supervision – Services, choisissez, comme pour les hôtes dans la colonne de gauche, de visualiser :
    • Les Problèmes non acquittés (services en erreur et non acquittés) ou
    • Les Problèmes en cours (services en erreur et acquittés) ;
    • Tous les services pour voir tous les services sans filtre.

Il y a également plusieurs vues agrégées permettant d’afficher les services par hôte, groupe d’hôtes ou groupe de services.

En cliquant sur Tous les services vous visualisez les services supervisés (actuellement que les services sur l’hôte serveur Centreon-Server) :

Il est possible de visualiser notamment l’espace disque ou la RAM utilisée.

Puis le détail de chaque service est également disponible.

Les actions d’exploitation

Les actions peuvent être lancées sur plusieurs hôtes ou services depuis les menus déroulants des listes ou sur un hôte spécifique ou un service spécifique depuis sa vue détaillée.

La liste des actions possibles pour les hôtes ou les services :

Quelques précisions sur ces actions :

Acquitter un hôte ou un service en alerte

Cela permet d’indiquer qu’un hôte ou un service en erreur est pris en compte. Les notifications seront alors désactivées et l’alerte n’apparaîtra plus dans les listes des alertes non acquittées. Elle restera néanmoins visible avec une couleur différente (jaune par défaut).

Exemple d’acquittement d’un hôte depuis la liste des hôtes

  • Depuis le menu Supervision - Hôtes, cochez le ou les hôtes à acquitter.
  • Dans la liste déroulante Plus d’actions…, cliquez sur Hôtes : acquitter.

Une fenêtre apparaît.

  • Par défaut, l’acquittement est valide uniquement pour l’état de l’hôte au moment de l’acquittement. L’option Acquittement persistant en cas de changement d’état non-OK précise à Centreon que l’acquittement sera conservé tant que l’hôte reste dans un état différent de OK.
  • L’option Notifier déclenchera une notification de prise en compte aux contacts associés à l’hôte.
  • L’option Acquittement persistant en cas de redémarrage de l’ordonnanceur précise à Centreon de conserver l’acquittement même après un redémarrage du Centreon-engine.
  • Le champ Commentaire permet de préciser les raisons de l’acquittement ou encore de préciser un numéro de ticket par exemple. Ce commentaire sera ajouté à la liste des commentaires de l’hôte.
  • Si un hôte est en erreur, ses services ont de fortes chances de l’être aussi. L’option Acquitter les services liés à l’hôte permet d’acquitter les services associés.
  • L’option Forcer les contrôles actifs permet d’effectuer une mise à jour immédiate de l’état des services de l’hôte en erreur.

La supervision générale

L’interface d’administration permet d’avoir un aperçu rapide de l’état global des hôtes et ser-vices supervisés avec :

  • la barre d’état disponible en haut de l’écran sur toute l’interface
  • les pages Vue tactique et Santé globale proposent des résumés temps réel de l’ensemble des points de contrôle. Ces pages sont mises à jour dynamiquement pour informer de ma-nière synthétique les administrateurs.

La barre d’état

Cette barre d’état est constituée de trois parties :

  • L’état des collecteurs ;
  • l’état de la supervision des hôtes ;
  • L’état de la supervision des services.

L’état des collecteurs est donné via trois icônes, qui deviennent rouges en cas d’erreur. L’icône de gauche indique une latence d’un collecteur. En se basant sur les données remontées par le broker, l’icône du milieu indique si l’ordonnanceur est en fonctionnement. La dernière icône indique si les collecteurs envoient bien des informations au serveur central.

Le survol d’une des icônes avec la souris fait apparaître une indication plus précise sur l’état des collecteurs.

L’état de la supervision des hôtes et services permet de voir d’un coup d’œil le nombre d’hôtes et de services dans chaque état et en attente, c’est-à-dire qui n’ont encore jamais été vérifié. Un clic sur une des cases fait apparaître la liste des hôtes ou services dans l’état concerné.

Pour l’instant qu’il n’y a qu’un seul hôte de supervisé (le serveur Centreon) :

et quatre services (toujours du serveur Centreon).

En cliquant sur le chiffre 4 vous visualisez les services supervisés :

Vous pouvez contrôler la mise à jour dynamique et régulière de la liste avec les boutons suivants :

Les services en état d’erreur sont représentés par deux nombres séparés par un / :

  • le second nombre est le nombre total d’éléments en erreur ;
  • le premier nombre est le nombre d’éléments en erreur non acquittés et non associés à un hôte en erreur.

Un service nouvellement créé aura l’état OK.

Les Types d’états SOFT et HARD

Lorsqu’un état d’erreur survient (DOWN, WARNING, CRITICAL ou UNKNOWN), Centreon le con-firme à l’aide de plusieurs contrôles successifs avant de notifier les contacts.

  • SOFT : l’état n’est pas confirmé, les contacts ne sont pas notifiés.
  • HARD : l’état est confirmé, les contacts peuvent être notifiés.

L’objectif est de réduire le nombre de notifications. Les états UP et OK ne sont pas confirmés par Centreon.

Retour à l'activité Supervision des services avec Centreon

sisr3/centreon_04.txt · Dernière modification: 2015/12/01 23:55 (modification externe)