Vocabulaire¶
Alarme¶
Une alarme est le résultat du traitement des évènements par un moteur et sert à alerter sur un problème.
Elle est liée à une entité de type composant, ressource ou observateur. La combinaison d'un connecteur, d'un nom de connecteur, d'un composant et d'une ressource créé une alarme unique. Si l'un de ces éléments change, une alarme différente est créée.
Elle peut connaître de multiples changements de criticité et de statut, et subir une suite d'actions (acquittement, mise en veille, changement de criticité, annulation, etc.), utilisateurs ou automatiques. L'ensemble de ces changements et actions s'appelle un cycle d'alarme.
On peut visualiser les alarmes via un widget bac à alarmes.
Vous pouvez consulter sa structure dans la documentation développeur.
Battement¶
Un moteur effectue une tâche périodique appelée battement (ou « beat ») à un intervalle régulier. L'intervalle typique est de 1 minute.
Composant¶
Un composant peut être soit :
- Un type d'entité créé suite au traitement d'un évènement.
- Un champ d'un évènement. Le plus souvent, il s'agit d'une machine ou d'un périphérique réseau (serveur, routeur, etc.). Une alarme peut être rattachée à un composant.
Context-Graph¶
Le context-graph est un schéma relationnel entre les entités de Canopsis. Il sert à grapher leur contexte. Il s'appuie sur les notions de impact
et depends
. Il est présent au sein de chaque entité et peut être visualisé via le widget explorateur de contexte.
Connecteur¶
Un connecteur peut être soit :
- Un type d'entité créé suite au traitement d'un évènement. Il est le fruit de la concaténation des champs
connector
etconnector_name
. - Un champ d'un évènement. Le plus souvent, il s'agit du nom du logiciel qui envoie ses données à Canopsis. Il sert à créer l'entité connecteur.
- Un script permettant d’envoyer à Canopsis des évènements à partir de sources d'informations extérieures.
Criticité¶
Une alarme a une criticité, indiquant la gravité de l'incident. Il y a actuellement 4 criticités possibles : 1 stable et 3 d'alerte.
- 0 - Info (quand en cours)/ OK (quand résolue), stable
- 1 - Minor, alerte
- 2 - Major, alerte
- 3 - Critical, alerte
Enrichissement¶
L'enrichissement est l'action d'ajouter des informations supplémentaires. On peut enrichir :
- Un évènement via l'event-filter du moteur
engine-che
- Une entité via l'event-filter du moteur
engine-che
, l'explorateur de contexte ou les drivers - Une alarme via le moteur
engine-dynamic-infos
Entité¶
Les entités servent à structurer les alarmes. Elles sont liées entre elles via le context-graph. Elles peuvent permettre, via l'enrichissement de conserver des données statiques (emplacement du serveur, nom du client, etc.).
Les entités peuvent être visualisées via le widget explorateur de contexte
Les types d'entité sont :
Type d'entité | Résulte du traitement d'un évènement | Peut être lié à une alarme |
---|---|---|
composant | ✅ | ✅ |
connecteur | ✅ | ❌ |
observateur | ❌ | ✅ |
ressource | ✅ | ✅ |
Vous pouvez consulter la structure d'une entité dans la documentation développeur.
Évènement¶
Un évènement est un message arrivant dans Canopsis.
Il est formatté en JSON et peut être de plusieurs types, avec leurs propres structures.
Les évènements de type check
peuvent provenir d'une source externe, d'un connecteur (email, SNMP, etc.) ou de Canopsis lui-même. Ils aboutissent à la création ou la mise-à-jour d'une alarme dans le bac à alarmes.
Météo¶
La météo des services est un widget qui permet permet d'avoir une vue globale sur l'état d'un ensemble d'entités. Pour cela, elle affiche des tuiles dont la couleur est représentative de la criticité des alarmes liées aux observateurs.
Moteur¶
Un moteur Canopsis consomme les évènements entrants pour les traiter, puis les acheminer vers le(s) moteur(s) suivant(s). Ils effectuent également une tâche périodique au battement et consomment leurs enregistrements en base de données lorsqu'ils sont disponibles. Vous pouvez consulter plus d'informations sur les moteurs dans la documentation du guide d'administration
Nom de connecteur¶
Un nom de connecteur (ou « connector name ») est le champ d'un évènement. Le plus souvent, il s'agit du nom du logiciel qui envoie ses données à Canopsis, complété par sa localisation ou sa numérotation (superviseur_lille
ou superviseur_5
par exemple). Il sert à créer l'entité connecteur.
Observateur¶
Un observateur est une entité destinée à inclure d'autres entités dans son context-graph via des patterns. Ils peuvent être ajoutés via l'explorateur de contexte.
Ils peuvent être visualisés via la Météo de services.
Ressource¶
Une ressource peut être soit :
- Un type d'entité créé suite au traitement d'un évènement. Il est le fruit de la concaténation des champs
resource
etcomponent
. - Un champ d'un évènement. Le plus souvent, il s'agit du nom de la vérification effectuée (RAM, DISK, PING, CPU, etc.). Une alarme peut être rattachée à une ressource.
Statut¶
Une alarme a un statut , indiquant la situation dans laquelle se trouve l'alarme indiquant un incident. Il y a actuellement 5 statuts possibles :
- 0 - Off
- 1 - On going
- 2 - Stealthy
- 3 - Bagot
- 4 - Cancel
Off¶
Une alarme est considérée Off si elle est stable. C'est-à-dire que sa criticité est stable à 0.
On going¶
Une alarme est considérée On going si sa criticité est dans un état d'alerte (supérieur à 0).
Stealthy¶
Une alarme est considérée Stealthy si sa criticité est passée d'alerte à stable dans un délai spécifié.
Si la criticité de cette alarme est modifiée à nouveau dans le délai spécifié, elle est toujours considérée Stealthy.
Une alarme restera Stealthy pendant une durée spécifiée et passera à Off si la dernière criticité était 0, On Going s'il s'agissait d'une alerte ou Bagot s'il se qualifie en tant que tel.
Bagot¶
Une alarme est considérée Bagot (ou en « flapping ») si elle est passée d'une criticité d'alerte à un état stable un nombre spécifique de fois sur une période donnée.
Cancel¶
Une alarme est considérée cancel si l'utilisateur l'a signalée comme tel à partir de l'interface utilisateur.
Après une période donnée, une alarme marquée comme cancel changera de criticité pour être considérée comme résolue.