Monitoring

SCENARI4.1 offre des possibilités de surveillance par des environnements de monitoring (nagios, ...), afin de suivre la bonne santé du système.

Nous recommandons vivement la mise en place de ces sondes de contrôle dans les système mis en production.

Nous préconisons au minimum la déclaration des deux services suivants :

Contrôle de la webApp SCENARIserver

Service check_http pour contrôler que la webapp SCENARIserver fonctionne

url : https://[urlWebapp]/s/chain/u/ping

user : [scuserSystem]

password : [mot de passe [scuserSystem]]

Assertion sur la réponse HTTP :

  • 200 : succès ;
  • 503 : warning ;
  • erreur dans tous les autres cas ;

ExempleExemple de paramétrage Nagios :

Déclaration d'une nouvelle commande :

define command{

command_name ping_scserver_ssl

command_line /usr/lib/nagios/plugins/check_http -S -H '$ARG1$' -u '/$ARG2$/s/chain/u/ping' -a $ARG3$:$ARG4$

}

Déclaration d'un nouveau service :

define service{

use generic-service

host_name [serverHostname]

service_description SCserver-coperia2

servicegroups scservers

check_command ping_scserver_ssl![serverHostname]![nameWebapp]![scuserSystem]![mot de passe [scuserSystem]]!

}

Contrôle d'intégrité des données du SCENARIserver [DB]

Service check_http pour contrôler la cohérence des données

url : https://[urlWebapp]/s/chain/u/adminOdb?cdaction=CheckAuto

user : [scuserSystem]

password : [mot de passe [scuserSystem]]

Assertion sur la réponse HTTP :

  • 200 : succès ;
  • 503 : warning ;
  • erreur dans tous les autres cas ;

un check par 24h (lors d'une activité applicative faible)

ExempleExemple de paramétrage Nagios :

Déclaration d'une nouvelle commande :

define command{

command_name ping_scserverdata_ssl

command_line /usr/lib/nagios/plugins/check_http -S -H '$ARG1$' -u '/$ARG2$/s/chain/u/adminOdb?cdaction=CheckAuto' -a $ARG3$:$ARG4$

}

Déclaration d'un nouveau service :

define service{

use generic-service

host_name [serverHostname]

service_description SCserver-coperia2

servicegroups scservers

check_interval 1440

retry_interval 30

check_command ping_scserverdata_ssl![serverHostname]![nameWebapp]![scuserSystem]![mot de passe [scuserSystem]]!

}

Autres contrôles utiles

  • Exécution des backups ;
  • Place disque ;
  • Ram utilisée ;
  • ...