Paramètres des stratégies de santé

Cette page permet de modifier les stratégies de santé existantes. Les stratégies de santé préservent la bonne santé de l'environnement à l'aide de méthodologies de prévention et de détection .

Pour afficher cette page de la console d'administration, cliquez sur Stratégies d'exploitation > Stratégies de santé > nom_stratégie_santé.

Si vous êtes un utilisateur doté du rôle Moniteur ou Opérateur, vous pouvez uniquement afficher les informations de la stratégie de santé. En revanche, si vous êtes un utilisateur doté du rôle Configurateur ou Administrateur, vous disposez de tous les privilèges de configuration des stratégies de santé.

Cette page se compose de deux onglets : Configuration et Topologie locale. Dans l'onglet Configuration, vous pouvez afficher et configurer les paramètres de la stratégie de santé. Dans l'onglet Topologie locale, vous pouvez afficher une représentation visuelle des appartenances à la stratégie de santé.

Nom

Nom de la stratégie de santé. Le nom de la stratégie de santé est requis et doit être unique parmi toutes les autres stratégies de la cellule.

Le nom de l'application ne peut pas commencer par un point (.) ni un espace. Un espace ne provoque pas d'erreur mais tout espace placé au début ou à la fin du nom est supprimé automatiquement. Utilisez des noms de stratégies de santé significatifs et cohérents. Par exemple, les stratégies de santé basées sur l'ancienneté peuvent être spécifiées en nommant les stratégies ANCIENNETE_20JOURS, ANCIENNETE_15JOURS, et ainsi de suite.

Description

Description supplémentaire de la stratégie de santé. La description est facultative. Vous pouvez la modifier lorsque vous créez ou supprimez une stratégie de santé. Pensez à utiliser la description facultative lorsque vous utilisez de nombreuses stratégies de santé ou lorsque plusieurs administrateurs gèrent le même ensemble de stratégies de santé.

Condition de santé

La condition de santé définit la stratégie mise en oeuvre.

Certaines stratégies reposent sur la prévention et d'autres sur la détection. Les stratégies basées sur la prévention permettent d'éviter les conditions pouvant provoquer des problèmes, tandis que les stratégies basées sur la détection identifient les conditions existantes et offrent une résolution. Vous pouvez utiliser ces stratégies pour effectuer des évaluations fondées sur la santé des clusters, des clusters dynamiques et des instances de serveur d'applications exécutées sur les noeuds. Dans le cas des clusters dynamiques, et quelle que soit la stratégie de santé utilisée, le nombre minimal d'instances de cluster dynamique reste actif.

  • La condition basée sur l'ancienneté redémarre les membres associés lorsque leur ancienneté atteint la valeur d'ancienneté maximale. Ce redémarrage efface toutes les données acquises mises en cache et en mémoire. Si vous sélectionnez une condition basée sur l'ancienneté, vous devez définir les critères d'ancienneté. La condition basée sur l'ancienneté est prise en charge sur tous les types de serveurs.
  • La condition de dépassement du nombre de demandes arrivées à expiration effectue le suivi des la mémoire utilisée pour les demandes arrivant à expiration. Lorsque le pourcentage des demandes arrivant à expiration dépasse la limite de la condition, les membres sont redémarrés. Si vous sélectionnez cette condition, vous devez définir le seuil de pourcentage de mémoire utilisée. La condition de dépassement du nombre de demandes arrivées à expiration est prise en charge sur tous les types de serveurs.
    Restriction : La condition de dépassement du nombre de demandes arrivées à expiration ne s'applique pas au trafic JMS (Java Message Service) et IIOP (Internet Inter-ORB Protocol).
  • La stratégie de la condition de dépassement de temps de réponse effectue le suivi des demandes et la durée d'exécution requise. Utilisez cette stratégie pour nettoyer les serveurs ayant un nombre moyen de demandes dont l'exécution dépasse un délai prédéfini. Dans le cas d'un tel dépassement, les membres sont redémarrés. Lorsque vous sélectionnez la stratégie de dépassement de temps de réponse, vous devez définir le seuil du temps de réponse. La condition de dépassement du temps de réponse est prise en charge sur tous les types de serveurs.
  • La stratégie condition de mémoire : dépassement de mémoire effectue le suivi de l'utilisation de mémoire pour un membre. Lorsque l'utilisation de la mémoire dépasse un certain pourcentage de la taille de segment et ce pendant une durée définie, des actions sont entreprises pour corriger la situation. Si vous définissez la stratégie de santé sur un serveur autonome, un cluster statique ou un cluster dynamique en mode manuel, le membre s'arrête et redémarre. Si vous définissez la stratégie de santé sur un cluster dynamique en mode automatique ou supervisé, le membre marqué par la condition s'arrête. Le cas échéant, le contrôleur de positionnement décide de manière dynamique quels serveurs doivent être démarrés en fonction de son évaluation de l'environnement. Ces actions sont exécutées automatiquement si vous êtes en mode automatique. Si vous êtes en mode supervisé, vous pouvez approuver les tâches d'exécution qui sont générées pour corriger la situation. Lorsque vous sélectionnez la stratégie de dépassement de temps de réponse, vous devez définir la mémoire utilisée et le seuil de dépassement du temps de réponse. La condition de dépassement de mémoire est prise en charge uniquement sur des serveurs d'applications sur des noeuds exécutant WebSphere Application Server ou WebSphere Application Server Community Edition. Il n'est pas possible de définir la condition de dépassement de mémoire pour d'autres types de serveurs middleware.
  • La stratégie condition de mémoire : fuite de mémoire effectue le suivi des tendances régulières de baisse de la mémoire disponible pour un serveur dans le segment Java. Le paramètre de détection de niveau détermine le moment où ces tendances sont détectées. Si vous sélectionnez la stratégie condition de mémoire : fuite de mémoire, vous devez définir un niveau de détection. Le niveau de détection le plus lent nécessite la quantité maximale de données historisées. Les niveaux de détection normal et rapide nécessitent la même quantité de données historisées, mais la détection rapide autorise l'analyse avant que le segment Java n'ait atteint sa taille maximale configurée. Ceci permet une détection anticipée, mais plus encline aux faux positifs. Cette condition prend en charge les clichés de segment de mémoire, en plus des redémarrages de serveur comme réactions. La condition de fuite de mémoire n'est pas prise en charge pour d'autres types de serveurs middleware.
  • La stratégie condition de drainage incorrect des demandes effectue le suivi des demandes restées bloquées. Le serveur associé à cette stratégie redémarre lorsque le niveau de détection indiqué est atteint. La détection de drainage incorrect des demandes fait appel à la détection des points de transition dans des données de série temporelle précises. Les critères de mesure utilisés pour détecter un drainage incorrect des demandes sont les temps de réponse et les pondérations du gestionnaire de charge de travail de déploiement qui sont observés pour le serveur. La condition de drainage incorrect des demandes s'applique uniquement aux clusters dynamiques et aux cellules. Si vous sélectionnez cette stratégie, vous devez sélectionner le niveau de détection.

    Pour détecter des points de transition, le contrôleur de santé calcule une moyenne de gauche et une moyenne de droite pour un point donné. Pour un point, la moyenne de gauche correspond à la valeur moyenne de N échantillons qui arrivent avant cet échantillon et la moyenne de droite est la valeur moyenne de N échantillons, y compris le point en cours, qui arrivent après. La différence des valeurs moyennes de gauche et de droite est enregistrée et comparée à d'autres différences dans un ensemble de valeurs à N pour déterminer si cette différence est un maxima local. Si cette différence correspond à la différence maximale, alors le point auquel cette différence correspond, est appelé point de transition. Les deux métriques utilisées pour détecter un drainage incorrect des demandes sont les temps de réponse et les pondérations du gestionnaire de charge de travail dynamique qui sont observés pour le serveur.

    La condition de drainage incorrect des demandes est prise en charge sur tous les types de serveurs.
    Restriction : La condition de drainage incorrect des demandes ne s'applique pas au trafic JMS et IIOP.
  • La stratégie de condition de charge de travail redémarre les membres lorsqu'un certain nombre de demandes définies par l'utilisateur a été traité. Cette stratégie efface la mémoire et les caches. Lorsque vous sélectionnez la stratégie de charge de travail, vous devez définir les critères du nombre total de requêtes. La condition de charge de travail est prise en charge sur tous les types de serveurs.
Propriétés de la condition de santé

Propriétés spécifiques à la condition de santé.

Tableau 1. Propriétés de condition basées sur l'ancienneté
Paramètre Description
Ancienneté maximale

Cette zone est disponible pour la stratégie basée sur l'ancienneté. Elle redémarre les membres associés lorsque leur ancienneté atteint la valeur d'ancienneté maximale. Les valeurs admises sont des entiers positifs exprimés en jours ou en heures et compris entre 1 et 365 jours. Pour entrer une valeur du type 1,2 jours, utilisez la valeur 36 heures, car les nombres décimaux ne sont pas pris en charge.

Tableau 2. Propriétés de la condition de dépassement du nombre de demandes arrivées à expiration
Paramètre Description
Demandes arrivées à expiration

La stratégie fondée sur le dépassement de mémoire redémarre les membres lorsque l'utilisation de la mémoire dépasse un pourcentage de votre surtemps de taille de segment. Le pourcentage de mémoire totale utilisée est associé à la valeur de durée de dépassement du seuil de mémoire pour déterminer quand redémarrer les membres. Cette zone accepte les nombres entiers compris entre 1 et 99.

Tableau 3. Propriétés de la condition de dépassement de temps de réponse
Paramètre Description
Temps de réponse

Cette zone est disponible pour la stratégie basée sur le dépassement de temps de réponse. Cette stratégie redémarre les membres lorsque la durée de traitement du nombre moyen de demandes dépasse la valeur définie. Les valeurs admises pour cette zone sont comprises entre 1 milliseconde et 60 minutes.

Tableau 4. Condition de mémoire : propriétés de la condition de dépassement de mémoire
Paramètre Description
Taille du segment JVM

La stratégie fondée sur le dépassement de mémoire redémarre les membres lorsque l'utilisation de la mémoire dépasse un pourcentage de votre surtemps de taille de segment. Le pourcentage de mémoire totale utilisée est associé à la valeur de durée de dépassement du seuil de mémoire pour déterminer quand redémarrer les membres. Cette zone accepte les nombres entiers compris entre 1 et 99.

Période d'infraction

Cette zone est disponible pour la stratégie basée sur la condition de dépassement de mémoire. La stratégie fondée sur le dépassement de mémoire redémarre les membres lorsque l'utilisation de la mémoire dépasse un pourcentage de votre surtemps de taille de segment. Les valeurs admises pour cette zone sont comprises entre 1 seconde et 60 minutes.

Tableau 5. Condition de mémoire : propriétés de la condition de fuite de mémoire
Paramètre Description
Niveau de détection
Vous pouvez choisir entre les niveaux de détection suivants. Pour chacun, il existe un compromis entre la rapidité et l'exactitude de la détection des fuites de mémoire suspectées.
  • Détection rapide, probabilité plus élevée de fausses alarmes Une stratégie de détection rapide peut détecter une fuite de mémoire potentielle rapidement, mais le risque de fausse alarme est plus élevé qu'avec une stratégie de détection lente, car l'analyse est effectuée avant que le segment Java n'atteigne sa taille maximale configurée.
  • Détection standard, probabilité standard de fausses alarmes : Un niveau de détection standard est plus précis que le niveau rapide, mais n'identifie pas aussi rapidement les fuites de mémoire potentielles. Les détections standard et rapide nécessitent la même quantité de données historisées, mais la détection standard effectue l'analyse lorsque le segment Java a atteint sa taille maximale configurée.
  • Détection lente, faible probabilité de fausses alarmes : Le niveau de détection lent est le plus exact, mais il n'identifie pas aussi rapidement les fuites de mémoire potentielles que le niveau de détection rapide. Le niveau de détection lent est celui qui nécessite la quantité maximale de données historisées.
Tableau 6. Propriétés de la condition de drainage incorrect des demandes
Paramètre Description
Niveau de détection
  • Détection standard, probabilité normale de fausses alarmes : Le niveau de détection standard est moins précis que le niveau lent, mais il identifie plus rapidement les drainages incorrects potentiels.

    Ce niveau utilise moins d'échantillons (N=10) pour les temps de réponse et les pondérations du gestionnaire de charge de travail dynamique et détecte un point de transition dans chacune des métriques basé sur l'ensemble des échantillons. Il en résulte que cette stratégie obtient une conclusion plus rapidement car elle attend 20 échantillons, 10 pour la moyenne de gauche et 10 pour la moyenne de droite, afin de calculer une différence des moyennes et rechercher un maxima local. Les échantillons sont collectés toutes les 15 secondes. Ainsi, le drainage incorrect des demandes peut être détecté dans les 5 minutes. Cependant, comme les échantillons sont moins nombreux, s'ils comportent plusieurs pics ou chutes transitoires, la probabilité d'occurrence de fausses alarmes est plus élevée.

  • Détection lente, faible probabilité de fausses alarmes : Le niveau de détection lent est le plus exact, mais il n'identifie pas aussi rapidement les drainages incorrects potentiels que le niveau standard.

    Ce niveau utilise davantage d'échantillons (N=15) pour les temps de réponse et les pondérations du gestionnaire de charge de travail dynamique. Ainsi, cette stratégie obtient une conclusion plus lentement car elle attend 30 échantillons (15 pour la moyenne de gauche et 15 pour la moyenne de droite) afin de calculer une différence des moyennes. Le temps de détection est de sept minutes et trente secondes. Cependant, du fait de la multitude d'échantillons, la présence de pics ou de chutes transitoires n'affecte pas trop les valeurs des moyennes. La probabilité de fausses alarmes est donc faible.

Tableau 7. Propriétés de la condition de charge de travail
Paramètre Description
Nombre total de demandes

La stratégie fondée sur la condition de charge de travail redémarre les membres lorsque le nombre de demandes défini par l'utilisateur a été traité. La valeur de la requête doit être comprise entre 1000 et 9223372036854775807.

Tableau 8. Propriétés de la condition personnalisée
Paramètre Description
Exécuter le plan de réaction quand Indique une sous-expression qui représente les métriques que vous évaluez dans votre condition personnalisée.
Réaction du moniteur de gestion des états

Spécifie le comportement de WebSphere Extended Deployment lorsqu'une condition de santé définie a besoin d'être améliorée.

Mode de réaction

Indique le mode de réaction qui définit le comportement de la stratégie de santé. Le mode de réaction peut être Supervisé ou Automatique.

  • Lorsque le mode de réaction est Supervisé, les stratégies de santé sont actives et des recommandations liées aux actions sont envoyées à l'administrateur avec une tâche d'exécution. L'administrateur peut suivre les recommandations. Si l'administrateur approuve une recommandation, des actions sont entreprises pour améliorer automatiquement la condition de santé.
  • Lorsque le mode de réaction est Automatique, les stratégies de santé consignent les données de façon active et WebSphere Extended Deployment entreprend automatiquement des actions pour améliorer automatiquement la condition de santé, sans l'approbation de l'administrateur.
Prenez les mesures suivantes en cas d'infraction à la condition de santé

Vous pouvez définir un ensemble spécifique d'actions à exécuter en cas d'infraction à la condition de santé. Il peut s'agir des actions par défaut ou vous pouvez définir des actions personnalisées pour exécuter un fichier exécutable.

Une liste d'actions s'affiche dans leur ordre d'exécution en cas d'infraction à la condition de santé. Pour ajouter une action, cliquez sur Ajouter une action. Vous pouvez choisir une action de la stratégie de santé par défaut, une action personnalisée que vous avez créée, ou vous pouvez créer une action personnalisée.

Pour supprimer une étape, sélectionnez-la et cliquez sur Supprimer une action. Pour modifier l'ordre de vos étapes, sélectionnez une étape à déplacer et cliquez sur Vers le haut ou Vers le bas.

Appartenances

Indique les membres de la stratégie de santé définie pour ceux-ci. L'appartenance n'est pas une relation unilatérale ; vous pouvez associer des membres à plusieurs stratégies.

Editez la zone Appartenance en sélectionnant le type de membre approprié dans la liste. Les membres potentiels s'affichent dans la liste Membres disponibles. Sélectionnez les membres appropriés dans la liste Membres disponibles. Pour sélectionner plusieurs membres, maintenez la touche Ctrl enfoncée jusqu'à ce que toutes vos sélections soient mises en surbrillance et cliquez sur Ajouter pour ajouter votre sélection à l'appartenance pour la stratégie de santé.




Centre de documentation de WebSphere Extended Deployment (en ligne)

Informations connexes
Collection de stratégies de santé
Création d'une stratégie de santé : définition des propriétés générales d'une stratégie de santé
Création d'une stratégie de santé : définition des propriétés de condition de santé
Création d'une stratégie de santé : spécification des membres à contrôler
Collection d'actions personnalisées
Paramètres des actions personnalisées
Générateur de sous-expression des conditions de santé personnalisées

hc_detail_main