运行状况管理概述

WebSphere Extended Deployment 提供运行状况监控和管理子系统的功能。此子系统持续监控服务器的操作,以检测与软件故障有关的功能退化。运行状况管理子系统包含两个元素:运行状况策略和运行状况控制器。在控制台中,可通过选择运作策略 > 运行状况策略来访问运行状况策略。在管理控制台中,可通过选择运作策略 > 自治管理器 > 运行状况控制器来访问运行状况控制器。

运行状况策略是用户创建和用户定义的。当服务器功能退化时,运行状况策略定义一组条件,由 WebSphere Extended Deployment 进行解释。运行状况策略条件有四个不同的类别。这些策略条件与超出内存消耗(这可能表明内存泄漏)、超过响应时间(这可能表明服务器挂起)、服务器执行的工作量,以及服务器寿命有关。运行状况策略目标可以是单个服务器、集群中所有服务器,或者单元中所有服务器。另外,服务器可被多个运行状况策略同时监控。 装备了一组要查看的条件,WebSphere Extended Deployment 监控动态集群、应用程序服务器和集群,直到检测到问题,然后采取操作。

运行状况控制器设置是缺省情况下创建的全局参数。用户可按需更改这些全局参数。运行状况控制器遵照策略行事,确保某些条件。例如,您可使用运行状况控制器禁用或启用运行状况管理,同时仍然在系统上定义很多运行状况策略。您还可提供某些时期对重新启动频率的限制或完全禁止重新启动。

运行状况管理子系统持续监控服务器的状态,以及服务器执行的工作。此数据与运行状况策略中定义的条件相比较。当收集的数据满足或超出运行状况策略中定义的条件,则认为它对服务器的运行状况产生影响。

当 WebSphere Extended Deployment 处于自动或监控操作方式时,运行状况管理子系统起作用。当以自动方式运行时,运行状况管理系统在检测到运行状况策略违例时,将重新启动服务器。使用监控方式,运行状况管理系统将创建运行时任务,建议服务器重新启动。系统管理员可批准或拒绝建议的重新启动操作。