运行状况策略设置
使用此页面来修改现有的运行状况策略。运行状况策略通过预防和检测方法来维持一个正常运行的环境。
要查看此管理控制台页面,请单击运作策略 > 运行状况策略 > health_policy_name。
如果您是具有监视员或操作员角色的用户,那么只能查看运行状况策略信息。如果您是具有配置员或管理员角色的用户,那么拥有运行状况策略的所有配置特权。
此页面包含两个选项卡:配置和本地拓扑。在配置选项卡上,可以查看和配置运行状况策略的设置。在本地拓扑选项卡上,可以查看运行状况策略成员关系的可视表示。
- 名称
指定运行状况策略的名称。运行状况策略名是必需的,并且在单元中所有运行状况策略之间必须唯一。
此名称不能以句点(.)或空格开头。空格不会导致错误,但是前导空格和结尾空格将被自动删除。请使用有意义并且一致的运行状况策略名。例如,可以通过将策略命名为
AGE_20DAYS 和 AGE_15DAYS
等名称来指示基于时效的运行状况策略。
- 描述
指定运行状况策略的其他描述。描述是可选的。您可以在创建或编辑运行状况策略时编辑描述。在使用许多运行状况策略时,或者在多个管理员共同管理同一组运行状况策略时,请考虑使用可选的描述。
- 运行状况条件
运行状况条件用于定义所实现的特定策略。
某些策略基于预防方法,另一些策略基于检测方法。基于预防方法的策略用来避免可能会引起问题的条件,而基于检测方法的策略用来识别现有的条件以及实现解决方案。这些策略可用来对集群、动态集群以及节点上运行的应用程序服务器实例执行基于运行状况的评估。对于动态集群,无论使用哪种运行状况策略,都有最小数目的动态集群实例保持运行。
- 基于时效的条件策略在相关成员的时效达到用户定义的特定值时重新启动那些成员。在重新启动时,将清除所有高速缓存的数据以及内存获取的数据。如果选择基于时效的条件策略,那么必须定义时效标准。所有服务器类型都支持基于时效的条件。
- 超出请求超时条件策略对用于请求超时的内存进行跟踪。当超时百分比超出条件的规定时,将重新启动成员。如果选择超出请求超时条件,那么必须设置已用内存百分比阈值。所有服务器类型都支持超出请求超时条件。
限制:超出请求超时条件不适用于 Java 消息服务(JMS)和因特网 ORB 间协议(IIOP)流量。
- 超出响应时间条件策略对请求以及那些请求的完成时间进行跟踪。使用此策略来对服务器进行清理,该服务器上平均响应时间超出指定的响应时间阈值。如果服务器的平均响应时间超出指定的响应时间阈值,那么将重新启动该服务器。当您选择超出响应时间策略时,必须定义响应时间阈值。所有服务器类型都支持超出响应时间条件。
- 内存条件:超出内存使用率策略对成员的内存使用率进行跟踪。当内存使用率超出特定堆大小百分比的时间达到所指定时间长度时,将重新启动成员。将执行操作以更正这种情况。如果以手工方式对独立服务器、静态集群或动态集群定义运行状况策略,那么该成员将停止并重新启动。如果对处于自动或受控方式的动态集群定义运行状况策略,那么该条件所标记的成员将停止。布置控制器根据对环境的评估动态地决定任何要启动的服务器。在自动方式下,将自动执行这些操作。在受控方式下,可以允许生成运行时任务以更正这种情况。如果选择超出内存使用率策略,那么必须定义已用内存和超出内存使用率时间阈值。只有运行 WebSphere Application Server 或 WebSphere Application Server Community Edition 的节点上的应用程序服务器才支持超出内存使用率条件。不能为其他中间件服务器类型定义超出内存使用率条件。
- 内存条件:内存泄漏策略对 Java 堆中可供服务器使用的可用内存容量的持续下降趋势进行跟踪。检测级别设置确定了检测这些趋势的时间。如果选择“内存条件:内存泄漏”策略,那么必须定义检测级别。低速检测级别设置需要的历史数据最多。正常与快速检测级别设置需要相同数量的历史数据,但快速设置允许在 Java 堆扩充到最大配置大小后执行分析。这提供了早期检测功能,但也更容易引起误判。此条件除了支持重新启动服务器作为反应外,还支持转储堆。其他中间件服务器类型不支持内存泄漏条件。
- 堵塞条件策略对堵塞的请求进行跟踪。当达到指定的检测级别时,将重新启动与此策略相关联的服务器。堵塞检测依赖于对给定时间系列数据执行的更改点检测。用于检测堵塞的度量值是服务器所遵循的响应时间和部署工作负载管理器权重。堵塞条件仅适用于动态集群和单元。如果选择堵塞条件策略,那么必须选择检测级别。
要检测更改点,运行状况控制器将计算给定点的左平均数和右平均数。对于一个点,左平均数是此样本前到达的 N 个样本的平均值,右平均数是此样本后到达的 N 个样本(包括当前点)的平均值,左右平均值之差将存储下来并与一组值(N 个)中的其他差值作比较,以确定此差是否是局部最大值。如果此差值是最大差值,那么将此差值所对应的点声明为更改点。用于检测堵塞的两个度量值分别是服务器所遵循的响应时间和动态工作负载管理器权重。
所有服务器类型都支持堵塞条件。限制:堵塞条件不适用于 JMS 和 IIOP 流量。
- 在处理用户定义的特定数目的请求后,工作负载条件策略将重新启动成员。此策略将对内存和高速缓存进行清理。如果选择工作负载策略,那么必须定义总请求数标准。所有服务器类型都支持工作负载条件。
- 运行状况条件属性
指定特定于运行状况条件的属性。
表 1. 基于时效的条件属性
设置 |
描述 |
最大时效 |
此字段仅可用于基于时效的策略。基于时效的条件策略在相关成员的时效达到最大时效时重新启动那些成员。可接受的值是以天或小时计的正整数,范围为 1 小时到 365 天。由于不支持小数,因此,要表示类似 1.2 天这样的值,请输入 36 小时。
|
表 2. 超出请求超时条件属性
设置 |
描述 |
已超时请求数 |
当内存使用率在一段时间内超出堆大小的某个百分比时,超出内存使用率条件策略将重新启动成员。已用内存总量所占百分比与超出内存阈值所用时间共同确定何时重新启动成员。此字段可接受的值是 1 到 99 的整数。
|
表 3. 超出响应时间条件属性
设置 |
描述 |
响应时间 |
此字段仅可用于超出响应时间条件策略。当完成平均响应数所用的时间超出给定的时间段时,超出响应时间条件策略将重新启动成员。此字段可接受的值是 1 毫秒到 60 分钟。
|
表 4. 内存条件:超出内存使用率属性
设置 |
描述 |
JVM 堆大小 |
当内存使用率在一段时间内超出堆大小的某个百分比时,超出内存使用率条件策略将重新启动成员。已用内存总量所占百分比与超出内存阈值所用时间共同确定何时重新启动成员。此字段可接受的值是 1 到 99 的整数。
|
违规时间段 |
此字段仅可用于超出内存使用率条件策略。当内存使用率在一段时间内超出堆大小的某个百分比时,超出内存使用率条件策略将重新启动成员。此字段可接受的值是 1 秒到 60 分钟。
|
表 5. 内存条件:内存泄漏条件属性
设置 |
描述 |
检测级别 |
可以从下列检测级别中进行选择。对于每个级别,需要在可疑内存泄漏的检测速度与准确率之间进行权衡。
- 快速检测,高误报可能性:快速检测级别快速检测潜在的内存泄漏,但由于在 Java 堆扩充到最大配置大小前进行分析,因此与低速检测策略相比,此检测级别误报内存泄漏的机会也更大。
- 标准检测,标准误报可能性:标准检测级别比快速检测级别准确,但识别潜在内存泄漏的速度较慢。标准设置与快速设置需要相同数量的历史数据,但标准设置在 Java 堆扩充到最大配置大小后执行分析。
- 低速检测,低误报可能性:低速检测级别检测潜在内存泄漏的准确度最高,但此检测级别的检测速度不如快速检测级别。低速设置需要的历史数据最多。
|
表 6. 堵塞条件属性
设置 |
描述 |
检测级别 |
- 标准检测,正常误报可能性:标准检测策略的准确度不如低速策略,但识别潜在堵塞的速度较快。
此级别使用较少的响应时间样本和动态工作负载管理器权重样本样本(N=10),并根据样本集在每个度量值中检测更改点。因此,由于此策略将等待 20 个样本(10 个样本用于左平均值,10 个样本用于右平均值)以计算平均值之差并查找局部最大值,所以得出结论的速度较快。收集样本的时间间隔为 15 秒。所以,可以在出现堵塞情况后 5 分钟内检测到这种情况。但是,由于样本数较少,因此如果样本包含多个瞬态波峰或波谷,那么误报可能性较高。
- 低速检测,低误报可能性:低速检测策略检测潜在堵塞的准确度最高,但检测速度不如标准检测策略。
此级别使用较多的响应时间样本和动态工作负载管理器权重样本样本(N=15)。因此,由于此策略必须等待 30 个样本(15 个样本用于左平均值,15 个样本用于右平均值)以计算平均值之差,所以得出结论的速度较慢。检测时间是 7 分 30 秒。但是,由于样本数较多,所以带有瞬态波峰或波谷的样本不会过度影响平均值。因此,误报可能性较低。
|
表 7. 工作负载条件属性
设置 |
描述 |
总请求数 |
在处理用户定义的特定数目的请求后,工作负载条件策略将重新启动成员。请求值必须是 1000 到 9223372036854775807 的整数。
|
表 8. 定制条件属性
设置 |
描述 |
运行反应计划的时间 |
指定子表达式以表示您正在定制条件中计算的度量值。 |
- 运行状况管理监视器反应
指定 WebSphere Extended Deployment 在已定义的运行状况条件需要改进时如何进行反应。
- 反应方式
指定用于定义运行状况策略行为的反应方式。反应方式可以是监控或自动。
- 当反应方式设置为监控时,运行状况策略处于活动状态,并且通过运行时任务将操作建议发送给管理员。管理员可以按照建议执行操作。如果管理员核准某项建议,就会自动执行操作以改进运行状况条件。
- 当反应方式设置为自动时,运行状况策略将主动地记录数据,并且
WebSphere Extended Deployment 将自动执行操作以改进运行状况条件,而无需管理员进行核准。
- 当违反运行状况条件时执行下列操作
可以定义特定的一组操作以便在违反运行状况条件时执行。这些操作可以是现有的缺省操作,您也可以定义定制操作来运行可执行文件。
操作列表以违反运行状况条件时运行操作的顺序来显示。要添加操作,请单击添加操作...。可以选择现有的缺省运行状况策略操作,即已创建的定制操作,也可以创建新的定制操作。
要除去步骤,请选择该步骤并单击除去操作。要更改步骤的顺序,请选择一个要移动的步骤并单击上移或下移。
- 成员关系
指定运行状况策略的成员,这将对那些成员激活所定义的运行状况策略。成员关系并不是一对一的关系;可以使一个成员与多个策略相关联。
通过从列表中选择相应的成员类型,对成员关系字段进行编辑。最终的可能成员将显示在可能的成员字段中。请从可能的成员列表中选择相应的成员。要选择多个成员,请按住 Ctrl 键并突出显示所有要选择的成员,然后单击添加将所选项添加至运行状况策略的成员列表。
hc_detail_main