当创建新的运行状况策略时,使用此页面来定义运行状况策略条件属性。要查看此管理控制台页面,单击运作策略 > 运行状况策略 > 新建。
有关运行状况策略属性的补充信息如下:
基于时效的条件:
最大时效 |
此字段将设置时效值,以便当它们的时效达到该值时,策略就会重新启动相关联的成员。可接受的值是以天或小时为单位的正整数,其范围是 1 小时到 365 天之间。不支持小数。要使用以小数表示的天数,可将它转换为小时数。例如,对于 1.5 天,可使用 36 小时来代替。 |
反应方式 |
- 监控:表明运行状况策略是活动的,并且会将关于适当操作的建议发送给管理员,管理员可以接受“运行时任务”页面上的建议,也可以拒绝它们。
- 自动:表明运行状况策略是活动的,并且系统同时在记录数据和执行操作。
|
选择在运行状况条件违规时要执行的操作。 |
重新启动服务器:重新启动服务器。对于基于时效的条件策略,执行的操作必须是“重新启动服务器”。 |
超过响应时间条件:
响应时间 |
此字段可用于超过响应时间条件的运行状况策略。
当完成的平均请求数所用的时间超过此时间段时,超过响应时间策略就会重新启动成员。
此字段可接受的值在 1 毫秒到 60 分钟之间(包括 1 毫秒和 60 分钟)。 |
反应方式 |
- 监控:表明运行状况策略是活动的,并且会将关于适当操作的建议发送给管理员,管理员可以接受这些建议,也可以拒绝它们。
- 自动:表明运行状况策略是活动的,并且系统同时在记录数据和执行操作。
|
选择在运行状况条件违规时要执行的操作。 |
重新启动服务器:重新启动服务器。对于工作负载条件策略,执行的操作必须是“重新启动服务器”。 |
超过请求超时条件:
已使用的内存总量 |
当内存使用率在一段时间内超过了堆大小的某个百分比时,超过内存策略就会重新启动成员。
将已使用的内存总量所占百分比与超过内存阈值所用的时间一起使用来确定何时重新启动成员。此字段可接受的值是 1 到 99 之间的整数。 |
反应方式 |
- 监控:表明运行状况策略是活动的,并且会将关于适当操作的建议发送给管理员,管理员可以接受这些建议,也可以拒绝它们。
- 自动:表明运行状况策略是活动的,并且系统同时在记录数据和执行操作。
|
选择在运行状况条件违规时要执行的操作。 |
- 执行线程转储:对 IBM Java Development Kit(JDK)执行线程转储。
- 重新启动服务器:重新启动服务器。
|
内存条件:超过内存:
已使用的内存总量 |
当内存使用率在一段时间内超过了堆大小的某个百分比时,超过内存策略就会重新启动成员。
将已使用的内存总量所占百分比与超过内存阈值所用的时间一起使用来确定何时重新启动成员。此字段可接受的值是 1 到 99 之间的整数。 |
超过内存阈值所用的时间 |
此字段可用于超过内存运行状况策略。当内存使用率在一段时间内超过了堆大小的某个百分比时,超过内存策略就会重新启动成员。此字段可接受的值在 1 秒到 60 分钟之间(包括 1 秒和 60 分钟)。 |
反应方式 |
- 监控:表明运行状况策略是活动的,并且会将关于适当操作的建议发送给管理员,管理员可以接受这些建议,也可以拒绝它们。
- 自动:表明运行状况策略是活动的,并且系统同时在记录数据和执行操作。
|
选择在运行状况条件违规时要执行的操作。 |
重新启动服务器:重新启动服务器。对于工作负载条件策略,执行的操作必须是“重新启动服务器”。 |
内存条件:内存泄漏:
条件的检测级别 |
您可以选择下列检测级别。对于每个级别,应综合考虑检测怀疑存在的内存泄漏时所使用的速度和准确度。
- 检测得越快,误报警的概率就越高:快速检测策略将快速检测潜在的内存泄漏,但是,它将比采用缓慢检测策略时错误指出内存泄漏的概率更高,这是因为它在 Java 堆扩展到它的最大已配置大小之前就开始分析。
- 标准检测,误报警的标准概率:标准检测策略比快速检测更准确,但是找出潜在内存泄漏的速度就要慢一些。标准设置与快速设置要求相同的历史数据量,但是标准设置要在 Java 堆已扩展到为它配置的最大大小之后才开始分析。
- 检测得越慢,误报警的概率就越低:缓慢检测策略是最准确的,但是,它不能象快速检测策略那样快速地检测潜在的内存泄漏。缓慢设置要求最多的历史数据。
|
反应方式 |
- 监控:表明运行状况策略是活动的,并且会将关于适当操作的建议发送给管理员,管理员可以接受这些建议,也可以拒绝它们。
- 自动:表明运行状况策略是活动的,并且系统同时在记录数据和执行操作。
|
选择在运行状况条件违规时要执行的操作。 |
- 仅对 IBM Java Development Kit(JDK)执行 JVM 堆转储:对 IBM JDK 执行堆转储。
- 重新启动服务器:重新启动服务器。
|
堵塞条件
条件的检测级别 |
您可以选择下列检测级别。对于每个级别,应综合考虑检测怀疑存在的内存泄漏时所使用的速度和准确度。
- 标准检测,误报警的正常概率:标准检测策略没有缓慢检测策略那么准确,但是它能够快速找出潜在的内存泄漏。此策略对响应时间和部署工作负载管理器权重使用更少的样本(N=10),并尝试根据样本集来检测每个度量值中的更改点。它能更快得出结论,因为它只需等待 20 个样本,10 个样本用于左平均值,10 个样本用于右平均值,用来计算这两个平均值的差别,并查找本地最大值。每隔 15 秒收集这些样本一次。可以在五分钟内检测出堵塞情况。因为样本数更小,所以,如果样本数经常出现瞬时峰值或下降,则发生误报警的概率更高。
- 检测得越慢,误报警的概率就越低:缓慢检测策略是最准确的,但是,它不能象标准检测策略那样快速地检测潜在的内存泄漏。此策略对响应时间和部署工作负载管理器权重都使用更多样本(N=15)。它得出结论的速度更慢,这是因为它必须等待 30 个样本(15 个样本用于左平均值,15 个样本用于右平均值)用来计算这两个平均值的差别。检测时间为
7 分钟 30 秒。因为样本数更多,所以只是很少的样本出现瞬时峰值或下降并不会明显影响平均值,产生误报警的概率就更低。
|
反应方式 |
- 监控:表明运行状况策略是活动的,并且会将关于适当操作的建议发送给管理员,管理员可以接受这些建议,也可以拒绝它们。
- 自动:表明运行状况策略是活动的,并且系统同时在记录数据和执行操作。
|
选择在运行状况条件违规时要执行的操作。 |
重新启动服务器:重新启动服务器。对于工作负载条件策略,执行的操作必须是“重新启动服务器”。 |
工作负载条件:
请求数总计 |
在此字段中,您可以对工作负载策略指定数字请求值。当处理了此数目的请求时,工作负载条件策略将重新启动成员。可接受的请求值必须是 1000 到 9223372036854775807 之间的整数。 |
反应方式 |
- 监控:表明运行状况策略是活动的,并且会将关于适当操作的建议发送给管理员,管理员可以接受这些建议,也可以拒绝它们。
- 自动:表明运行状况策略是活动的,并且系统同时在记录数据和执行操作。
|
选择在运行状况条件违规时要执行的操作 |
重新启动服务器:重新启动服务器。对于工作负载条件策略,执行的操作必须是“重新启动服务器”。 |
完成了这些字段之后,单击下一步。