Você pode procurar os seguintes problemas quando o gerenciamento de funcionamento não estiver funcionando ou não funcionando da maneira esperada.
Localizando os Logs Certos
O controlador de funcionamento é um recurso distribuído gerenciado pelo gerenciador de alta disponibilidade (HA).
Ele existe
em todos os processos do agente de nó e do gerenciador de implementação e fica ativo em
um desses processos. Se um processo falhar, o controlador ficará ativo
em outro processo de agente de nó ou de gerenciador de implementação.
Para
determinar onde o controlador de funcionamento está sendo executado, clique em Operações de Tempo de Execução
> Implementação Estendida > Componentes Principais no console administrativo.
O status de local e estabilidade do controlador de funcionamento é exibido.
O Orientador de Desempenho Está Ativado com a Política de Funcionamento de Fuga de Memória Padrão
A política de funcionamento de fuga de memória padrão usa a funcionalidade do orientador de desempenho para que esse orientador seja ativado quando essa política tiver membros designados. Para desativar o orientador de desempenho, você deve remover essa política de funcionamento ou limitar a associação da política de funcionamento. Para preservar a política de funcionamento para uso futuro, considere a manutenção da política de fuga de memória padrão, além da remoção de todos os membros. Para alterar os membros, clique em Políticas Operacionais > Políticas de Funcionamento > Default_Memory_Leak.
É possível editar as associações de política de funcionamento incluindo e removendo membros específicos da política.
Configurações do Health Controller
A lista a seguir contém os problemas que são encontrados como resultado das configurações do controlador de funcionamento:
- Health Controller desativado
- Verifique a configuração no console administrativo clicando em Políticas
Operacionais > Controladores Autônomos > Controlador de Funcionamento e
selecione as guias Configuração e Tempo de Execução. O controlador de funcionamento é ativado por padrão.
- Os reinícios são proibidos nesse momento
- Verifique o número de vezes de reinícios proibidos no console administrativo clicando
em Políticas Operacionais > Controladores Autônomos > Controlador de
Funcionamento e selecionando o campo Reinício Proibido. Por padrão, nenhuma vez é proibida.
- Reiniciando muito rapidamente após o último reinício
- Para verificar o intervalo mínimo de reinício no console administrativo, clique em
Políticas Operacionais > Controladores Autônomos > Controlador de
Funcionamento e modifique o campo Intervalo Mínimo de Reinício. Nenhum
intervalo mínimo é definido por padrão.
- O ciclo de controle é muito longo
- Para verificar a duração do ciclo de controle no console administrativo, clique em
Políticas Operacionais > Controladores Autônomos > Controlador de
Funcionamento e ajuste o valor, se necessário. O Health Controller verifica as violações de política periodicamente. Se a duração do ciclo de controle for muito longa, ele pode não reiniciar os servidores rápido o suficiente.
- O servidor foi reiniciado X vezes consecutivamente e a condição de
funcionamento continua a ser violada
Neste caso,
X indica o parâmetro de reinicialização máxima consecutiva do controlador de funcionamento. O controlador de funcionamento conclui que os reinícios não
estão corrigindo o problema e os desativa no servidor. A seguinte mensagem é exibida no log:
WXDH0011W: O servidor servername
excedeu o número máximo de falhas de verificação: desativando os reinícios.
O controlador de funcionamento continua a monitorar o servidor e exibirá
mensagens no log se a política de funcionamento for violada:
WXDH0012W: O servidor servername com as reinicializações desativadas falhou na verificação de funcionamento.
Você pode ativar as reinicializações para o servidor executando qualquer uma das ações a seguir:
Configurações da Política de Funcionamento
Os problemas a seguir são encontrados como resultado das configurações da política de funcionamento:
- O servidor não faz parte de uma política de funcionamento
- Verifique se as associações de política de funcionamento se aplicam ao servidor no
console administrativo clicando em Políticas Operacionais > Políticas de
Funcionamento.
- O modo de reação de uma política contendo o servidor é supervisionado
- Verifique o console administrativo clicando em Operações de Tempo de Execução
> Gerenciamento de Tarefas > Tarefas de Tempo de Execução para encontrar
pedidos de aprovação de uma ação de reinício para uma política no modo
Supervisionado. Os servidores são reiniciados automaticamente quando você configura Automático como o modo de reação. A mensagem a seguir
é gravada no registro para a condição supervisionada:
WXDH0024I: O servidor nome do servidor violou a condição de funcionamento de política de funcionamento; o modo de reação é supervisionado.
- O servidor é membro de um cluster estático e o único membro do cluster em execução
- A política de funcionamento não desativa todos os membros de um cluster de
uma só vez. Se um cluster tiver um membro de cluster, ou um membro de cluster estiver em execução, ele não será reiniciado.
- O servidor é membro de um cluster dinâmico, o número de instâncias em execução não
excede o valor mínimo e o controlador de posicionamento está desativado
- Verifique Número Mínimo de Instâncias Requeridas para o cluster dinâmico
clicando em Servidores > Clusters Dinâmicos no console administrativo. Nesse caso, o gerenciamento de funcionamento trata o cluster dinâmico como um cluster estático, utilizando o parâmetro de número mínimo de instâncias.
- O controlador de funcionamento não recebeu a política
- O controlador de funcionamento não é executado no gerenciador de implementação em que as
políticas de funcionamento são criadas. Se o gerenciador de implementação for reiniciado após o
início do controlador de funcionamento, o controlador de funcionamento poderá não ter a nova
política.
Você pode minimizar esse problema executando as
seguintes etapas:
- Desative o controlador de funcionamento. No console administrativo, clique em Políticas
Operacionais > Gerenciadores Autônomos > Controlador de Funcionamento.
- Sincronize os repositórios de configuração com os nós de back-end. No console
administrativo, clique em Administração do Sistema > Nós. Selecione os nós a
serem sincronizados e clique em Sincronizar.
- Reinicie o controlador de funcionamento. No console administrativo, clique em Políticas
Operacionais > Gerenciadores Autônomos > Controlador de Funcionamento.
- Sincronize os repositórios de configuração com os nós de back-end. No console
administrativo, clique em Administração do Sistema > Nós. Selecione os nós a
serem sincronizados e clique em Sincronizar.
Interações do Controlador de Disposição de Aplicativos
A lista a seguir contém problemas que são encontrados como resultado do gerenciamento de funcionamento e interações do controlador de disposição de aplicativos:
- O servidor é membro de um cluster dinâmico, mas não é possível entrar em contato com o controlador de posicionamento
- Para membros de cluster dinâmico, o monitoramento de funcionamento verifica com o controlador de disposição de aplicativos para determinar se um servidor pode ser reiniciado. Se o controlador de disposição de aplicativos estiver ativado, mas não puder ser contatado, será exibida a seguinte mensagem no log:
WXDH1018E: Não foi possível entrar em
contato com o controlador de posicionamento
Verifique se o controlador de
posicionamento está em execução. Para determinar onde o controlador de funcionamento está sendo executado, clique em Operações de
Tempo de Execução > Implementação Estendida > Componentes Principais no console
administrativo. O status de local e estabilidade do controlador de funcionamento é exibido.
O controlador de funcionamento grava mensagens no agente do nó ou no gerenciador de implementação
específico indicado pelo local atual.
- O servidor é membro de um cluster dinâmico, o controlador de posicionamento está em
execução e o controlador de posicionamento instrui o gerenciamento de funcionamento a não
reiniciar o servidor
- O controlador de posicionamento pode exigir que a instância do servidor permaneça em execução.
- O servidor é parado, mas não iniciado.
- Em um cluster dinâmico, uma reinicialização pode ter uma entre várias formas:
- Reiniciar no local (parar o servidor, iniciar o servidor)
- Iniciar uma instância do servidor em outro nó e parar a problemática.
- Parar somente o servidor problemático, assumindo que as instâncias de aplicativo restantes podem satisfazer a demanda.
O controlador de posicionamento determina qual forma a reinicialização terá e, se necessário, onde iniciar a nova instância. Após uma reinicialização ser executada
em um cluster dinâmico, o gerenciamento de funcionamento emitirá um pedido para o controlador de posicionamento para computar novamente sua disposição.
Problemas de Sensor
A lista a seguir contém os problemas que são encontrados como resultado das configurações do gerenciamento de funcionamento e da associação do grupo de nós:
- Nenhum dado do sensor é recebido para o servidor.
- O gerenciamento de funcionamento não pode detectar uma violação de política se não receber nenhum dado dos sensores requeridos pela política. Se nenhum dado do sensor for recebido durante o ciclo de controle, o gerenciamento de funcionamento imprimirá a seguinte mensagem de registro:
WXDH3001E: Nenhum dado do sensor recebido durante o ciclo de controle do servidor server_name para a classe de funcionamento healthpolicy.
Para condições de tempo de resposta, o gerenciamento de funcionamento recebe dados do ODR (On Demand Router). Nenhum dado é gerado para essas condições até que os pedidos sejam enviados através do ODR.