Thread Rating:
  • 0 Vote(s) - 0 Average
  • 1
  • 2
  • 3
  • 4
  • 5
Configurar alarmas con modulos "host alive"
#1
Buenos Días soy nuevo en Pandora, veo un gran potencial en esta herramienta y quiero terminar de implementarla, pero tengo varios problemas de ajustes que creo que son algo sencillos pero por falta de conocimientos demoro en el avance. Ojala puedan apoyarme.
Necesidades:
1. Necesito el monitor con el modulo de Host Alive en varios servidores.
2. El intervalo de actualización del contacto con el agente para estos equipo debe ser de 2 minutos máximo.
3. La alerta debe enviarla (por correo ya configurado y funcionando) al minuto tres, o sea un minuto después de detectado el estado critico del modulo.
4. Se debe enviar alerta de recuperación del servicio de host alive del servidor que falló.
Problemas encontrados:
2. El intervalo de actualización, al ponerlo en 2 minutos, tengo que bajar el intervalo de cada modulo a un minuto para que no quede "fuera de limites" y me registre el contacto con el agente. De hecho se pone gris, en estado desconocido y la linea de ultimo contacto remoto avanza a mas de 2 minutos, y llega a desconectarse, luego de al menos 6 minutos vuelve a conectarse y todo queda en verde.
3. Cuando desconecto un servidor el monitor llega al estado critico, pero debo forzar con el botón de "validar" de la alerta para que me envíe el correo electrónico, de otro modo no lo hace.
4. No me envía la alerta de recuperación del modulo.

He revisado las guías rápidas y no logro llegar a este funcionamiento que me parece algo básico. Si tienen una guía algo mas sencilla (que no creo que exista mas sencilla) les agradezco me puedan proporcionar el link.

Pandora es un excelente programa, espero poder llegar a un nivel mayor, por eso les pido el apoyo, después ya me moveré solo.

Gracias de antemano por sus respuestas.

 Reply
#2
Hola chernandez,

- Las alertas, generalmente, van asociadas al estado de los módulos, por lo que se disparan cuando éstos cambian su estado, no siendo posible demorar en un minuto su disparado. La única forma de lograr algo parecido a esto sería utilizar los "FF threshold", que indican el número seguido de estados críticos que debe presentar un módulo para disparar a la alerta (generalmente usado para protegerse ante falsos positivos). Esto se configura manualmente desde la edición del módulo.
- El intervalo de ejecución en los host alive debe especificarse desde la edición manual del módulo, siendo individual e independiente en los módulos de red o ejecución remota, como es el caso del Host Alive. No debería ponerse en estado desconocido ya que el intervalo es controlado por el módulo.
- Puedes habilitar el envío de correo de recuperación desde el apartado de Alertas -> Templates. En este caso si has utilizado una plantilla "Critical condition", al editarla verás en el paso 3 un campo "Alert recovery". Puedes encontrar todos los detalles sobre el sistema de alertas aquí: http://wiki.pandorafms.com/index.php?tit...es:Alertas
- Si la plantilla y acción de la alerta se encuentran correctamente configuradas, la alerta será ejecutada y el correo enviado, no es necesario validar la alerta. Además, el concepto de validación significa cambiar manualmente el estado de la alerta, de "disparado" a "normal" o en espera.

Un saludo,
Antonio.
 Reply
#3
Es un caso puro de configuración entonces. Voy a repasar un Step by step desde cero, y veo los resultados. Gracias por las guias. Si sale otro tema lo subo, luego lo cierro.

Saludos.
 Reply
#4
Ya encontre la solucion para el envio de alerta por email. Debo desactivar la proteccion contra tormenta de eventos; de esta maenra los eventos pueden hacer su labor. Obviamente, es necesario aplicar la proteccion de cascada de eventos en las caracteristicas del agente que es padre de este; tambien al igual que los equipos con varios modulos.

Ya envi las alertas de Estado Critico y de Recuperacion.

Puedo trabajar con calma lo del estado de desconexion, que no me afecta en mucho del tiempo de respuesta.

Gracias por su ayuda, me sirvio para corroborar mi diagnostico.

Ahora mi problema es otro que primero lo busco y luego lo subo si no veo la solucion.
 Reply
#5
Eso es Carlos Enrique, la protección contra tormenta de eventos debe estar desactivada, y puedes utilizar la protección en cascada para agentes "padre".

Un apunte sobre esto, ten en cuenta que la protección en cascada te previene de recibir alertas de los agentes "hijos" si hay una alerta crítica disparada en el padre. Debido al intervalo natural de los agentes (5min por defecto), puede que un agente padre se desconecte cuando aún quedan 4 minutos para su próxima conexión, y durante esos 4 minutos recibir alertas de los agentes hijos. Por esto es recomendable a los agentes padre bajarles el intervalo, para en el momento que sufran un problema, detectarlo lo más rápido posible para disparar sus alertas y ya no recibir un spam de alertas de los agentes inferiores.
No sé si me he explicado bien.

Un saludo,
Antonio.
 Reply


Users browsing this thread: 1 Guest(s)


(c) 2006-2018 Artica Soluciones Tecnológicas. Contents of this wiki are under Create Common Attribution v3 licence. | pandorafms.com | pandorafms.org

Theme © MyBB Themes