Nivelat - Problemas de acceso (Servidores AWS) – Detalles del incidente

Sistemas funcionando con normalidad

Problemas de acceso (Servidores AWS)

Resuelto
En funcionamiento
Iniciado el hace más de 2 añosDuró 6 días

Afectado

Plataforma de capacitación web

En funcionamiento de 2:26 PM a 2:25 PM

API

En funcionamiento de 2:26 PM a 2:25 PM

Aplicación iOS

En funcionamiento de 2:26 PM a 2:25 PM

Aplicación Android

En funcionamiento de 2:26 PM a 2:25 PM

Servidores

En funcionamiento de 2:26 PM a 2:25 PM

Actualizaciones
  • Resuelto
    Resuelto

    Marcaremos como resuelto luego de 3 días sin reportes

  • Supervisando
    Supervisando

    Hemos realizado los cambios necesarios para evitar las intermitencias, seguiremos monitoreando el progreso.

  • Investigando
    Investigando

    Seguimos obteniendo reportes de intermitencia en el servicio, es por esto que no hemos dado por resuelto el incidente por completo.

    Volveremos a marcar como intermitencia…

  • Supervisando
    Supervisando

    Los servidores ya se encuentran actualizados, estamos volviendo a derivar el tráfico de clientes a nuestra aplicación de manera progresiva mientras monitoreamos que todo ha vuelvo a la normalidad.

    Daremos por resuelto este incidente una vez que tengamos el ok de nuestros clientes.

    Agradecemos a nuestro fiel trabajador que se mantuvo animando a todos durante este incidente, pueden volver a verlo cuando quieran aquí: http://gato.nivelat.com

  • Actualizar
    Actualizar

    El proceso de actualización de los servidores sigue su curso, el 25% ya se encuentra corregido, seguiremos notificando progreso durante el día.

    Próxima actualización la realizaremos en 1 hora.

  • Actualizar
    Actualizar

    El problema de actualización del cluster de servidores y su posterior funcionamiento con versiones diferente hicieron que los servicios responsables de derivar el tráfico a la aplicación Nivelat estén caídos.

    Hemos tomado la decisión de frenar los servidores y realizar una mantención no programada de actualización.

    La próxima ventana de actualización será en 1 hora

  • Actualizar
    Actualizar

    El problema hace referencia a los controladores de accesos (ingress) y su versión diferente a la del cluster EKS

  • Identificado
    Identificado

    Al igual que ayer, hay un flujo inusual de accesos a la plataforma lo que inhabilita el acceso a los clientes regulares, aplicaremos una baja temporal del servicio para normalizar la situación

  • Investigando
    Investigando

    We are currently investigating this incident.