Microsoft Azure sufre una interrupción global de más de ocho horas debido a un error operativo interno en Azure Front Door, afectando servicios como Microsoft 365 y Xbox Live.

Compartir:

Microsoft Azure experimentó una interrupción global que duró más de ocho horas, afectando a múltiples servicios de Microsoft y a miles de clientes en todo el mundo. La causa fue un error operativo interno relacionado con un cambio de configuración defectuoso en Azure Front Door (AFD), un componente crítico que gestiona el tráfico para los servicios de Microsoft y sus clientes. Este error provocó que numerosos nodos globales fallaran sus comprobaciones de estado, generando una falla generalizada del Sistema de Nombres de Dominio (DNS) y errores de conexión.

El incidente comenzó entre las 15:45 y 16:00 UTC, con alertas internas activadas a las 16:04 UTC. A las 17:30 UTC, Microsoft bloqueó todos los nuevos cambios de configuración de clientes en AFD a nivel global. La mitigación principal se comunicó a las 00:05 UTC del 30 de octubre, aunque la restauración completa fue lenta debido a problemas residuales. Este evento se produce tras una interrupción significativa en Amazon Web Services (AWS), lo que plantea preocupaciones sobre la fragilidad de las infraestructuras de los hiperescaladores.

Microsoft se comprometió a reparar el defecto de software en las herramientas de despliegue que permitieron la propagación del error y enfatizó la necesidad de adoptar arquitecturas de resiliencia en múltiples capas y estrategias multi-nube para evitar la dependencia de un único proveedor. Este incidente subraya la importancia de realizar un mapeo riguroso de las dependencias en la cadena de suministro digital.

¿Qué medidas deben adoptar las empresas tecnológicas para garantizar la resiliencia ante fallos operativos internos en sus infraestructuras de nube?

.

.

.

RESUMEN BASADO EN EL ARTÍCULO PUBLICADO EN Medio EL Fecha. Leer original

Otras entradas que te pueden interesar

Compartir:
← Volver a la portada