Las actualización del kernel y otros aplicativos del sistema que esta madrugada hemos llevado a cabo en el servidor SH9 y en otros servidores, ha afectado al funcionamiento del servidor SH9, provocando dos cáidas durante el día de hoy.
Acabamos de reiniciar el servidor y desecho las principales actualizaciones de esta pasada madrugada con la esperanza de que esto solucione el problema.
Lo más probable es que esto solucione la incidencia, pero lo sabremos pronto: vamos a hacer unas pruebas de estrés al servidor y sólo en caso de los supere con buena nota consideraremos la incidencia resuelta.
Si resulta que no supera las pruebas de estrés procederemos a migrar a todos los clientes alojados en SH9 a otro servidor, aunque esto os lo comunicaremos a los clientes alojados en servidor uno a uno y por email.
Lamentamos los problemas que estáis teniendo los clientes que habéis tenido la mala suerte de estar alojados en SH9, ya que durante las últimas 2-3 semanas habéis sufrido varias incidencias extremadamente raras y no relacionadas, demasiadas.
Actualización: Hemos hecho una serie de pruebas de estrés y todo parece indicar que la incidencia ha sido resuelta. En cualquier caso, seguimos haciendo pruebas.
Actualización [12/11/2009 22:00]: Ayer conseguimos estabilizar el funcionamiento del servidor y minimizar el tiempo de indisponibilidad, pero dado que el servidor sigue sin responder como deberías vamos a migrar a todos los clientes alojados en SH9 a otros servidores. Os enviaremos un email en breve y haremos las migraciones esta misma noche.
Categorias: Avisos e Incidencias
Etiquetas: sh9
Esta próxima madrugada, 11 de Noviembre sobre la 0:30, vamos a realizar tareas de mantenimiento en todos los servidores que alojan clientes excepto en el servidor SH4, donde ya lo hicimos ayer.
Las tareas de mantenimiento requerirán el reinicio de los servidores, con lo que estos estarán fuera de servicio entre 2 y 5 minutos.
Estas labores las realizamos con el objetivo de mantener los servidores actualizados y garantizar la segurid de los mismos.
Categorias: Avisos e Incidencias
Etiquetas: sh1, sh2, SH3, sh4, sh5, sh6, sh7, sh8, sh9
Dentro de unos minutos, 9 de Noviembre a las 9:40, vamos a reiniciar uno de los switches principales, el que da acceso a Internet a la mayoría de nuestros clientes.
Esto significa que durante unos instantes la mayoría sitios web y dominios de nuestros clientes quedarán desconectados de la red.
El motivo del reinicio es determinar el motivo de una incidencia anterior relacionada con la sobrecarga de la red y poder tomar las medidas necesarias para que no se vuelva a repetir.
Actualización [9:47]: El reinicio se ha hecho con éxito. Los servidores han estado sin conexión unos pocos segundos y todo vuelve a funcionar con normalidad.
Categorias: Avisos e Incidencias
Etiquetas: red, switch
Vamos a hacer un reinicio controlado desde el centro de datos del servidor SH4. El objetivo es solucionar un problema que afecta al módulo de gestión remota que incorpora la máquina.
El servidor estará fuera de servicio durante algo menos de 5 minutos.
Actualización [9:03]: El servidor ha sido reiniciado sin problemas y vuelve a funcionar. La incidencia ha sido resuelta.
Categorias: Avisos e Incidencias
Etiquetas: sh4