La mayor pesadilla para todo administrador de sistemas o persona encargada de manejar un portal o servicio web es encontrarse frente a su sitio literalmente “caído”, “fuera de línea” (off-line) y no tener una idea clara de las causas para poder mitigar los efectos.
Esto “pasa hasta en las mejores familias”. Compañías gigantes como Apple, Google, Facebook y, en este caso, Slack han presentado este tipo de dificultad en los portales de algunos de sus servicios.
Customers may experience issues connecting to Slack to loading channels at this time. Our team is on the case and we will keep you posted. Apologies for any disruption. https://t.co/A17yXzyV5a
— Slack Status (@SlackStatus) January 4, 2021
First work day of 2021 and Slack is down.
Looks like another 2 weeks of 2020. pic.twitter.com/CK7wHXIPub— Keith Perhac (@harisenbon79) January 4, 2021
Reporte de problemas según https://status.slack.com y siendo un fiel creyente de la frase que dice que “el 50% de la solución de un problema es entender la causa”, les presentaré algunas de las razones que generan esos incómodos espacios de tiempo en los cuales el sitio esta fuera del aire. Pero antes que nada, creo que es importante entender un poco cómo funciona el proceso por medio de un ejemplo: para esta finalidad se va a comparar el montar un sitio con construir una casa.
Para montar un sitio en Internet se necesita un dominio (que si se compara con su equivalente en el mundo de la construcción sería la ubicación del sitio y su dirección exacta) y el hosting (que en el mundo de la construcción sería el tamaño del lote).
Teniendo claros los conceptos de dominio y de hosting, es conveniente explorar, entonces, algunas de las causas más frecuentes por las cuales un sitio puede estar fuera del aire:
- El hosting tiene algo llamado “ancho de banda” que es como el área o espacio del lote. Si muchas personas visitan el lote al mismo tiempo y éste se llena, nadie mas va a poder visitarlo mientras esté totalmente ocupado. Lo mismo pasa en los sitios web: si el tráfico colma la capacidad, entonces se va fuera de línea porque ha llegado al tope del volumen o espacio de operación del mes o del período determinado en el contrato de servicios con el proveedor del Hosting”.
- Todos los sitios tienen algunos componentes que son las páginas, secciones o pantallas que están hechas de códigos de programación que los navegadores como Safari, Google Chrome, Safari y otros, interpretan para mostrar contenidos de manera gráfica a los visitantes del sitio. Algunas de esas líneas de código en ocasiones pueden llegar a establecer conflictos y evitar que el sitio tenga una conexión satisfactoria con la red.
- En ocasiones los hackers, que suelen ser muy creativos, envían mucho tráfico basura al sitio para que el hosting se quede sin ancho de banda y se produzca algo conocido como un ataque de “negación del servicio”.
- El hosting generalmente es un almacenamiento prestado por uno o varios súper computadores llamados “servidores”, los cuales, como todos los computadores, se encuentra físicamente en un lugar ultra-secreto, ultra-confidencial, súper seguro denominado “Data-Center”, en donde se necesita mantener una temperatura determinada, un velocidad de conexión increíble y un suministro de energía regulado. Si alguno de los 3 factores anteriormente mencionados falla, es muy posible que el hosting salga del aire y las páginas albergadas queden fuera de línea.
- Si el sitio no está bien programado o se comporta de una manera no anticipada por el equipo de desarrollo, es factible que, constantemente, se abran conexiones con la base de datos que nunca se cierran y, por lo mismo, van a consumir los recursos del sistema a tal punto que lo hagan colapsar.
- Ahora bien, cuando el servidor del hosting físicamente no se encuentra en un Data-Center sino en una oficina “común y silvestre” expuesto al publico general, muchas veces puede llegar a ser apagado con la finalidad de “ahorrar energía” o, peor aún, desconectado de la red para evitar ataques informáticos, lo cual, genera inactividad en los servicios y, por consiguiente, caída masiva de todos los sitios que se encontraban alojados en dicho aparatejo.
- Problemas de “DNS lookup”. Esto sucede cuando, desde el principio, la persona encargada de montar el sitio ha realizado una configuración incorrecta del Nombre de dominio o DNS, generando que, al buscarlo en Internet, no se pueda encontrar (volviendo al ejemplo de la construcción, es como si la casa tuviera la dirección mal puesta y los visitantes se perdieran al buscarla).
- Error del servidor HTTP 502 Bad Gateway, causado por un servidor intermedio (usado generalmente por seguridad), que tiene mal configurado el canal de salida, y, por lo mismo, cuando se busca la ruta no es posible hacer la conexión. En pocas palabras, no se encuentra el puente para acceder a un sitio que está limitado por barreras físicas.
Volviendo al tema de Slack
El caso debe ser muy complejo dado que Slack posee una infraestructura robusta y más compleja que un simple portal pero, lastimosamente, hasta el momento, no hay una razón oficial para los problemas que se están presentando a nivel delo login, mensajes, transmisión de archivos, llamadas, integraciones, conexiones, links, notificaciones, búsquedas y demás funciones se encuentran no disponibles.
Lo único que se sabe es que: Slack está al tanto del tema y continua trabajando para resolver los correspondientes problemas en dicha familia de aplicaciones.
We've updated the severity on our end. Please check the status site for updates. https://t.co/A17yXzyV5a
— Slack Status (@SlackStatus) January 4, 2021
¿Y entonces? ¿Qué se puede hacer al respecto del problema con Slack?
Trying to use email to communicate with the team since @slack is down pic.twitter.com/1cjWQuLo12
— Brandon Ausbrooks 🔀 (@brandondigital) January 4, 2021
Por ahora, lo único que se puede hacer es armarse de paciencia y esperar a que el servicio sea restablecido prontamente y estar atento a cualquier actualización en el sitio oficial.