Facebook y todas sus ramificaciones posibles (WhatsApp, Facebook Messenger, Instagram u Oculus) se han ido a negro en la tarde de este lunes durante más de seis horas. Aunque en España no habían dado las 18 horas, en la sede de Facebook en Menlo Park (California, EEUU) el reloj no marcaba aún las 9 de la mañana y la jornada laboral estaba empezando.
No es la primera vez que estos servicios se caen, pero esta vez el apagón de algunas de las redes sociales más importantes del mundo ha sido más profundo que nunca tanto en duración como en desconexión. En otras ocasiones el servicio ha vuelto a recuperar la normalidad en menos tiempo o sin perder todas las funcionalidades. Hoy sin embargo la desconexión ha sido total, a nivel global y durante varias horas.
Recordaba al fallo que sacudió a la red hace 13 años, que dejó a Facebook desconectada durante todo un día, sin embargo, la plataforma no tenía la relevancia de ahora. Entonces afectó a 80 millones de usuarios, hoy son más de 3.000 millones de internautas los que no pueden mantener sus relaciones sociales online debido al apagón general.
Santos Janardhan, vicepresidente de ingenería de la compañía, ha confirmado lo que los expertos aseguraban durante la caída: el fallo se ha debido a un cambio en la configuración en los routers que coordinan el tráfico de la red entre sus centros de datos.
Esta interrupción del tráfico tuvo un efecto dominó en la forma en la que se comunican todos los centros de datos de Facebook, lo que provocó un colapso de todos sus servicios deteniendo así la actividad externa, pero también interna.
Ahora falta conocer si se ha tratado de un error fatal llevando a cabo un cambio de configuración, o bien se trata de un sabotaje interno de alguien descontento tras las últimas filtraciones que dejan en mal lugar la cultura de la empresa.
¿Qué ha pasado?
Durante las horas que han estado caídos los servicios Facebook no ha confirmado qué es lo que estaba ocurriendo. La compañía se ha limitado a explicar a través de su perfil oficial de Twitter que "somos conscientes de que algunas personas tienen problemas para acceder a nuestras aplicaciones y productos. Estamos trabajando para que todo vuelva a la normalidad lo antes posible y pedimos disculpas por cualquier inconveniente".
Una vez resuelto el problema Janardhan ha pedido perdón y ha indicado que "la causa raíz de esta interrupción fue un cambio de configuración defectuoso (...) una interrpción que también afectó a muchas de las herramientas y sistemas internos que utilizamos en nuestras operaciones diarias, complicando nuestros intentos de diagnosticar y resolver rápidamente el problema. Hemos estado trabajando tan duro como hemos podido para restaurar el acceso, y nuestros sistemas ahora están funcionando".
Expertos en ciberseguridad apuntan a que el fallo concreto que ha tumbado a Facebook reside en un problema con los sistemas de dominio (DNS). Esto lo que permite es que los ordenadores sepan cómo llegar a los servidores del sitio web que se está buscando, en este caso Facebook.
Sin embargo, parece que el fallo en los DNS no fue la causa, sino la consecuencia. El fallo que comenzaron dando los servicios de la compañía era un HTTP 503, lo que indica que no hay un servidor disponible para la solicitud. Fue entonces cuando el CEO de Cloudfare, Dane Knecht, alertaba en Twitter que las rutas del protocolo de puerta de enlace (BGP) para Facebook habían sido retiradas.
El BGP es el sistema por el cual una red es capaz de trazar una ruta para llegar a un servidor por diferentes caminos. Actúa como un mecanismo por el cual los proveedores de servicios de internet de todo el mundo comparten información sobre qué servidores son responsables de enrutar el tráfico de internet a grupos específicos de direcciones de internet. Y Facebook lo ha perdido esta tarde.
El especialista en ciberseguridad e investigación, Brian Krebs, explicaba que este cambio en el BGP se ha hecho desde dentro de la propia compañía. Una actualización de los registros que ha hecho que Facebook, WhatsApp, Instagram, Messenger y Oculus se hayan ido a negro.
Este apagón no ha sido exclusivo para los usuarios de las distintas redes sociales y servicios, sino que también ha afectado a los propios trabajadores de la compañía. La comunicación interna ha dejado de funcionar, así como el correo electrónico, las herramientas de administración, así como accesos a oficinas ya que los sistemas de validación dirigen a esos mismos dominios que no funciona. Además, también ha afectado a todos los servicios que usan la validación de cuenta de Facebook para funcionar.
¿Fallo o sabotaje?
Todas las miradas apuntan a un mismo lugar para tratar de conocer el origen del fallo: dentro de Facebook. Diferentes expertos han explicado a través de sus cuentas en Twitter y Reddit de que lo más probable es que un cambio en la configuración haya bloqueado la dirección hacia Facebook.
Es algo que ha sucedido en otras ocasiones a la hora de introducir cambios en alguna de las redes sociales, pero parece que esta vez el fallo es mayor. Tras perder el BGP la solución debe provenir directamente por parte de los técnicos de los centros de datos que, con acceso físico y local a los routers tienen que volver a configurar las rutas para que todo quede como antes.
Aunque lo más probable es que trate de un error a la hora de realizar un proceso, diferentes expertos no descartan que se deba a un sabotaje por parte de algún trabajador descontento dentro de la compañía. En las últimas semanas The Wall Street Journal ha ido revelando información confidencial de la empresa en la que se revelaba información en torno a la toxicidad de Instagram para los menores o la doble vara de medir de las reglas para cuentas de celebridades.
La gota que ha colmado el vaso entre los más críticos con la compañía se produjo hace unas horas, cuando la CBS emitió una entrevista en el programa 60 minutes con Frances Haugen, la responsable de haber filtrado la información al diario neoyorkino. En ella, la extrabajadora de la compañía aseguraba que para Facebook "el dinero estaba por encima de la ética", un planteamiento que ha guiado a las decisiones del ecosistema de Mark Zuckerberg.
Con respecto a la posibilidad de un hackeo, se cree que es algo menos probable. Para realizar un ataque de denegación de servicio de este calado se necesitaría la coordinación de muchos -y poderosos- ciberdelincuentes al mismo tiempo, o bien una técnica muy innovadora y poco conocida. Asimismo Janardhan aclara que "no tenemos evidencia de que los datos de los usuarios se vieran comprometidos como resultado de este tiempo de inactividad".
Cada vez más apagones globales
La caída generalizada de Facebook ha parado la actividad de millones de empresas de todo el mundo, ante lo que el directivo ha querido aprovechar para pedir perdón. "Personas y empresas de todo el mundo confían en nosotros todos los días para mantenerse conectados. Entendemos el impacto que interrupciones como estas tienen en la vida de las personas, y nuestra responsabilidad de mantener a las personas informadas sobre interrupciones en nuestros servicios. Pedimos disculpas a todos los afectados, y estamos trabajando para entender más sobre lo que sucedió hoy para que podamos seguir haciendo que nuestra infraestructura sea más resistente".
El de Facebook no es la primera gran caída de un servicio en lo que va de año y que afecta a miles de millones de usuarios de internet en todo el mundo. El pasado julio un fallo en Akamai, una red de distribución de contenido (CDN), provocó una caída generalizada de miles de servicios de internet desde Amazon a Google, pasando por Fortnite o PlayStation.
En junio otra CDN, en este caso Fastly, provocó una caída generalizada tumba cientos de webs y redes sociales tras un fallo en sus servidores. En esa ocasión entre los servicios afectados estuvieron Twitter, PayPal, Twitch o Spotify, los que estuvieron desconectados durante algo más de una hora.
También cabe recordar que el pasado mes de diciembre fue Google (y todos sus servicios) los que se fueron a negro en torno a una hora. La costumbre de trabajar con Gmail o ver vídeos de YouTube fue imposible en esa mañana, ya que un error a la hora de autenticarse tumbaron la mayoría de los servicios de la empresa de Mountain View.