11 Octubre

Qué es el protocolo BGP y por qué provocó que WhatsApp, Facebook e Instagram desaparecieran de internet durante horas

Ayer WhatsApp, Facebook e Instagram desaparecieron de internet. Estos servicios estuvieron caídos durante más de seis horas, pero finalmente todo volvió a la normalidad.

Esa enorme caída fue debida al llamado BGP o Border Gateway Protocol, uno de los sistemas que se utiliza en internet para llevar lo más rápido posible el tráfico a donde se necesita. ¿Cómo funciona el BGP y cómo es posible que la caída fuera tan grave? Es lo que explicamos a continuación.

Qué es y cómo funciona el BGP

Como indican en CloudFlare, este protocolo es un mecanismo para intercambiar información de enrutamiento entre los llamados sistemas autónomos (AS) en internet.

Internet es una red de redes, y hace uso de grandes routers que tienen a su vez enormes listas actualizadas de las posibles rutas que se pueden usar para llevar un paquete de datos desde el origen al destino.

Con BGP es posible que una red (como la de Facebook) avise a las demás redes de que está ahí, accesible, en internet. El problema es que Facebook ya no estaba avisando a las demás redes y a las operadoras de internet: es como si desapareciera de esas listas y de ese "mapa".

Cada una de esas redes individuales (como la de Facebook o la de Cloudflare) tiene el llamado ASN (Autonomous System Number), una red individual con una serie de normas internas y unificadas de enrutamiento de paquetes.

Cada sistema autónomo (AS) puede originar los llamados prefijos —que controlan un grupo de direcciones IP— y los prefijos de tránsito —que indican cómo alcanzar ciertos grupos específicos de IPs—. Los ASN van "anunciando" sus rutas prefijadas a través del BGP, y eso permite que otras redes sepan cómo comicarse con esa.

Facebook dejó de anunciar las rutas a los prefijos de sus servidores de nombres de dominio (DNS) a las 16:58 UTC. Ese hizo que aunque otras direcciones IP de Facebook estuvieran aún enrutadas, no pudieran ser accedidas: daba igual que esa parte estuviera activa, porque la caída de las DNS las hacía inaccesibles.

Cloud1

En Cloudflare monitorizan las actualizaciones que se van realizando al BGP para poder actuar en consecuencia con sus servicios, y normalmente Facebook apenas hace cambios. Sin embargo a las 15:40 UTC notaron un pico de cambios de enrutamiento que fueron los que hicieron que el problema real se viese en nuestros ordenadores y en nuestros móviles.

Ese fallo provocó que los servicios que resuelven DNS fallaran. Estos servicios, como ya hemos explicado alguna vez, permiten que cuando escribamos por ejemplo "www.xataka.com" en el navegador este sepa que las peticiones tienen que ir a la máquina con dirección IP 52.85.187.42.

Cuando Facebook dejó de anunciar el prefijo de enrutamiento o encaminamiento de sus DNS a través del BGP, los servicios de resolución de DNS no tuvieron forma de conectar a sus servidores de nombres: todos acabaron dando error, y eso causó más y más efectos colaterales.

Petici

Entre otras cosas, se incrementaron las peticiones a sitios como Twitter, Signal y otras plataformas de mensajería como Telegram, algo que también notaron en Cloudflare y con lo que de hecho hicieron una pequeña broma en Twitter diciendo "hola literalmente a todos" porque efectivamente muchísimos usuarios acudieron a Twitter en busca de respuestas. Incluso Facebook usó esta red para confirmar que tenían un problema técnico y estaban tratando de resolverlo.

Afortunadamente en Facebook lograron restablecer la situación a las 21:20 UTC: la actividad de su BGP volció a ser importante a eso de las 21:00 UTC según CloudFlare, y tuvo un pico a las 21:17 UTC.

Bgp1

Eso dejaba claro que en Facebook estaban volviendo a anunciar todos sus prefijos de enrutamiento, lo que permitió que aproximadamente a las 21:28 UTC el acceso normal a Facebook, WhatsApp e Instagram se restableciese.

¿Qué dice Facebook del problema?

Los ingenieros de Facebook también explicaban brevemente las causas del problema que les afectó. Lo hicieron en su blog Facebook Engineering.

Allí se disculpaban en primer lugar por las molestias qu eeste problema pudiera haber causado a los usuarios. Según ese artículo, el problema fue causado por lo siguiente:

"Cambios de configuración en los routers troncales que coordinan el tráfico de red entre nuestros centros de datos. Esa interrupción del tráfico de la red tuvo un efecto en cascada en la forma en que se comunican nuestros centros de datos, lo que provocó la paralización de nuestros servicios".

No había más detalles al respecto y en Facebook quisieron aclarar que en ningún momento la caída se debió a un ciberataque: "en este momento creemos que la causa de raíz de la caída fue un cambio erróneo de la configuración".

Además en Facebook quisieron aclarar que "no tenemos evidencias de que datos de los usuarios hayan estado comprometidos como resultado de esta caída del servicio".

Fuente: xataka.com

Esta página web utiliza cookies para analizar de forma anónima y estadística el uso que haces de la web, mejorar los contenidos y tu experiencia de navegación. Para más información accede a la Política de cookies
Las cookies necesarias ayudan a hacer una página web utilizable activando funciones básicas como la navegación en la página y el acceso a áreas seguras de la página web. La página web no puede funcionar adecuadamente sin estas cookies.
Nombre Caducidad Finalidad Proveedor
SL_C*
_ga
_gid
ci_session
Sesión Cookies para el correcto funcionamiento de las operaciones de la página web. Ninguna de estas cookies contiene datos de caracter personal. Propias
cookie_consent 1 año Guarda las preferencias del usuario sobre el consentimiento de cookies. Propias
Las cookies de personalización permiten a la página web recordar información que cambia la forma en que la página se comporta o el aspecto que tiene, como su idioma preferido o la región en la que usted se encuentra.
Nombre Caducidad Finalidad Proveedor
Las cookies de análisis ayudan a los propietarios de páginas web a comprender cómo interactúan los visitantes con las páginas web reuniendo y proporcionando información de forma anónima.
Nombre Caducidad Finalidad Proveedor
_utma 2 años. Genera un id de usuario único, que es el que se utiliza para hacer recuento de cuantas veces visita el sitio un determinado usuario. También registra cuando fue la primera y la última vez que visitó el sitio web. Google
_utmb 30 minutos. Calcula cuando se ha terminado una sesión, registrando la hora de llegada a la página. Google
_utmc Sesión. Comprueba si se debe mantener la sesión abierta o se debe crear una sesión nueva. Google
_utmt 10 minutos. Se utiliza para limitar la velocidad de solicitud del servicio y limitar la recogida de datos en los sitios de alto tráfico. Google
_utmz 6 meses. Registra el origen del usuario, así como las palabras clave. Google
Las cookies publicitarias se utilizan para rastrear a los visitantes en las páginas web. La intención es mostrar anuncios relevantes y atractivos para el usuario individual, y por lo tanto, más valiosos para los editores y terceros anunciantes.
Nombre Caducidad Finalidad Proveedor
Las cookies de afiliados permiten realizar un seguimiento de las visitas procedentes de otras webs, con las que el sitio web establece un contrato de afiliación.
Nombre Caducidad Finalidad Proveedor