🎙 Episodio 21. Big Data y política

En el episodio de hoy de Un Podcast Ninja sobre Big Data vamos a hablar de las aplicaciones del Big Data en política ¡por fin un enfoque interesante de la política! 😉

En abril de este mismo año, Elon Musk, el hombre más rico del mundo, anuncia su intención de comprar Twitter, la red social basada en textos de menos de 280 caracteres y su favorita personal. Elon Musk tiene 112 millones de seguidores y ha publicado más de 20000 tuits desde 2009.

Pues eso, que después de que en abril anunciara que quería comprar Twitter y echarse atrás en julio, con un par de demandas cruzadas de por medio y un juicio que estaba a punto de comenzar, finalmente ha decidido comprar la red social por el precio inicial de la oferta, 44000 millones de dólares, un precio que está bastante por encima de la cotización en bolsa de Twitter.

Twitter está encendido 🔥.

La moderación de contenido es un tema sensible en las redes sociales, que no dejan de ser empresas privadas, que tienen un impacto real en la sociedad. Y no únicamente en la sociedad del país en el que residen o del que proceden y cuyas leyes deben respetar sino de la sociedad global.

En enero del año pasado, la cuenta de Twitter de Donald Trump fue suspendida tras el asalto al congreso por incitación a la violencia.

Suspendida indefinidamente… hasta la llegada de Musk, defensor absolutista de la libertad de expresión y que ha declarado en varias ocasiones que no cree en suspender de manera indefinida a nadie.

Pero bueno, a parte de cotilleos de Silicon Valley sobre qué hace o deja de hacer el hombre más rico del mundo con su dinero o el jardín en el que se ha metido o dejado de meter con la moderación del contenido de Twitter o incluso más allá de debates sobre la libertad de expresión…

¿Qué tiene que ver todo esto con Big Data?

Pues que como toda red social, genera datos y Twitter en particular, con 200 millones de usuarios que envían más de 10000 tuits por segundo en todo el mundo, pues apesta a Big Data.

Cada uno de nosotros dejamos una huella digital con todas las interacciones que realizamos en Internet.

Las búsquedas, los “me gusta” y comentarios en redes sociales, a quién seguimos, las películas que vemos, las cosas que compramos por internet…

En 2012 IBM estimó que cada uno de nosotros dejaba una huella digital de unos 50 MB al día y que si quisiéramos imprimirlo en folios a doble cara y apilarlo, la pila de papel llegaría desde aquí hasta el sol.

Por suerte, no nos ha dado todavía por hacer eso.

Toda esta información que generamos dice mucho sobre nosotros, no solo sobre las cosas que nos gustan y que no tenemos problemas en decir públicamente sino también sobre cosas que no teníamos intención de revelar sobre nosotros mismos.

Probablemente si Google quisiera, reconoced que sabría cosas a través de vuestras búsquedas que no le habéis contado a nadie más.

La campaña de Obama. El comienzo de la política data-centric

Cuando en estados unidos un candidato determinado se plantea realizar una campaña política. Si quiere tener alguna posibilidad de llegar a algún sitio uno de sus objetivos es gastar su presupuesto de campaña de manera eficiente.

Tiene que llegar al electorado. Tiene que saber dónde invertir más esfuerzo y recursos y donde ni siquiera merece la pena. El esfuerzo en tratar de convencer a un republicano convencido de votar a Obama tiene muchas posibilidades de ser un esfuerzo esteril.

Lo mismo aplicaría en cualquier país. Hay personas que tienen el partido al que votan como una traza inherente de su identidad. Hay que invertir mucho esfuerzo en convencerle de que cambie su voto y posiblemente ni siquiera se consiga.

Mejor buscar a alguien que no lo tenga tan claro.

Para encontrar a esa gente, históricamente los partidos hacían encuestas telefónicas, identificaban zonas geográficas como más afines a un partido o a otro y así es como clasificaban más o menos a los votantes.

Estos datos se recolectaban manualmente por los distintos grupos que trabajaban en las campañas de los partidos políticos y se analizaban con más o menos gracia.

En 2004 el partido demócrata decidió invertir recursos en una plataforma para tener los datos sobre los votantes unificados y estandarizados.

Durante la campaña de re-elección de Obama se añadieron a esta plataforma, datos adicionales sobre los votantes como datos de consumo, opiniones y preferencias que se recogían directamente en encuestas puerta a puerta para poder crear un modelo que pudiera predecir su comportamiento.

Una vez identificados los votantes afines a Obama y los que tenían dudas sobre su voto, el objetivo era hacer todo lo posible para asegurarse de que los pertenecientes al primer grupo se presentaba en las urnas a votar y tomar medidas para convencer al segundo grupo de que Obama era el candidato correcto.

¿Cómo? Pues optimizando el presupuesto en publicidad de su campaña.

Sabiendo lo que veía en la tele el primer grupo podían optimizar el anuncio y el momento en el que emitirlo de manera mucho más eficiente.

Por ejemplo, decidieron anunciarse en las pausas publicitarias de Walking Dead ya que detectaron que los votantes a los que tenían que convencer veían esa serie.

Dicen que Obama fue el primer candidato a las presidenciales de EEUU en utilizar Big Data

Por aquel entonces aún se podía ver en facebook a qué le había dado “me gusta” una persona de manera pública y entonces salió un artículo de investigación de la Universidad de Cambridge que demostraba que era posible identificar las opiniones políticas y la orientación sexual de una persona a partir de las cosas que había marcado con un “Me gusta” en facebook con bastante precisión.

Facebook tomó nota y pocas semanas más tarde ocultó esa información para que no fuera accesible de forma pública.

No fue únicamente facebook quién se dió cuenta del potencial de estos datos…

Cambridge Analytica y la campaña de Trump

Durante las elecciones presidenciales en estados unidos de 2016, el equipo de Donald Trump decidió aplicar Big Data durante su campaña y contrataron a Cambridge Analytica.

Esta empresa, utilizaba datos de facebook de perfiles de ciudadanos estadounidenses para inferir los rasgos psicológicos de cada uno de ellos, clasificarlos en distintos grupos a los que después dirigiría publicidad especialmente diseñada.

Por ejemplo, si obtenía un grupo especialmente preocupado por la inmigración les dirigían anuncios sobre la idea de Trump de construir un muro con México. Si resulta que era un grupo más preocupado por la corrupción, pues esta gente veía en su muro anuncios sobre lo corrupta que era Hillary Clinton, y así…

La conclusión es que Donald Trump no solo hizo un uso intensivo de su perfil de Twitter para movilizar a sus votantes sino que también, a través de Cambridge Analytica, utilizó la información de 30 millones de perfiles de facebook sin que los dueños de estos perfiles lo supieran o dieran su consentimiento al respecto.

Al parecer, Cambridge Analytica tuvo acceso a estos 30 millones de perfiles de facebook a través de un profesor de la universidad de Cambridge que creó una app de estas, muy populares en aquella época, que te hacía unas preguntas y te decía cuál era tu personalidad. Para usarla había que entrar con la opción de loguearse con facebook, que también por aquel entonces daba al desarrollador de la app acceso sobre bastantes datos del perfil como las cosas a las que el usuario había dado “Me gusta”, la ciudad en la que vivía, quiénes eran sus amigos y no solo eso sino también algunos datos de tus amigos.

Así que 270000 personas respondieron a este test de personalidad lo que dió acceso al profesor de Cambridge, que en principio tenía fines únicamente de investigación a los datos de estas 270000 personas y de sus amigos, lo que hizo un total de 50 millones de perfiles.

Hasta aquí todo bien.

La cosa se tuerce cuando el profesor de la Universidad de Cambridge recibe financiación de unos 800000 dólares de Cambridge Analytica a cambio de una copia de esos datos, lo cual, iba en contra de las condiciones de facebook de aquel entonces.

Ojo, coger los datos sí… dárselos a otros no.

También se relacionó a Cambridge Analytica con la campaña del Brexit por realizar acciones similares a favor de la salida del Reino Unido de la Unión Europea.

Es decir, a partir de la información de los perfiles de facebook de los usuarios se les segmenta según intereses y ciertas características de su personalidad que se pueden inferir a partir de los datos que sí están disponibles en sus perfiles para dirigir anuncios lo más personalizados posibles.

De nuevo, si era una persona preocupada por su trabajo se le podía dirigir un anuncio sobre cómo que el Reino Unido formase parte de la Unión Europea, hacía que no se pudiese controlar de manera directa la inmigración y lo presentaba como un peligro, un “peligro” que atacaba precisamente a sus preocupaciones personales y que hacía a este grupo de usuarios más influenciables en su decisión de voto.

Anuncio de facebook de la campaña a favor del Brexit

O por ejemplo, para ciudadanos británicos con un uso más intensivo de servicios como Uber les mostraba publicidad sugiriendo que la regulación de la Unión Europea al respecto podría cambiar el servicio tal y como lo conocen y que por eso, mejor el Brexit y que el propio gobierno británico se encargue de la regulación.

Tanto en la campaña del Brexit como en la de Donald Trump, Cambridge Analytica hizo uso del Big Data para dirigir mensajes políticos personalizados, atacando directamente a los miedos y anhelos del votante el mensaje se vuelve más relevante y, por tanto, más interesante para el votante lo cual ha demostrado ser mucho más efectivo que gastarse el presupuesto de la campaña en anuncios de televisión más generales en prime time.

No es nada que no hiciera el partido demócrata con la candidatura de Hillary Clinton, que también utilizó Big Data durante la campaña, aunque con la salvedad de que no compraron datos de usuarios de facebook sin su consentimiento.

Cambridge Analytica desapareció en 2018 ya que no pudo hacer frente a los costes jurídicos de su defensa y además, al verse envuelta en un escándalo de compra de datos perdió a muchos de sus clientes. Sin embargo, el uso del Big Data en la política no está regulado de una forma clara y se sigue usando.

Twitter, es una red social cuyos datos son mucho más accesibles que los de facebook, la gente tuitea su opinión abiertamente en la mayoría de los casos ya sea directamente, a través de retuits de otros mensajes o simplemente dando “me gusta” y además está también mucho más politizada.

Por lo que su potencial uso como fuente de datos para aplicar Big Data en campañas electorales está bastante claro.

Y no solo eso, sino que Elon Musk ya ha declarado que quiere que sea la plataforma de publicidad más respetada del mundo.

Espero que os guste el episodio

Si es así, no olvidéis dejar un «Me gusta» y algún comentario al episodio en Ivoox o una valoración de 5 estrellas del podcast en Apple podcasts, en Spotify, en Google podcasts o donde quiera que escuchéis el podcast.

Recordad que si tenéis cualquier duda o pregunta podéis contactar conmigo a través del formulario de contacto o podemos seguir la conversación en Twitter.

Muchas gracias por estar ahí y os espero en el próximo episodio de Un Podcast Ninja sobre Big Data.

🎙 Episodio 21. Big Data y política

La campaña de Obama. El comienzo de la política data-centric

Cambridge Analytica y la campaña de Trump

Accede a todo el contenido premium