ūüéô Episodio 21. Big Data y pol√≠tica

En el episodio de¬†hoy de¬†Un Podcast Ninja sobre Big Data¬†vamos a hablar de¬†las aplicaciones del Big Data en pol√≠tica ¬°por fin un enfoque interesante de la pol√≠tica! ūüėČ

En abril de este mismo a√Īo, Elon Musk, el hombre m√°s rico del mundo, anuncia su intenci√≥n de comprar Twitter, la red social basada en textos de menos de 280 caracteres y su favorita personal. Elon Musk tiene 112 millones de seguidores y ha publicado m√°s de 20000 tuits desde 2009.

Pues eso, que después de que en abril anunciara que quería comprar Twitter y echarse atrás en julio, con un par de demandas cruzadas de por medio y un juicio que estaba a punto de comenzar, finalmente ha decidido comprar la red social por el precio inicial de la oferta, 44000 millones de dólares, un precio que está bastante por encima de la cotización en bolsa de Twitter.

Twitter est√° encendido ūüĒ•.¬†

La moderaci√≥n de contenido es un tema sensible en las redes sociales, que no dejan de ser empresas privadas, que tienen un impacto real en la sociedad. Y no √ļnicamente en la sociedad del pa√≠s en el que residen o del que proceden y cuyas leyes deben respetar sino de la sociedad global.

En enero del a√Īo pasado, la cuenta de Twitter de Donald Trump fue suspendida tras el asalto al congreso por incitaci√≥n a la violencia.

Suspendida indefinidamente… hasta la llegada de Musk, defensor absolutista de la libertad de expresión y que ha declarado en varias ocasiones que no cree en suspender de manera indefinida a nadie.

Pero bueno, a parte de cotilleos de Silicon Valley sobre qué hace o deja de hacer el hombre más rico del mundo con su dinero o el jardín en el que se ha metido o dejado de meter con la moderación del contenido de Twitter o incluso más allá de debates sobre la libertad de expresión…

¬ŅQu√© tiene que ver todo esto con Big Data? 

Pues que como toda red social, genera datos y Twitter en particular, con 200 millones de usuarios que envían más de 10000 tuits por segundo en todo el mundo, pues apesta a Big Data.

Cada uno de nosotros dejamos una huella digital con todas las interacciones que realizamos en Internet. 

Las b√ļsquedas, los ‚Äúme gusta‚ÄĚ y comentarios en redes sociales, a qui√©n seguimos, las pel√≠culas que vemos, las cosas que compramos por internet‚Ķ

En 2012 IBM estimó que cada uno de nosotros dejaba una huella digital de unos 50 MB al día y que si quisiéramos imprimirlo en folios a doble cara y apilarlo, la pila de papel llegaría desde aquí hasta el sol.

Por suerte, no nos ha dado todavía por hacer eso.

Toda esta informaci√≥n que generamos dice mucho sobre nosotros, no solo sobre las cosas que nos gustan y que no tenemos problemas en decir p√ļblicamente sino tambi√©n sobre cosas que no ten√≠amos intenci√≥n de revelar sobre nosotros mismos.

Probablemente si Google quisiera, reconoced que sabr√≠a cosas a trav√©s de vuestras b√ļsquedas que no le hab√©is contado a nadie m√°s.

La campa√Īa de Obama. El comienzo de la pol√≠tica data-centric

Cuando en estados unidos un candidato determinado se plantea realizar una campa√Īa pol√≠tica. Si quiere tener alguna posibilidad de llegar a alg√ļn sitio uno de sus objetivos es gastar su presupuesto de campa√Īa de manera eficiente.

Tiene que llegar al electorado. Tiene que saber dónde invertir más esfuerzo y recursos y donde ni siquiera merece la pena. El esfuerzo en tratar de convencer a un republicano convencido de votar a Obama tiene muchas posibilidades de ser un esfuerzo esteril.

Lo mismo aplicaría en cualquier país. Hay personas que tienen el partido al que votan como una traza inherente de su identidad. Hay que invertir mucho esfuerzo en convencerle de que cambie su voto y posiblemente ni siquiera se consiga.

 Mejor buscar a alguien que no lo tenga tan claro.

Para encontrar a esa gente, hist√≥ricamente los partidos hac√≠an encuestas telef√≥nicas, identificaban zonas geogr√°ficas como m√°s afines a un partido o a otro y as√≠ es como clasificaban m√°s o menos a los votantes. 

Estos datos se recolectaban manualmente por los distintos grupos que trabajaban en las campa√Īas de los partidos pol√≠ticos y se analizaban con m√°s o menos gracia.

En 2004 el partido demócrata decidió invertir recursos en una plataforma para tener los datos sobre los votantes unificados y estandarizados.

Durante la campa√Īa de re-elecci√≥n de Obama se a√Īadieron a esta plataforma, datos adicionales sobre los votantes como datos de consumo, opiniones y preferencias que se recog√≠an directamente en encuestas puerta a puerta para poder crear un modelo que pudiera predecir su comportamiento.

Una vez identificados los votantes afines a Obama y los que tenían dudas sobre su voto, el objetivo era hacer todo lo posible para asegurarse de que los pertenecientes al primer grupo se presentaba en las urnas a votar y tomar medidas para convencer al segundo grupo de que Obama era el candidato correcto.

¬ŅC√≥mo? Pues optimizando el presupuesto en publicidad de su campa√Īa.

Sabiendo lo que veía en la tele el primer grupo podían optimizar el anuncio y el momento en el que emitirlo de manera mucho más eficiente.

Por ejemplo, decidieron anunciarse en las pausas publicitarias de Walking Dead ya que detectaron que los votantes a los que tenían que convencer veían esa serie.

Dicen que Obama fue el primer candidato a las presidenciales de EEUU en utilizar Big Data

Por aquel entonces a√ļn se pod√≠a ver en facebook a qu√© le hab√≠a dado ‚Äúme gusta‚ÄĚ una persona de manera p√ļblica y entonces sali√≥ un art√≠culo de investigaci√≥n de la Universidad de Cambridge que demostraba que era posible identificar las opiniones pol√≠ticas y la orientaci√≥n sexual de una persona a partir de las cosas que hab√≠a marcado con un ‚ÄúMe gusta‚ÄĚ en facebook con bastante precisi√≥n.

Facebook tom√≥ nota y pocas semanas m√°s tarde ocult√≥ esa informaci√≥n para que no fuera accesible de forma p√ļblica.

No fue √ļnicamente facebook qui√©n se di√≥ cuenta del potencial de estos datos‚Ķ

Cambridge Analytica y la campa√Īa de Trump

Durante las elecciones presidenciales en estados unidos de 2016, el equipo de Donald Trump decidi√≥ aplicar Big Data durante su campa√Īa y contrataron a Cambridge Analytica. 

Esta empresa, utilizaba datos de facebook de perfiles de ciudadanos estadounidenses para inferir los rasgos psicol√≥gicos de cada uno de ellos, clasificarlos en distintos grupos a los que despu√©s dirigir√≠a publicidad especialmente dise√Īada.

Por ejemplo, si obtenía un grupo especialmente preocupado por la inmigración les dirigían anuncios sobre la idea de Trump de construir un muro con México. Si resulta que era un grupo más preocupado por la corrupción, pues esta gente veía en su muro anuncios sobre lo corrupta que era Hillary Clinton, y así…

La conclusi√≥n es que Donald Trump no solo hizo un uso intensivo de su perfil de Twitter para movilizar a sus votantes sino que tambi√©n, a trav√©s de Cambridge Analytica, utiliz√≥ la informaci√≥n de 30 millones de perfiles de facebook sin que los due√Īos de estos perfiles lo supieran o dieran su consentimiento al respecto.

Al parecer, Cambridge Analytica tuvo acceso a estos 30 millones de perfiles de facebook a trav√©s de un profesor de la universidad de Cambridge que cre√≥ una app de estas, muy populares en aquella √©poca, que te hac√≠a unas preguntas y te dec√≠a cu√°l era tu personalidad. Para usarla hab√≠a que entrar con la opci√≥n de loguearse con facebook, que tambi√©n por aquel entonces daba al desarrollador de la app acceso sobre bastantes datos del perfil como las cosas a las que el usuario hab√≠a dado ‚ÄúMe gusta‚ÄĚ, la ciudad en la que viv√≠a, qui√©nes eran sus amigos y no solo eso sino tambi√©n algunos datos de tus amigos.

 As√≠ que 270000 personas respondieron a este test de personalidad lo que di√≥ acceso al profesor de Cambridge, que en principio ten√≠a fines √ļnicamente de investigaci√≥n a los datos de estas 270000 personas y de sus amigos, lo que hizo un total de 50 millones de perfiles.

Hasta aqu√≠ todo bien. 

La cosa se tuerce cuando el profesor de la Universidad de Cambridge recibe financiación de unos 800000 dólares de Cambridge Analytica a cambio de una copia de esos datos, lo cual, iba en contra de las condiciones de facebook de aquel entonces.

Ojo, coger los datos sí… dárselos a otros no.

Tambi√©n se relacion√≥ a Cambridge Analytica con la campa√Īa del Brexit por realizar acciones similares a favor de la salida del Reino Unido de la Uni√≥n Europea.

Es decir, a partir de la informaci√≥n de los perfiles de facebook de los usuarios se les segmenta seg√ļn intereses y ciertas caracter√≠sticas de su personalidad que se pueden inferir a partir de los datos que s√≠ est√°n disponibles en sus perfiles para dirigir anuncios lo m√°s personalizados posibles.

De nuevo, si era una persona preocupada por su trabajo se le pod√≠a dirigir un anuncio  sobre   c√≥mo que el Reino Unido formase parte de la Uni√≥n Europea, hac√≠a que no se pudiese controlar de manera directa la inmigraci√≥n y lo presentaba como un peligro, un ‚Äúpeligro‚ÄĚ que atacaba precisamente a sus preocupaciones personales y que hac√≠a a este grupo de usuarios m√°s influenciables en su decisi√≥n de voto.

Anuncio de facebook de la campa√Īa a favor del Brexit

O por ejemplo, para ciudadanos británicos con un uso más intensivo de servicios como Uber les mostraba publicidad sugiriendo que la regulación de la Unión Europea al respecto podría cambiar el servicio tal y como lo conocen y que por eso, mejor el Brexit y que el propio gobierno británico se encargue de la regulación.

Tanto en la campa√Īa del Brexit como en la de Donald Trump, Cambridge Analytica hizo uso del Big Data para dirigir mensajes pol√≠ticos personalizados, atacando directamente a los miedos y anhelos del votante el mensaje se vuelve m√°s relevante y, por tanto, m√°s interesante para el votante lo cual ha demostrado ser mucho m√°s efectivo que gastarse el presupuesto de la campa√Īa en anuncios de televisi√≥n m√°s generales en prime time.

No es nada que no hiciera el partido dem√≥crata con la candidatura de Hillary Clinton, que tambi√©n utiliz√≥ Big Data durante la campa√Īa, aunque con la salvedad de que no compraron datos de usuarios de facebook sin su consentimiento.

Cambridge Analytica desapareció en 2018 ya que no pudo hacer frente a los costes jurídicos de su defensa y además, al verse envuelta en un escándalo de compra de datos perdió a muchos de sus clientes. Sin embargo, el uso del Big Data en la política no está regulado de una forma clara y se sigue usando.

Twitter, es una red social cuyos datos son mucho m√°s accesibles que los de facebook, la gente tuitea su opini√≥n abiertamente en la mayor√≠a de los casos ya sea directamente, a trav√©s de retuits de otros mensajes o simplemente dando ‚Äúme gusta‚ÄĚ y adem√°s est√° tambi√©n mucho m√°s politizada.

Por lo que su potencial uso como fuente de datos para aplicar Big Data en campa√Īas  electorales est√° bastante claro.

Y no solo eso, sino que Elon Musk ya ha declarado que quiere que sea la plataforma de publicidad m√°s respetada del mundo.

Espero que os guste el episodio 

Si es as√≠, no olvid√©is dejar un ¬ęMe gusta¬Ľ y alg√ļn comentario al episodio en Ivoox o una valoraci√≥n de 5 estrellas del podcast en Apple podcasts, en Spotify, en Google podcasts o donde quiera que escuch√©is el podcast. 

Recordad que si ten√©is cualquier duda o pregunta pod√©is contactar conmigo a trav√©s del formulario de contacto o podemos seguir la conversaci√≥n en Twitter.

Muchas gracias por estar ah√≠ y os espero en el pr√≥ximo episodio de Un Podcast Ninja sobre Big Data.

Boletín Ninja

Suscríbete a la newsletter y recibe la guía ninja del Big Data y la Inteligencia Artificial.

Guía ninja del Big Data
Copyright ¬© 2023  ¬∑ Datos ūü•∑ ¬∑ Todos los derechos reservados