馃帣 Episodio 18. Tinder y c贸mo encontrar pareja con Machine Learning

En el episodio de hoy de Un Podcast Ninja sobre Big Data vamos a hablar de Tinder y c贸mo utilizan Machine Learning para encontrarnos pareja.

Tinder, por si hay alguien que no lo sepa todav铆a, es una aplicaci贸n para conocer gente.

B谩sicamente te das de alta con una informaci贸n muy b谩sica, subes unas cuantas fotos, en las que salgas guapo o guapa y ya est谩鈥 La app se encarga de buscarte gente, que en principio est茅 cerca de tu ubicaci贸n, y te va mostrando fotos. S贸lo tienes que deslizar a la derecha si te gusta y a la izquierda si no te gusta la persona que te ense帽a.

F谩cil. Nada de rellenar cuestionarios de personalidad.

De hecho este principio tan sencillo es una de las claves del 茅xito de Tinder. 

El otro es que evita la sensaci贸n de rechazo que hab铆a en otras aplicaciones de buscar pareja m谩s basadas en rellenar perfiles muy completos y en contactar directamente a trav茅s de mensajes.

En Tinder no se puede escribir directamente a nadie hasta que los dos han mostrado inter茅s, el uno por el otro.

驴C贸mo?

Pues deslizando la foto hacia la derecha. En ese momento hay un match y ya cualquiera de los dos puede escribir al otro y quedar o lo que surja.

Tinder naci贸 en el a帽o 2012 en una incubadora de Startups en Nueva York. Ese mismo a帽o comenz贸 a utilizarse en campuses universitarios.

Para el lanzamiento los fundadores de Tinder organizaron fiestas en colleges espec铆ficos y la gente solo pod铆a entrar si se descargaba la app. En febrero de 2013 alcanzaron 100000 usuarios.

Esas cifras son minucias comparadas con los 75 millones de usuarios activos que tuvieron en 2021.

Desde 2012 la aplicaci贸n de Tinder ha tenido m谩s de 400 millones de descargas y est谩 disponible en m谩s de 190 pa铆ses.

En 2021, Tinder factur贸 1600 millones de d贸lares. Su modelo de negocio se basa en suscripci贸n y publicidad, aunque principalmente es suscripci贸n. Tinder dice que s贸lo el 3% de sus ingresos son debidos a publi.

Pues bien, los distintos niveles de suscripci贸n de Tinder permiten el acceso a caracter铆sticas premium:

  • Te puedan gustar perfiles ilimitados
  • Puedes tener acceso a ver una selecci贸n especial de perfiles en los que puedes estar especialmente interesad
  • Enviar mensajes sin necesidad de que se produzca antes un match. 

Bueno, esas son solo algunas de las caracter铆sticas premium. Hay m谩s. 

Pues a d铆a de hoy Tinder tiene m谩s de 10 millones de usuarios pagando una suscripci贸n mensual.

Para que eso siga siendo as铆, el problema principal a resolver por la gente de Tinder es elegir qu茅 perfiles te ense帽a cuando abres la aplicaci贸n.

驴A qui茅n te gustar铆a ver? 驴A qui茅n le gustar铆a verte a ti? 驴Con qui茅n tienes probabilidades de hacer un match? 

No cogen aleatoriamente a gente cerca tu ubicaci贸n y te la muestran sin m谩s. No.

En 2016 sali贸 a la luz que Tinder almacenaba una puntuaci贸n interna de 鈥渄eseabilidad鈥 que calculaban de la misma manera en la que se calcula la habilidad relativa de los ajedrecistas.

El sistema de puntuaci贸n Elo, que as铆 se llama el m茅todo matem谩tico en el que se basaban, funcionaba de la siguiente manera:

Cada vez que le interesabas a alguien te daban puntos de deseabilidad. Y si le gustaba tu perfil a alguien de puntuaci贸n alta, eso sube tu posici贸n en el ranking m谩s que si le interesabas a alguien de puntuaci贸n m谩s baja. Despu茅s, Tinder te mostraba perfiles que se encontraban en tu mismo rango dentro del ranking. Lo que se supon铆a que aumentaba las posibilidades de hacer un match.

Esta idea de ordenar a sus usuarios seg煤n una puntuaci贸n de 鈥渄eseabilidad鈥 y mostrarle a la gente principalmente otros perfiles que Tinder consideraba que estaban en su nivel, pues no tuvo muy buena acogida al hacerse p煤blica. Esto era 2016.

Desde entonces Tinder no ha vuelto a revelar de manera exacta en la que funciona su algoritmo pero afirma que ya no usan la puntuaci贸n Elo.

Entonces, seg煤n el propio Tinder, lo que es realmente importante a la hora de ordenar los perfiles que recomiendan cuando alguien abre la app es - oh sorpresa - que sean perfiles que est茅n muy activos en la aplicaci贸n. Otra cosa que tambi茅n priorizan es que en cuanto ocurre el match se inicie la conversaci贸n. 

El objetivo de Tinder es que se use Tinder.

Pero el problema a resolver por Tinder siguen siendo el mismo, con puntuaci贸n Elo o sin ella,

驴A qui茅n te gustar铆a ver al abrir la aplicaci贸n? 驴A qui茅n le gustar铆a verte a ti? 驴Con qui茅n tienes probabilidades de hacer un match? 

Tinder y Machine Learning

Y ahora viene lo interesante para nosotros, ninjas del Big Data.

Cada d铆a se deslizan perfiles a izquierda o derecha m谩s de 2000 millones de veces, se producen m谩s de 26 millones de matches - al d铆a - y se descargan m谩s de 10 mil millones de fotos. 

驴Y esto qu茅 significa?

Que la aplicaci贸n ingesta m谩s de 40 TB de datos. Diariamente. 

Big Data del bueno.

Despu茅s del Elo-gate, Tinder se ha esforzado un poco en intentar desligarse de la idea de puntuaci贸n de 鈥渄eseabilidad鈥.

Lo que est谩 claro es que sigue teniendo que decidir qu茅 perfiles muestra y en qu茅 orden y a quien se los muestra. Y s铆, utiliza Machine Learning para la recomendaci贸n de perfiles. 

T茅cnicas como el filtrado colaborativo, un cl谩sico de los sistemas de recomendaci贸n y al que le dedicaremos un episodio completo m谩s adelante.

La idea b谩sica del filtrado colaborativo (muy resumida) es que si una persona A, Mar铆a, por ejemplo,  tiene la misma opini贸n sobre un tema que otra persona B, Ana. Es m谩s probable que Mar铆a y Ana tengan la misma opini贸n sobre otro tema diferente que una tercera persona, elegida al azar.

Es decir, y aplicado a Tinder鈥 Si a Mar铆a le gusta Juan y a Ana tambi茅n le gusta Juan, pues si a Mar铆a le gusta Paco, es posible que a Ana le guste Paco.

Esta es la idea de filtrado colaborativo muy - MUY -  simplificada. 

Adem谩s del filtrado colaborativo, utiliza procesado de lenguaje natural para intentar entender de manera autom谩tica las biograf铆as de los usuarios y poder sacar informaci贸n relevante sobre ellos. Por ejemplo, si dos usuarios mencionan en su biograf铆a que les gustan los animales pues hay m谩s posibilidades de que Tinder les presente.

A parte de estas dos t茅cnicas, Tinder ha desarrollado su propio modelo basado en redes neuronales al que ha llamado TinVec.

Para ello, utiliza 煤nicamente la informaci贸n sobre los deslizamientos a derecha e izquierda que hace y recibe cada usuario.

De cara al modelo TinVec todos los usuarios est谩n divididos en dos categor铆as: los que eligen y los que son elegidos. Obviamente todos los usuarios forman parte de las dos categor铆as.

Entonces, imaginaros que podemos meter a todos los usuarios que potencialmente pueden ser mostrados a alguien en una habitaci贸n. El modelo lo que har铆a es poner cerca a usuarios que son similares y lejos a los que son muy diferentes entre s铆.

No de una manera expl铆cita, en plan rubios por un lado y morenos por otro sino aprendiendo a partir de los me gusta esta persona o no me gusta esta otra que les da qui茅n est谩 eligiendo. Es decir, el modelo aprende impl铆citamente las caracter铆sticas de las personas sin necesidad de que sea algo explicable como que es rubio o es moreno. Un ejemplo podr铆a ser que al usuario le gustara gente que se hace las fotos en exteriores, entonces esa ser铆a una de los cientos de caracter铆sticas que tienen esos perfiles. Pero repito que en estos modelos no todas las caracter铆sticas que definen a un usuario pueden ser f谩cilmente explicadas.

De hecho, TinVec se basa en un modelo de procesado de lenguaje natural que se llama word2vec y que hace b谩sicamente lo mismo pero con palabras. Representa las palabras como vectores de manera que las palabras que significan cosas parecidas est谩n cerca y las que significan cosas muy distintas est谩n lejos.

Aunque igual con palabras, el concepto de distancia seg煤n se parezcan o no, es m谩s dif铆cil de visualizar que con usuarios de Tinder.

Entonces si Tinder le quiere recomendar un usuario a Ana que ya ha deslizado hacia la derecha sobre Matias, Pepe y Luis pues hay varias maneras鈥 una de ellas es:

  1. Coger el vector de caracter铆sticas de todos estos: Matias, Pepe y Luis
  2. Promediarlas 
  3. Ir a la habitaci贸n donde hemos guardado a todos los usuarios de Tinder y sacar al que est茅 m谩s pr贸ximo de las caracter铆sticas que calculadas. 

Todo este proceso de deslizar a izquierda a derecha al final esta ayudando a mejorar el propio entrenamiento del modelo y dar mejores resultados y es por ello que la primera cosa que premia Tinder es el propio uso de la aplicaci贸n.

A parte de los modelos que seleccionan qu茅 perfiles recomendar. Tinder tiene m谩s modelos de Machine Learning implementados bajo la manga.

Una de sus caracter铆sticas es decidir qu茅 foto muestra de todas las que sube el usuario. Para ello va mostrando las diferentes alternativas y cuando tiene suficientes datos sobre los 鈥渕e gusta鈥 que recibe cada foto decide cu谩l es la que se deber铆a mostrar para obtener mejores resultados.

Adem谩s utiliza Rekognition, una herramienta de Amazon Web Services, para el an谩lisis de im谩genes mediante Machine Learning.

  • Utilizan Rekognition para analizar las im谩genes y sacar toda la informaci贸n posible sobre el usuario. Si el usuario est谩 haciendo alpinismo  Rekognition detecta la nieve y la monta帽a y lo etiqueta como aventurero, de manera que al final es una manera m谩s de conseguir informaci贸n sobre los usuarios que hace que Tinder pueda personalizar a煤n m谩s la selecci贸n de candidatos de alguien que est谩 pagando esta caracter铆stica premium.
  • Tambi茅n se utiliza Rekognition para la detecci贸n de contenido inapropiado. De esta manera, Tinder puede decidir moderar el contenido si detecta a un usuario que no est谩 respetando las pol铆ticas de uso de Tinder.

Rekognition no solo es capaz de detectar si las fotos enviadas en los chats son expl铆citas o no lo son si no que adem谩s es capaz de clasificar lo que aparece en la fotograf铆a.

De nuevo, este uso de la tecnolog铆a de detecci贸n y clasificaci贸n de im谩genes de Amazon se compagina con t茅cnicas de procesado de lenguaje natural que analizan los chats para detectar personas que podr铆an ser peligrosas o que pueden tener comportamientos abusivos.

Como veis, Tinder es una empresa que utiliza los datos que obtiene de una manera muy intensiva y que tiene un impacto directo y cada vez mayor en la sociedad. Recordad que son m谩s 75 millones de personas las que usan Tinder activamente a d铆a de hoy.

El mismo Jonathan Badeen, co-fundador de Tinder, hizo unas declaraciones en las que dec铆a que le daba miedo pensar en todo lo que afecta Tinder a la vida de las personas y que hab铆an llegado a un punto en el que ten铆an una gran responsabilidad por la manera en la que Tinder influye en la sociedad.

En cierto modo es como si hubi茅ramos relegado parte de nuestras decisiones sentimentales a un conjunto de modelos de Machine Learning.

Y aunque el sistema de puntuaci贸n Elo que fue tan criticado cuando se public贸 ya no se utiliza, los modelos de Machine Learning basados en embeddings, como es TinVec, al final est谩n utilizando unas caracter铆sticas impl铆citas.

Usar estas caracter铆sticas, que no son f谩ciles de descifrar por una persona, no quiere decir que los modelos no est茅n trasladando los sesgos y estereotipos de la sociedad a sus decisiones. Porque lo hacen. 

De hecho, su principal manera de aprender c贸mo recomendar es a partir de los patrones de deslizamiento a izquierda y derecha de los propios usuarios. M谩s de 2000 millones de swipes.

En 2014 apareci贸 una noticia de OkCupid acerca de un an谩lisis de datos sobre los comportamientos de sus usuarios y las conclusiones eran, como poco, inc贸modas.

Las conclusiones del an谩lisis de OkCupid mostraban un sesgo negativo de las mujeres hacia los hombres asi谩ticos y de los hombres hacia las mujeres negras. Y como os he contado antes, las interacciones con la app determinan el orden de las recomendaciones de los usuarios.

Por tanto, si las mujeres tienden a deslizar a la izquierda a los hombres asi谩ticos, el modelo podr铆a llegar a aprender que tiene que mostrar menos a este grupo de usuarios. No directamente usando la caracter铆stica de la raza o procedencia, que Tinder afirma que no utiliza de manera directa informaci贸nsobre raza o religi贸n,  sino a partir de lo que el modelo aprende de manera impl铆cita.

Francamente me gustar铆a saber como Tinder aborda esto exactamente.

Por otro lado, tambi茅n es verdad que Tinder cumple la funci贸n que promete y es la posibilidad de conectar鈥 y tal vez algo m谩s. De conocer gente nueva, de ampliar tu red de contactos, acercarte a los lugare帽os cuando est谩s de viaje o simplemente una manera de ligardivertida y f谩cil de usar.

Un estudio de 2018 afirmaba que las aplicaciones de citas online est谩 cambiando la naturaleza de la sociedad y lo relaciona directamente con el aumento de parejas interraciales.

As铆 que tal vez, en el futuro la respuesta m谩s frecuente cuando un cr铆o le pregunte a sus padres c贸mo se conocieron sea鈥 

En Tinder.

Espero que os guste el episodio 

Si es as铆, no olvid茅is dejar un 芦Me gusta禄 y alg煤n comentario al episodio en Ivoox o una valoraci贸n de 5 estrellas del podcast en Apple podcasts, en Spotify, en Google podcasts o donde quiera que escuch茅is el podcast. 

Recordad que si ten茅is cualquier duda o pregunta pod茅is contactar conmigo a trav茅s del formulario de contacto o podemos seguir la conversaci贸n en Twitter.

Muchas gracias por estar ah铆 y os espero en el pr贸ximo episodio de Un Podcast Ninja sobre Big Data.

Bolet铆n Ninja

Suscr铆bete a la newsletter y recibe la gu铆a ninja del Big Data y la Inteligencia Artificial.

Gu铆a ninja del Big Data
Copyright 漏 2023  路 Datos 馃シ 路 Todos los derechos reservados