En el episodio de hoy de Un podcast ninja sobre Big Data vamos a hablar de SEO. De cómo utiliza Google la Inteligencia Artificial para decidir los resultados que nos muestra cuando buscamos algo y de cómo pueden usar los especialistas en SEO el Machine Learning para hacer su trabajo.
SEO viene de Search Engine Optimization, que significa Optimización para motores de búsqueda.
Es decir, cómo conseguir que una página web aparezca en la primera página de los resultados de búsqueda cuando alguien busca algo.
Que te encuentren en Google, vaya.
Y ahora igual, que te encuentren también en Bing.
Si crees que lo de aparecer en la primera página de resultados de Google era algo que sucede sin más, en plan tú escribes un artículo y ya estaría, pues no… es posible que acabes en las profundidades más inhóspitas de internet y nadie te encuentre jamás.
Todo tiene su aquel.
Incluso hay una profesión para ello.
Los especialistas en SEO (o simplemente SEOs) se encargan de aplicar estrategias y técnicas para optimizar las páginas web y que aparezcan orgánicamente, o sea sin pagar nada, en buscadores como Google, Bing o Youtube.
En los orígenes de internet, Google tenía suficiente con indexar las paginas de internet y para poder posicionar una página web casi que bastaba con que la palabra clave estuviera metida con calzador en todas partes.
Entonces si buscábamos “peluquería barata en Barcelona” teníamos webs posicionadas con resultados del tipo:
¿estás buscando una peluquería barata en Barcelona? Nuestra peluquería barata en Barcelona es la más barata de toda la ciudad de Barcelona.
También había mucho contenido duplicado de webs que copiaban a otras webs ya posicionadas.
Así que cuando Google se hartó de que se le llenaran las páginas de resultados de SPAM y webs cuestionables y después de lanzar algunas modificaciones en su algoritmo de búsqueda entró a la carga con la Inteligencia Artificial.
En 2015 desplegó Google RankBrain para conseguir que los resultados que nos devuelve cuando buscamos algo realmente satisfagan nuestra intención de búsqueda humana.
Porque sí, todo este rollo sobre SEO es para contarte que Google utiliza modelos de Machine Learning para decidir qué resultados de las miles de millones de webs que hay en internet nos muestra cuando buscamos algo.
Antes:
Google intentaba hacer coincidir las palabras de nuestras consultas de búsqueda con las palabras de una página web. Por eso, repetir artificialmente las palabras qué queríamos posicionar como en el caso de la peluquería barata en Barcelona funcionaban.
Ahora:
Google RankBrain, que así se llama el modelo de Inteligencia Artificial, intenta descifrar realmente lo que queremos decir.
Todo ello gracias a modelos de lenguaje natural que sirven para obtener entidades semánticas.
Los humanos tenemos muchas maneras de expresar la misma idea gracias a los modelos de lenguaje natural Google RankBrain puede descifrar que cuando buscamos:
Estamos básicamente buscando la misma cosa.
Total, que una vez que Google RankBrain obtiene mediante modelos del lenguaje natural la intención de búsqueda de un usuario muestra un conjunto de resultados de búsqueda que creen que le gustarán.
Si a muchas personas les gusta una página en particular en los resultados, el modelo aprende que tiene que mostrar esa web más veces ante búsquedas similares
Y si no, pues la próxima vez que alguien busque algo similar pues no la mostrará.
Para saber si a un usuario le parece bien o no el resultado que le ha ofrecido el algoritmo de Google se fija en cómo interactúa con los resultados de búsqueda.
Si hace click en el resultado, cuánto tiempo está en esa web, si sale inmediatamente de la web o si se queda leyendo otros artículos dentro de esa misma web, etc...
Como véis la Inteligencia Artificial lleva decidiendo las webs que vemos desde 2015.
Con Google RankBrain el trabajo de los SEOs es más complejo. Posicionar una web ya no consiste en repetir muchas veces la palabra clave que queremos posicionar.
Peeero los SEOs supieron adaptarse ante la aparición de Google RankBrain y algunos de ellos incluso fueron capaces de ver cómo incorporar también Machine Learning para mejorar su propio rendimiento.
Una forma en la que el aprendizaje automático se puede utilizar en SEO es a través del análisis de palabras clave.
El análisis de palabras clave es el proceso de identificar y seleccionar las palabras clave más relevantes y efectivas para un sitio web.
Por ejemplo, podríamos entrenar un modelo sobre un montón de datos de páginas web de las que ya hubiésemos extraído las palabras clave asociadas.
Ese sería nuestro dataset de entrenamiento.
Con el modelo ya entrenado, lo podríamos usar para predecir las palabras clave más efectivas para un contenido determinado.
Esto nos ayudaría a identificar nuevas palabras clave que igual hemos pasado por alto.
Incluso podríamos llegar a obtener la importancia relativa de diferentes palabras clave y cómo se pueden combinar para lograr el máximo impacto.
Otra forma en que podemos utilizar Machine Learning en el análisis de palabras clave es a través de técnicas de procesamiento de lenguaje natural.
Si Google lo utiliza, un SEO ninja de la Inteligencia Artificial también puede.
Mediante el uso de técnicas de procesamiento del lenguaje natural, es posible extraer automáticamente las palabras clave más importantes de un contenido y utilizarlas para optimizar la página.
Además de identificar las palabras clave más relevantes, el aprendizaje automático también se puede utilizar para analizar la competencia de una palabra clave determinada.
Es decir, que podemos analizar las páginas que tienen una clasificación alta para una palabra clave en concreto e identificar otros factores importantes que hacen que esa web esté tan arriba en el ranking de resultados del buscador.
En definitiva, se pueden optimizar títulos y meta descripciones, y garantizar que el contenido sea relevante y de alta calidad.
Qué es lo que Google y los demás buscadores quieren.
En general, la optimización de contenido para SEO consiste en tomar decisiones estratégicas sobre el contenido de su sitio web para mejorar su clasificación en los resultados de los motores de búsqueda.
Al realizar una investigación de palabras clave, optimizar títulos y meta descripciones, garantizar que el contenido sea relevante y de alta calidad, y optimizar imágenes y videos, un especialista en SEO puede mejorar las posibilidades de que un sitio web aparezca en los resultados de búsqueda y atraiga más tráfico y, por tanto, más clientes.
Y muchas de estas acciones que hacen los especialistas en SEO, frecuentemente de manera manual, pueden ser vitaminadas mediante Machine Learning.
Pero hay más todavía…
Para llevar a cabo de manera exitosa un proyecto que implemente Machine Learning necesitamos construir un dataset de entrenamiento, utilizarlo para entrenar un modelo de Machine Learning, evaluar los resultados del modelo y desplegarlo en producción.
No es algo sencillo.
En el caso de SEO necesitaríamos un SEO mega ninja de la Inteligencia Artificial o a un equipo completo para desarrollar un proyectazo.
Peeero en el episodio de la semana pasada ya veíamos que ahora, gracias a los modelos del lenguaje simplemente podemos diseñar un prompt y evaluar si los resultados nos sirven.
Obviamente esta aproximación no sirve para todos los problemas que utilizan Machine Learning del mundo pero sí que podría abrir el mundo de la Inteligencia Artificial a muchos especialistas en SEO sin conocimientos ninja previos de Machine Learning.
Por ejemplo, se podría utilizar GPT4 para analizar el contenido de las webs que mejor posicionan para una determinada consulta en la que estamos interesados y extraer las principales conclusiones del texto, las entidades que aparecen en la página y las keywords más relevantes del texto con el número de veces que aparecen.
También se podría usar GPT4 para hacer investigación de palabras clave, buscando ideas de palabras clave semilla que luego pudiéramos buscar en un planificador de palabras clave o en alguna otra herramienta.
Otro posible caso de uso de GPT4 para SEO podría ser extraer la intención de búsqueda de un texto determinado.
Además, cómo decía antes, la gente busca lo mismo de formas diferentes.
Una labor importante de un buen SEO es ser capaz de agrupar palabras clave que responden a la misma intención de búsqueda en la misma página web. Haciendo esto evitamos perder poder de captación y utilizar palabras claves que responden la misma intención de búsqueda en páginas diferentes y que provocan canibalización.
Pues estas agrupaciones de palabras clave las podría hacer un modelo como GPT-4.
Y también, obviamente, la parte de generar contenido breve como descripciones de producto y metadescripciones, o texto de RRSS como IG.
Ya comentábamos la semana pasada el entusiasmo de los creadores de contenido por usar ChatGPT para escribir artículos completos pero de nuevo:
“Todo el mundo quiere crear contenido con IA pero nadie quiere consumir ese contenido”
Y eso no quiere decir que el contenido generado por Inteligencia Artificial no vaya a posicionarse en Google.
Por supuesto que lo hace, siempre y cuando sea útil para el usuario puesto que ya hemos visto que Google se fija en las interacciones del usuario con los resultados para decidir si mejora su posición en el ranking o se va pabajo.
Ahora bien, tanto Google como Bing quieren incorporar y están incorporando modelos del lenguaje a los resultados de búsqueda para enriquecer la experiencia de los usuarios y esto seguramente vaya influyendo poco a poco en el trabajo de los especialistas en SEO.
Tendrán que volver a adaptarse como cuando apareció Google RankBrain.
Espero que os guste el episodio.
Si es así, no olvidéis dejar un «Me gusta» y algún comentario al episodio en Ivoox o una valoración de 5 estrellas del podcast en Apple podcasts, en Spotify, en Google podcasts o donde quiera que escuchéis el podcast.
Recordad que si tenéis cualquier duda o pregunta podéis contactar conmigo a través del formulario de contacto o podemos seguir la conversación en Twitter.
Muchas gracias por estar ahí y os espero en el próximo episodio de Un Podcast Ninja sobre Big Data.