Los LLM o Large Language Models (grandes modelos del lenguaje) son la tecnología que está detrás de herramientas como ChatGPT, Claude o Gemini.
Se habla de ellos en todas partes, pero ¿sabes realmente qué son y cómo funcionan?
En este nuevo episodio del podcast premium, arrancamos una saga dedicada a entender a fondo los LLM: desde sus fundamentos hasta cómo se entrenan y por qué han revolucionado la inteligencia artificial.
Un LLM es un tipo de red neuronal profunda entrenada con enormes cantidades de texto para aprender a generar y entender lenguaje humano.
Su tarea principal parece simple: predecir la siguiente palabra en una secuencia.
Pero, al escalar esta idea con miles de millones de parámetros y terabytes de datos, surgen capacidades sorprendentes: desde resumir hasta traducir o incluso razonar.
En el episodio explico las dos razones que hacen “grandes” a estos modelos:
Gracias a esta escala, los LLM capturan matices del lenguaje que antes staban al alcance de los humanos.
En este episodio te cuento con ejemplos claros (incluida una metáfora de tartas 🍰) los bloques esenciales que permiten a un LLM procesar texto:
Así, el modelo transforma palabras en números para poder calcular relaciones semánticas entre ellas.
Otra de las claves es el entrenamiento de los grandes modelos del lenguaje, que sigue dos fases principales:
Si alguna vez te has preguntado cómo una máquina puede entender o generar texto, este episodio es tu mapa general para no perderte en los tecnicismos.
Además, es un complemento perfecto al club de lectura del libro de Sebastian Raschka (Build a Large Language Model from Scratch), donde aprendemos a construir un LLM desde cero.
🎧 Escucha el episodio premium y descubre qué es un LLM, cómo funcionan y por qué son la base de la IA generativa.