Si trabajas con datos, probablemente hayas oído hablar del modern data stack (y si no te dejo este episodio del podcast).
Pero entre tanto ruido de herramientas, es fácil perderse. ¿Cómo fluyen realmente los datos desde su origen hasta un dashboard? ¿Qué pasa en cada paso? ¿Y qué prácticas hacen que todo funcione sin convertirse en un caos?
Este capítulo del libro Data Engineering with dbt conecta dos cosas que rara vez se explican juntas: el flujo de datos de principio a fin, y las prácticas de DataOps que hacen que los equipos reales entreguen valor de forma sostenible.
Empezamos por el principio: cómo nacen los datos en sistemas operacionales, IoT o plataformas web, y cómo llegan hasta tu plataforma de datos.
Vamos a ver los distintos métodos de extracción (eventos, CDC, APIs, snapshots) con sus ventajas y riesgos reales. No todos son iguales: algunos garantizan no perder cambios intermedios, otros pueden dejarte con inconsistencias si no tienes cuidado.
También explicamos por qué el enfoque moderno apuesta por ELT en lugar de ETL: cargar primero y transformar después.
No es solo técnico, cambia cómo se organizan los equipos y quién es responsable de qué.
Aquí aparece una figura clave: el analytics engineer, ese híbrido entre ingeniero y analista que estructura las transformaciones y hace que los datos sean consumibles por el negocio.
El capítulo explica qué hace este rol, cómo encaja con el resto del equipo, y por qué herramientas como dbt han cambiado las reglas del juego.
La segunda parte entra en territorio que muchos equipos ignoran hasta que es tarde: versionado con Git, pull requests, CI/CD, modularidad, principios de diseño aplicados a modelos de datos...
Todo lo que hace que un proyecto se pueda mantener en lugar de convertirse en un monstruo de consultas copiadas.
¡A por ello! 🥷