Hay muchos recursos sobre dbt, pero la mayoría se quedan en lo conceptual o saltan directamente a funcionalidades avanzadas.
En este capítulo del libro Data Engineering with dbt se explica desde la configuración inicial hasta tener un proyecto funcionando con sources, modelos, tests y documentación automática.
No es teoría. Es el proceso real que seguirías en un proyecto.
Antes de tocar dbt, el capítulo explica la arquitectura de referencia que vas a implementar:
Entender esta estructura antes de empezar te ahorra tener que reorganizar todo cuando el proyecto crece.
También te permite aprovechar una de las mayores ventajas de este enfoque:
poder reprocesar todo desde los datos originales cuando cambian las reglas de negocio.
Una vez comprendida la arquitectura, veremos cómo montar el proyecto desde cero:
También veremos las tres formas de traer datos externos a dbt (sources, seeds y datos generados), cuándo usar cada una, y cómo configurarlas correctamente.
Una vez tienes datos, toca transformarlos. Analizaremos cómo crear modelos, cómo funciona el fichero dbt_project.yml, y cómo la estructura de carpetas define la arquitectura de tu proyecto.
Este capítulo también cubre cuándo materializar como vista o como tabla, una decisión que parece menor pero afecta directamente al rendimiento y los costes.
¡A por ello! 🚀